语料标注一般用于说明语料作者
发布时间:2023-07-31 09:40:56
作者:唐能翻译
分享至:
科技英语翻译介绍语料标注一般用于说明语料作者和语料来源等相关信息,以及语料词性和句法特征等语言特征的信息。Cristina Monti等学者(2005)分析了欧洲议会口译语料库(EPIC)的标注。他们认为EPIC的标注分为三大类:①语言层次标注(linguistic annotation)。音频和视频材料没有标点符号,但EPIC根据说话者的音调和句法信息将音频和视频材料切分成意义单位(unit of meaning),并以“∥”作为意义单位切分的标记。②副语言层次标注(paralinguistic annotation)。口译语料存在大量副语言特征,如停顿、沉默、填充词和拼写错误等。EPIC对这些特征均作标注处理。③超语言层次标注(extralinguistic annotation)。该类标注用于说明文件信息(如日期和语言等)以及说话者的姓名、性别和国籍等信息。
法语翻译公司介绍语料之间的平行对齐是平行语料库建设的核心所在,平行对齐质量的高低直接影响语料库质量的好坏。Dorothy Kenny(2001:120)介绍了不同语言语料之间平行对齐的具体方法。在她看来,平行语料库可以实现不同语言语料的句级对齐。基本的对齐方法是在源语文本和译文的一句、第二句之间建立一种等值或对应关系。其他语句以此类推。对齐关系的建立涉及给源语和目的语文本的每个句子标号,每个源语语句和译文语句形成一种对应互见关系。医学英文翻译公司介绍M.Izquiedo、K.Hofland和O.Reigem(2006)则强调源语文本和目的语文本之间的平行对齐处理应注意以下个参数:①锚点词汇表(anchor word list),即重要的常用词汇的双语词表;②专用词汇和数字可作为对齐成分的标记。
在线下单
电话
+86 400-693-1088
+86 21-62793688
邮箱
talkingchina@talkingchina.com
Copyright 2006-2012 Talking China - All rights reserved.