基于口译比赛的口译学习者语料库建构研究

    刘靖 李智

    

    摘要:文章通过对国内口译大赛的特点进行分析,探讨了利用口译比赛资源建立口译学习者语料库的可行性,提出了建立口译学习者语料库的步骤与过程,并深入挖掘建立此类语料库的意义,以期对口译教学与研究提供新对象、新方法和新途径。

    关键词:口译比赛;口译学习者;口译学习者语料库;口译研究

    一、研究缘起

    自上个世纪中叶口译成为独立的职业以来,在研究与实践中不断摸索前行。本世纪初,中国成立了翻译本科专业,截至2020年,目前国内开设翻译本科专业(BTI)的院校达到281所,翻译硕士(MTI)的院校达到253所,口笔译教育发展迅猛。

    与此同时,国内也开展了多种口译竞赛,有大陆地区的,还有大陆地区与香港、澳门、台湾等地共同举办的。学生们不仅在竞赛中展示出新时期口译学习者的风采,而且在交流学习中不断提升口译能力。

    二、国内口译竞赛特点

    目前国内主要的口译竞赛有全国口译大赛、海峡两岸口译大赛、中华口译大赛等全国性赛事,还有校级、省级等多个级别的口译比赛。

    全国口译大赛由中国翻译协会与高等教育出版社、中国对外翻译出版公司、中国翻译协会语言服务行业创业创新中心等机构主办,自2009年首届举办以来,截至目前已经成功举办了八届,2020年6月举办第九届。涉及的语种主要是英语和汉语。一般分为初赛、省级复赛、大区赛和总决赛。在总决赛中还分为交传决赛和同传邀请赛;比赛包括英汉交传、汉英交传、对话交传、中英同传和英中同传等环节。口译材料主题包括文化交流、政治演讲、热点评论等。

    海峡两岸口译大赛是由厦门大学发起,由厦门大学与台湾翻译学会共同主办,两岸三地高校参与的口译比赛交流活动。截止目前,已经举办了八届。主要语种是英语和汉语。赛制包括校选赛、省赛、大区赛、大陆地区决赛、台湾决赛、两岸总决赛等;比赛包括中英主旨口译、英汉会议口译、汉英会议口译、双向对话口译等环节。比赛材料主题包括科学常识、科技信息、文化保护和热点时事等。

    中华口译大赛是由联合国训练研究所主办,2019年举行了第一届比赛,包括初赛、复赛、大区赛、总决赛四级赛制,比赛包括英汉主旨口译、汉英主旨口译、英译汉,汉译英和对话口译等环节。口译材料包括政治演讲、科技创新、企业管理和国际时事等主题。

    这些比赛在主题方面虽各有倾向,但主要通过多级赛制、多类主题、多种形式对学生进行了口译能力分级考核,选拔优秀选手。

    三、研究基础

    语料库是一个按照一定的采样标准采集而来的,能够代表一种语言或者某语言的一种变体或文类的电子文集(梁茂成等,2010,3)。Shlesinger(1998)最早提出将语料库的方法应用于口译研究之中。目前国内外的语料库主要是包括同声传译语料库(CIAIR)(Tohyama,2006),是目前最大的同传口译语料库,共计182小时,转写文字100万字;中国大学生英汉汉英口笔译语料库(PACCEL-S)(文秋芳、王金铨,2008)目前已经出版;欧洲议会口译语料库(EPIC)(Bendazzoli & Sandrelli,2010)包含英语、意大利语和西班牙语的多语平行语料库,库容约为18万字;上海交通大学研发的汉英会议口译语料库(CECIC)(胡开宝、陶庆,2010),目前库容约为54万字;电视口译语料库(CorIT)(Falbo,2012);中国总理“两会”记者会汉英交替传译语料库(CEIPPC)(王斌华,2012)等。

    由于语料获取、清洗、转写、标注等过程需要大量的人工,制作难度较大,因此国内外已建成的语料库比较有限。其中主要为二语或多语的平行语料库,中英互译的语料库非常少,除文秋芳、王金铨(2008)出版的大学生口笔译语料库之外,其他均以职业译员交传或者同传的内容为对象,缺少对口译学习者的关照,也缺少同一音频的不同译员的平行产出。将比赛的中英互译内容提取出来,对不同层次学生口译产出进行平行对比,这样形成了口译学习者语料库。对口译学习者而言,该库为口译学习提供了大量的训练与学习素材,为训练学生自主学习与点评提供了基础。对教师而言,口译学习者语料库的建立不仅可以让教师更好更快地发现学生的问题所在,发掘优秀案例,而且还可以为口译研究提供丰富研究资源与对象,对于提高学生口译能力,培养口译人才提供更多助力。

    四、建构方法与过程

    结合口译语料库的建库基本方法,建立口译学习者语料库可进行以下四个步骤。

    第一,提取音頻或视频。提取音视频的途径主要有以下两种方式,第一通过现场录音、录像等,第二通过提取出版物或网络抓取等。国内比赛跨度约为10年,完全依靠现场录音录像难以实现,因此可以通过网络或跨校合作,借助其他高校的存档等方式互补资源不足的问题。

    第二,语料清洗、切分和命名。去除语料中无效的段落,将图像、声音清晰完整的内容切分保存。切分时可利用格式工厂等音视频软件,并根据统一的规则命名文件。命名时,需注明比赛名称、场次、语言方向、口译类型、源语言或目标语言、选手姓名或编号、时长、主题等信息,为防止命名过长可通过字母、数字等进行代替,但字母与数字的意义需要统一。

    第三,双语转写、标注与对齐。可通过科大讯飞、搜狗等软件分别对中英文音频(转写时,需要将视频资料转换为音频)进行机器转写或人工转写。转写后进行校对,并标注语言与副语言信息,然后将音视频与文字对齐。标注时需要注意:(1)段对齐与句对齐的差别;(2)统一语言信息标注原则,如词性、标点等;(3)统一副语言信息的标注原则,如口头语、停顿、语调变化等。

    第四,整合。将标注、对齐完毕的材料统一存储,根据教学、研究需要,利用语料库软件进行调取,并做好文本备份。

    五、思考与讨论

    基于竞赛资源建立的口译学习者语料库对口译教学与研究具有非常重要的现实意义。

    第一,弥补教学资源陈旧,丰富口译训练模式。传统口译教材出版周期长,训练材料时效性低。口译比赛的主题丰富,大多取材于国际时事、政治演讲、文化交流和新兴技术等方面,涵盖政治、经济、文化、教育、科技等多个领域,且材料考察目的性强,具有代表性。比赛中口译的形式多样,不拘泥于交替传译,还包括主旨口译、对话口译、同声传译等。应用时,可满足不同训练目标,进行调取,如进行听辨信息、记忆、笔记、逻辑表达等训练。因此,口译学习者语料库不仅适用于培训竞赛选手,更重要的是,可以在日常教学培训中,弥补口译教材陈旧、语料过时等问题,为教师和学生提供大量新鲜素材。学生观摩欣赏不同级别的选手表现,可以进行评价、对比分析,发掘优势,取长补短。

    第二,为口译研究提供新的突破口。王斌华(2019,75)指出早期的口译质量评估多依靠问卷调查,近期研究者意识到评估口译需要对口译活动、源语言、目标语言等多种信息进行综合评估。口译学习者语料库不仅提供了平行双语文本的对齐标注,而且还具备副语言信息和现场音视频,为口译综合全面评估提供了必要的研究基础。口译研究的综述文献显示,传统口译研究对语言能力、口译技巧、口译教学等本体論研究较多,且国内研究以思辨性研究为主(胡庚申,2019;任文、黄娟,2019)。在基于口译比赛内容的语料库中,全国性口译比赛一般会经过校级、省级、大区和全国级别的比赛,层层选拔,对象能力梯度明显,选手的口译质量、逻辑表述、现场应变等能力差异较大,非常适合抽样和量化研究。可见该种语料库为口译研究提供了丰富的研究对象、新的研究思路与方法。

    六、结语

    口译比赛在国内已经进行了10年之久,积累了相当多的语料资源,将这些资源通过细致的分类与梳理,建立标准化、标注规则统一口译学习者语料库,充分利用多主题、多层次的语料,有助于口译学习者、口译教育工作者进一步完善口译教学、口译研究和口译学习。

    参考文献:

    [1]胡庚申.我国口译研究40年(1978-2018)[J].外语教学与研究,2019,51(6):938—948,961.

    [2]胡开宝,陶庆.汉英会议口译语料库的创建与应用研究[J].中国翻译,2010,31(5):49—56,95.

    [3]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.

    [4]任文,黄娟.中国口译研究热点与趋势探析(2008—2018)[J].中国翻译,2019,40(5):37—47.

    [5]王斌华.语料库口译研究——口译产品研究方法的突破[J].中国外语,2012,9(3):94—100.

    [6]王斌华.口译理论研究[M].北京:外语教学与研究出版社,2019.

    [7]文秋芳,王金铨.中国大学生英汉汉英口笔译语料库[M].北京:外语教学与研究出版社,2008.

    编辑∕李梦迪