分享

学术观点|袁筱一、甘露:数智、翻译与数字人文研究的“任务”

 Lushisheng 2024-06-20 发布于北京

摘要:随着数智时代的到来,大语言模型对包括外语学科在内的人文研究产生了深刻的影响,在大语言模型相对传统机器翻译取得了巨大进步的前提下,本文从文学的根本问题出发,阐释了作为拓展语言处理可能性工具的大语言模型的“模仿”本质,重新审视人文研究在数智时代的生存境遇,提出了未来数字人文研究应该关注的问题,最后从语言之于人类的意义、数字人文研究的跨学科视野、对人类理性的再思考、数字人文的人文依归出发,指出了数字人文研究的人文本质,旨在就大语言模型与包括外语学科在内的人文学科未来发展之间的关系以及文学翻译研究的方向提供思考与研究借鉴。

关键词:数字人文;大语言模型;人工智能;人文研究;文学翻译


01
引言

自然语言处理技术的飞跃、ChatGPT与其他各种类型的大语言模型以及专业语言模型的研发和大规模使用标志着人类进入数智时代,几乎对所有行业产生了颠覆性的冲击,教育首当其冲。在《GPT时代人类再腾飞》一书中,作者里德·霍夫曼(Reid Hoffman)援引德克萨斯大学奥斯汀分校史蒂文·明茨(Steven Mintz)教授的一篇专栏文章,展现了教育如何被一系列技术所改变:“就像谷歌降低了人们对坚不可摧的记忆力的依赖,电子计算器加速了复杂数字运算,维基百科取代了纸质百科全书,在线数据库降低了人们对庞大实体图书馆的依赖,ChatGPT等平台同样也将深刻改变人类最珍视的技能。”(里德·霍夫曼,2023:26)

可以想象,在高等教育的各个学科领域中,以外语教学和翻译为基础发展而来的外语学科会受到怎样的冲击。与其他学科领域相比,大语言模型带来的不仅是研究范式上的颠覆,更是直击外语学科的根本。依赖于深度神经网络技术发展的大语言模型能够借助“运算”在跨语际实践中初步替代经过较长时间才能系统习得语言知识的“外语人”,这已经是不争的事实。因此,对于外语学科来说,不仅仅是传统研究内容和研究范式需要应变的问题,而且是学科存在的合理性与合法性受到了前所未有的质疑,尤其是外语学科工具理性的那一部分价值。

本文从大语言模型擅长完成的“任务”出发,考察大语言模型为语言实践和人文研究带来的具体问题和挑战,试图就大语言模型与包括外语学科在内的人文学科未来发展之间的关系给出自己的思考。

02
大语言模型的“创造性”与外语学科的“危机感”

翻译毫无疑问是外语学科最为传统,同时也是最为重要的“阵地”。在外语学科的人才培养体系中,有相当一部分也是以高端翻译人才为培养目标。因而,大语言模型的横空出世似乎在一夜之间就消解了作为职业而存在的翻译,以翻译人才为培养目标的外语专业也随之遭遇危机。事实上,早在大语言模型之前,学习型的翻译软件在某种程度上已经颠覆了我们对于机器翻译“边界”的认知。与微软小冰在创作上的“成就”相似,这一类的人工智能翻译软件都拥有海量的知识数据库。正如肖杰在《从“微软小冰”探讨人工智能的前景与未来》一文中所总结的,我们可以将这类语言处理软件的运作过程简化为通过相对专门的语料“对大数据进行再加工”,对人类某一种具有创造性的“语料(例如情感)进行侦测,跟踪并判断”,“再与知识库进行匹配,从而实现类似的”语言实践活动(肖杰,2018:10)。至此,机器在语言实践这一主体性行为上迈出了一大步,也揭示了更具“创造性”的语言处理模式的可能性。

我们不妨把大语言模型理解为对语言处理可能性的进一步拓展。它的应用范围更广,所接受的数据训练量也更大,而不是仅限于对某一种语料“进行侦测,跟踪并判断”。据《ChatGPT的运行模式、关键技术及未来图景》一文所述,ChatGPT“在有3000亿单词的语料上预训练拥有1750 亿(GPT-4已经达到了100万亿)参数的模型”,因此,它展示了三种强大的能力,“一是语言生成能力”,“二是上下文学习能力”,“三是世界知识能力”(朱光辉等,2023:117)。跨语际的信息转换当然不是ChatGPT等大语言模型唯一的突破性功能,但就实践体验而言,它的确因为庞大的数据以及所谓的“世界知识能力”而在翻译上展现出更高的完成度,其语言生成也更加“自然”。

的确,经过不同学习型翻译器以及大语言模型的实验,虽然在不同类型文本翻译上的表现不尽相同,但总的说来,相较于传统的翻译软件或机器翻译,能力较高的大语言模型的进步还是可圈可点①。其“创造力”主要表现在三个方面:首先,得益于“世界知识能力”,大语言模型出错相对更少,尤其是GPT-3.5或GPT-4。特别是在文学翻译中,大语言模型能力较好,并因拥有更为庞大的语料而具备追溯词源、准确释义的能力。GPT的语料主要来自 Common Crawl 、WebText 等语料库,还有一部分来自书籍和报刊杂志,另有一小部分来自维基百科,这就使得大语言模型在很多时候可以实现一部分需要参照不同时代、不同地区的文化知识才能完成的理解。其次,大语言模型的“上下文学习能力”也的确为它提供了一定的逻辑判断能力。我们可以观察到,传统的翻译软件更趋向作为方法的直译,这并不是因为传统的翻译软件更加秉持直译的立场,而是它无法完成阐释所要求的复杂程序,从而只能够完成相对直接的语义意义的翻译。大语言模型却可以在有限的范围内,对于具有鲜明文学标记的影射、隐喻以及与前置词有一定距离的代词进行理解与判断,并传递相对正确的意义。最后,在翻译的再表达阶段,我们也能够发现,大语言模型不仅能够在多义之中进行选择,也表现出一定的逻辑推理和综合判断能力,因而在翻译的过程中出现了较为明显的删减或是增译。

事实上,尽管诚如霍夫曼所言,GPT-4 ,即 GPT的最新一代仍然“既非无所不知,也非绝对可靠”,离“具备与人类类似的常识推理能力和自我意识”(里德·霍夫曼,2023:20)的程度差得很远,但我们仍然为大语言模型的阐释能力感到震惊。这是否意味着“人工智能”在语言的使用上不仅能够模仿人类的智能,甚至能够超越人类的智能?毕竟人类个体大脑对于知识的存储能力离100万亿单词的容量相去甚远。至今还给人类留下一丝侥幸的地方在于,由于算力的限制,目前大语言模型在“上下文学习能力”方面还有较多限制。在文学翻译中,一旦文本的各种能指或所指层面的深层网络超出了2000词的范围,大语言模型仍旧显示出一定的能力不足。这使得即便是能力较高的大语言模型的错误率仍然高于文学翻译的行业标准。但技术乐观派和人文悲观派都不怀疑,算力的提高是迟早的事情,并且在未来会呈几何倍数增长。因此接下来,只要再加强训练,机器在文学翻译上甚至能够显示出更多的自主性和创造性或许也是指日可待的事情。

在大语言模型出现并得到广泛应用之前,文学翻译或许是与外语学科诸多关联领域中最后的“圣地”。究其原因,恰恰与“创造性”有关。此前,并不完全了解技术进展的人文学者天真地认为,人类的主体性是无法定量的,从而也无法被机器征服。而这一想法在被以Alpha Go为转折点的人工智能领域的发展颠覆之后,人文学者在震惊之余,几乎全部以“成见性反对”的态度来应对。诚如文学翻译一般,人类最富创造性的“圣地”——例如绘画、音乐或文学创作——都有沦落的危险。于是,2023年10月,包括奥尔加·托尔卡尔丘克、安妮·埃尔诺、本杰伦、蕾拉·斯利玛尼、让菲利普·图森等著名作家在内的艺术家们在法国《解放报》上联合签名发表声明,“明确要求”“出版社、字幕、译制及画外音技术服务提供商、影视制作及发行商、游戏工作室以及新闻机构拒绝把人工智能用作翻译和一切艺术作品及文本的工具”,因为“翻译行为是人类的行为。这样的行为要求的是经验,是思考,是感觉,是风格的创造,而不是基于大数据基础的机器的复制行为”(2023年10月4日,Libération第17版)。如果说边界守不住了,那就需要人为设置界限。

但是,我们可以进一步思考的问题是,大语言模型的“创造性”真的给人类专有的创造性领域带来了危机吗?或者,危机只是我们的感觉而已?大语言模型的“创造性”究竟如何定义?大语言模型的“创造性”与人类的“创造性”毫无分别,甚至是替代关系吗?

03
大语言模型的“创造性”实质:一个基于文学本质的回答

在听凭自己被危机感淹没之前,我们首先还是需要回到“文学是什么”以及“语言是什么”的老问题上来。这就告诉我们,和外语学科相关的文学研究、文学理论研究以及语言研究并非是无意义的。在数智时代,基础研究为我们提供的一些思考与结论或许才真正能够帮助我们部分消除作为人类的“危机感”。

 “文学是什么”以及“语言是什么”当然是个大问题。我们在此不必走得太远。萨特在《什么是文学?》中用最简单的话语告诉我们,“画家不是想在画布上绘制符号,他是要'创造’一种东西”,虽然在持写作介入观的萨特看来,写作的指向远比其他艺术行为的指向更加明确——艺术也的确是写作的一种形式——但是他关于艺术的元素与将艺术元素“组合”在一起的表述更有助于我们参透“创造”的实质:艺术家将这些元素放置在一起,用“动机”,或者说“灵魂”加以串联,创造出有别于元素物质的新事物,后者是属于想象域的,“从不(直接)表达他(艺术家)的愤怒、焦虑或喜悦:它们渗透在作品中;虽然它们已经渗透在那些本身已经具有某种意义的色调中,但艺术家的情感却变得模糊而晦暗,没有人能完全辨认出它们”(Sartre,1948:15)。在这一段关于艺术的表述里,萨特道出了艺术(语言)创作的三个特征:一是艺术创造取决于艺术调用的元素,如色彩或者文学中的词语,同样取决于这些文字的“组合”;二是“灵魂”是新的“事物”生成的关键,艺术家在“灵魂”的驱动下,借助艺术创作的“动机”将他可以调用的元素符号进行组合和转换,生成为其“想象之物”;三是“动机”一旦落入符号里,成为“想象之物”,它会变得“模糊而晦暗”。这三个特征既决定了包括文学翻译在内的艺术创造的本质,也充分展现了从本身具有意义的符号到艺术家“想象之物”的过程。虽然变得“模糊而晦暗”的“动机”并不是我们阅读、观看或者聆听艺术创造时要追寻的唯一目标,但它决定性地参与到创造的过程中,也是读者、观众和听众在理解艺术创造时重要的参照。

在对文学艺术创造的本质有所理解之后,我们就能够更好地理解大语言模型在“创造性”上的进展。相较于传统的翻译软件,无论是学习型的翻译软件,还是大语言模型,解决的都是艺术创造第一个本质层面的问题,即从理解符号本身的意义到理解组合之后所产生的意义,并且不仅限于规则性的理解。这就是所谓的“上下文学习能力”。

“模型”这个词本身也很好地说明了大语言模型创造性的实质与依据。在我们所讨论的问题领域里,大语言模型的文本翻译与文本创作主要是基于大规模参数的计算。参数、算法、模型,这些都是当代语言学熟悉的语汇。乔姆斯基阐述他的普遍语法的概念时提到“词项的属性包含参数,所以,参数很可能是词汇性的,很可能是词汇的一小部分。除了词项的问题,还有表达式如何构成的问题……你所构建的语法体中包含一些和进一步运算相关的信息”(乔姆斯基,2015:52)。也就是说,以词语为单位进行参数的运算,建立在有效地排除在语言使用上的任选项从而留下必须项的基础上。大语言模型所谓的创造性就是在必须项之上,增加了任选项的部分。但是大语言模型生成的任选项在某种程度上是没有“动机”的,它只能够依据在海量的数据库中发现的微弱关联来模仿个人主体通过词语符号的组合生成其“想象之物”的过程。

在语言的实现过程中,模型是可以想象的。依据的语料库越小,模型也就越少。大语言模型的重大飞跃之一就在于不断突破语料的容量,而不再像以往一样局限在有限的专业语料中。语言模型的这一发展趋势与文学发展变化之间具有双重关系。一方面,从参数有限的专业语言模型到参数不断增加的“大语言”模型的转变让我们看到了大语言模型完成包括文学翻译在内的文学艺术创作的可能性。文学是什么?不同的文学在各自的语言环境中产生之后,经过语内与跨语际的翻译,经过不同文学观念的锤炼,文学就是真正意义上的“大语言”。贝尔曼在批评“民族中心主义翻译”的时候,谈到“非韵文翻译最为尖锐的'问题’,就是所有的非韵文都具有一个鲜明的特征,那就是都或多或少地将不同的语言叠加在一起”,都具有“多样的声音”(Berman,1999:66)。非韵文(Prose)本身就具有多种体裁,例如随笔、小说、学术写作等等。然而从20世纪开始,体裁边界的模糊、事实叙事与虚构叙事的模糊等等使得一切皆成为文学,也使文学语言离我们日常生活中的“大语言”越来越近。但是另一方面,离“大语言”越来越近,也就意味着需要抽离的“模型”越来越多,因为与算力同步增长的是语言个人使用的不断积累。就像乔治·斯坦纳在《巴别塔之后》中所说的,“语言……是赫拉克利特式流变的最典型例子,它每时每刻都在变化。每次新的语言活动不仅能够增加语言活动的综述,还能为其制定标准”(斯坦纳,2020:23)。

我们在使用大语言模型时,对其“模型”的确深有体会。模型的意义在于完成完美的模仿,而非创造。这与文学的“任务”恰恰背道而驰。如果撇开翻译不谈,大语言模型最擅长的是对其掌握的知识进行综合。在霍夫曼的《GPT时代人类再腾飞》中,最令人印象深刻的是该书第九部分“可能的访谈”。作者要求GPT-4代入多个现代社会中的公共知识分子,编造一段他们可能进行的“访谈”,以展示GPT-4在个性化创造上的能力。GPT-4的确能够在综合这些公共知识分子的话题、观点与语言风格后,成功地完成代入和对话。然而这一尝试仍然没有离开“模型”的基本意义。换句话说,即便是最令我们感到担忧的个人情感和风格的“创造”,大语言模型做的仍然是模仿。而一个想要在历史上留下自己作品并且证明自己价值的小说家、诗人或者艺术家,他们要做的事情则是基于前人已有的创造,完成完全不同的个人创造。前人的创造既是基础,更是他们要避开的“模型”。当他们完成了自己的创造之后,他们的作品或者对语言艺术符号的使用方式也将成为后人需要避开的“模型”。

04
未来人文研究的新“任务”
4.1
人工智能对人文研究提出的新问题

如果我们能够同意上述的分析结果,即大语言模型的创造与文学艺术的创造是完全不同的创造,或许我们就不会再为包括文学翻译在内的文学艺术是否会受到人工智能威胁之类的问题所困扰。但是,这并不意味着我们可以安心地告慰自己,奇点时代不会来临,人类仍然可以凭借其独特的创造力而继续存活下去。

事实上,以大语言模型为标志的人工智能的飞跃性发展的确需要我们重新审视人类在数智时代的生存境遇。人工智能威胁到的并不是包括语言实践在内的人类实践活动本身,而是人的思想生产方式。更为具象地说,与其担忧或有一天会被大语言模型或是学习型翻译器取代的文学翻译的未来,还不如担忧为缔造人类文明做出无穷贡献的人文研究——文学、历史、哲学或者语言学研究等的未来。

不同领域的学者各自从自身的领域出发,对人工智能为本领域研究带来的新环境、提出的新问题以及潜在的负面影响都有所思考。例如外语学科的学者认为,大语言模型有可能使得语言学习者在新的外语学习环境中“降低跨文化交际环境”“削弱人与现实的交流和沟通”“阻碍批判性思维发展”等(张震宇,2023:41);哲学领域的学者则更聚焦于“在人工智能等新科技条件下的人类生存境遇”(蓝江,2023:12)等。而教育学的专家则在肯定“ChatGPT技术走向实用为我们获取知识提供了便利”的同时,也担心大语言模型的过度使用“会导致学生满足于现成答案,缺乏问题意识和批判精神,助长学生求知惰性”(钟秉林等,2023:5)。归结起来,面对ChatGPT这一类的大语言模型,人文学者的主要担忧在于以下三个方面:

首先是批判思维的丧失和因此所导致的思想的日渐贫瘠。事实上,最大的问题不在于大语言模型模仿人类或是替代人类做了什么,或是在未来能够模仿或者替代人类做什么,而是以“模型”的思维方式对人类思想的产出进行反规约。蓝江(2023:17)认为,“ChatGPT并非客观中立的产品,意识形态问题一定会通过某种形式体现其中,即生成式人工智能具有明显的意识形态倾向”。ChatGPT的诞生与网络环境密不可分,它所产出的知识综合未经人类的检验与反思就已经开始传播,这加剧了人文研究领域动辄变成意识形态阵地的现实。但是人类文明的进步依靠的是多样文明彼此间的互相理解与共生,而不是各自所认为的唯一真理之间的相互斗争与替代。对现成的知识综合,对以“科学”面目出现的所谓权威信息不加思考的接受必然导致人类社会集体性的盲从。与我们想象的正相反,科学技术的发展、全球化时代的传播便利与人类思想的丰富并不见得成正比。

其次是对所谓人工智能“研究成果”与实践成果的无条件信任所导致的错误判断。大语言模型依靠海量数据实现了对于不同项之间微弱关联的发现以及在此基础上的生成,但是我们不难发现,数据本身的可靠性难以甄别,而且大语言模型所发现的“微弱关联”具有不可靠性。这种不可靠性更在于大语言模型为了维持叙事的一贯逻辑甚至会产生捏造事实的行为,其典型表征就是在产出论文时的假文献现象。霍夫曼(2023:170)曾经提到,“在特定情境下,大语言模型生成非事实性信息的能力可能非常有用”,这种能力与人类的“想象力”类似。这一说法是值得商榷的。这并不是非事实性信息本身的问题,而是非事实性信息会被当成事实性信息来接受的问题。人类世界当然不是唯一真理的世界,但是人类世界进步的前提是对真理的追求,而不是对“自圆其说”的追求。

另一点则是形式对于内容的反作用力所导致的思想生产的单一化、扁平化。教育工作者普遍担忧大语言模型的无度使用会影响到教育生态和评估的公平性,并因此造成学生的思想惰性。这并非杞人忧天,而且也已经有了坚实的土壤。其实早在大语言模型诞生之前,搜索引擎、全民参与编撰的电子百科等工具就已经改变了人类思想的生产方式。过于强调知识而非思想的作用、思想生产的方法体系、由形式带来的整体性,例如所谓跨学科研究的形式,从而忽略了真正的整体视野、更倾向于思想的碎片化生产等等,这些都是新世纪以来人文研究的典型负面特征。大语言模型依赖的语料特征具有明显的共时特征,因而基于同时代这些学术生产与思想生产的大语言模型生产也在某种程度上排除了思想史在纯粹内容之外的宝贵遗产。趋于统一的形式必将带来趋于统一的内容。

上述种种并非完全是大语言模型为人文研究造成的新问题,而是大语言模型进一步凸显了人文研究早已悄然迈入的困境。这也提醒我们去思考,当人文研究面对数智时代人类的新处境时,究竟应该做些什么才能够不要那么快地落在科技进步为人类布下的陷阱里,才能用好科学技术的发展,让大语言模型这样的数智工具能够真正成为人类文明进步的助力。

4.2
人文研究对时代的回应:数字人文的发展及其问题

很多人文学者对“数智时代人文何为”提出了自己的看法,数字人文的兴起就具体体现了人文研究试图走出自身困境、面对社会发展的一种努力。早在上世纪后半叶,以计算人文为起点的数字人文就已经崛起,其发展过程中的主要贡献是通过建设专门的数据库和语料库,用于以往更偏重于定性手段的文学、语言学、翻译学、历史学等人文及社会学科的研究。

当然,就目前而言,数字人文的发展或许并不尽如人意。如果说数字人文有三个层面的研究,即数据集的建立、数字工具在人文研究上的使用以及人文对数智时代的反思,发展了半个多世纪的数字人文仍主要集中在第一个层面,即数据集的建立,或是基于数据集(语料库)的文本挖掘与开发。以翻译研究为例,在很长的时间里,数智视域之下的翻译研究主要停留在“语料库翻译学研究阶段和文本数据挖掘技术应用阶段”,即便是在文本数据挖掘技术应用上,也主要是将数字当作一种定量工具来使用,存在着“研究平台单一、研究方法不够多样、理论框架尚未构建等问题”(胡开宝,2022:113)。

 不仅是在与语言密切相关的翻译领域,在文学、历史、哲学等研究中,数字人文也存在着类似问题。人文研究领域这些年在数字人文方面的主要成果在于建立专门的数据集,或是基于数据集的定量研究,或是将研究结果从单纯的文本呈现转化为可视化的呈现等。相较于传统的人文研究积累,借助数字工具所完成的研究还远未能揭示出人类在数智时代的新境遇以及给出人类有可能的应对。

当然,我们也不能认为人文学者在数字与技术发展面前是一味被动的。莫莱蒂(Moretti)的“远读”理论在很大程度上就是基于数字人文提出的一种新研究范式和理论视角。虽然“远读”理论本身备受争议,似乎更像是人文学者想要拥抱这个数智时代的徒劳,但就其结果而言,或许也是数字人文发展到今天最受关注的方向之一。

鉴于此,如果说大语言模型是数字进入语言世界,从而进入人类思想生产领域的一个具有转折标志的事件,我们认为,包括外语学科学者在内的人文学者在这样一个数智时代全面来临之际,在未来的数字人文研究中应该关注以下四个方面的问题。

首先,倘若进入20世纪以来,我们在不自觉中都接受了语言作为人类的“居所”这样一个前提条件,人类的居所在数智时代是否已经或者将在未来遭遇重大的改变?这个核心问题可能会转化为多个研究的具体问题,例如从文本角度,人类的语言使用是日趋丰富还是日趋贫瘠?而莫莱蒂的研究不仅适用于18或者19世纪欧美小说在数量上或者主题上的变化描述,从18世纪(或者更早)到今天的文学语言的变化也更应该是考察的对象。

第二,数字人文的研究应该具有跨学科的意识和视野。人文研究中的问题,如果只是单纯依赖数字工具本身,其实并不能够得到真正有效的回答。即使我们能够得到一些统计数据,数据本身也不见得就可以代表规律、趋势。这就是为什么对于目前数字人文研究的结果我们总是觉得有一些牵强,甚至可笑。例如对所谓文本真伪的鉴定——所有的文本都与其作者,与其产生的社会、历史与地理不可分割。数智时代是和(逆)全球化时代、网络时代一起到来的,而直到目前为止,或许数字人文的诸项研究中还未能产生具有范式意义的定量、定性相结合的标识框架,以对如何有效描述目前的世界体系提出自己的思考。

第三,人工智能在某种程度上促使我们重新思考人类的理性。事实上,早在数字时代来临之前,人文研究就已经破除了线性思维的神话,在人文研究的各个领域都自我革新了范式。我们完全赞同蓝江所引述的卡伦·巴拉德对于衍射现象和量子纠缠认识论的解释,在物理学中,“对衍射(干涉)现象的研究提供了关于量子态纠缠本质的见解……它们更深刻地突出、展示和证明了世界不断变化和偶然的本体论的纠缠结构,包括认识的本体论。事实上,衍射不仅揭示了纠缠的现实,它本身就是一种纠缠现象”(蓝江,2023:16)。虽然可以说人文研究对“纠缠”早就有所感知,但在进入数智时代的今天,它却并没有致力于描述“不断变化的世界”和历史主体(人文思想的创造者)“偶然性”之间的关系。

最后一点,同时也是我们想作为结论的一点,就是人文研究绝不可以忘记,数字人文最终的依归是人文而非数字。诚然,想象未来的数智世界可能对人类产生的威胁并不是人文研究——它可能是末世电影或是异托邦文学的主题——的任务。但探索人工智能在人文研究、或是人在创造上究竟能走多远的实验也绝非是要在技术的推动下又倒过来推动技术越走越远,直至替代人类的思考。人文是什么?人文是所有(经典)文本在一而再、再而三的语内与跨语际的翻译中所累积起来的人类经验,这一经验只能够通过人的语言实践来完成。斯坦纳(2020:53)提到,“在谈到将中国哲学概念翻译成英语的可能时,艾·阿·理查兹说:'我们所面对的可能真的是迄今为止的宇宙演化中产生的最复杂的一类事情。’他或许所言不虚。但语言的这种复杂度和它的影响范围,在人类说出第一句话那一刻就已经得到显现了。”



注释


①在一门与文学翻译主体的研究项目相关的课程上,我们分别运用德国公司DeepL翻译器、讯飞星火、GPT-3.5及GPT-4进行翻译实验。翻译实验的主要对象为文学文本,涉及英汉、法汉等语言间翻译。如果以错误率为翻译质量标准,翻译能力从低到高分别为讯飞星火、DeepL、GPT-3.5/4,而 GPT-3.5 与GPT-4在翻译能力上相差不多。



图片
作者简介

袁筱一,华东师范大学教授。研究方向:翻译学、法语文学。

甘露,华东师范大学博士后。研究方向:翻译学、比较文学与世界文学。


文献来源:原载《外语教学理论与实践》2024年第1期,参考文献部分从略,引用请以期刊版为准。推送已获作者授权,转自“南大翻译研究所”

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多