type
status
date
slug
summary
tags
category
icon
标签
参考标签
 
😀
本文介绍了如何使用Trados插件整合DeepL和ChatGPT进行翻译工作,包括注册Custom.MT账号、配置DeepL和ChatGPT、创建模板和安装Trados插件的步骤。还对比了DeepL机翻和DeepL机翻+ChatGPT译后编辑的翻译效果,并讨论了人工翻译是否会被机器翻译替代的问题。
SDL Trados是全球范围内深受翻译专业人士信赖的一款旗舰级CAT工具,以其丰富的功能、高度的可定制性和广泛的兼容性在翻译行业树立了标准。它的核心功能包括:
  • 翻译记忆(Translation Memory, TM)系统:Trados的核心竞争力之一就是其强大的TM系统。它能够存储已翻译过的句子或片段,当遇到相似或相同的文本时,自动提供匹配的译文供参考或直接采用,显著减少了重复劳动并保持译文的一致性。
  • 术语管理(Terminology Management):通过集成的SDL MultiTerm组件,Trados帮助用户创建、维护和应用专业的术语库。这确保了关键术语在整个翻译项目中的准确、一致使用,尤其对于技术文档、法律合同等专业性强、术语密集型的翻译任务至关重要。
  • 项目管理与协作:Trados Studio 提供全面的项目管理功能,包括文件预处理、任务分配、进度监控、质量保证等。同时,支持多用户协作模式,团队成员可以共享翻译记忆库和术语库,协同完成大型翻译项目。
  • 高级编辑环境:Trados Studio提供了丰富的编辑界面,如可视化上下文匹配视图、自动拼写检查、格式保留等,让翻译工作更加高效且舒适。此外,它还支持各种文件格式的直接导入导出,如MS Office文档、HTML、XML、PDF等,大大简化了翻译流程。
这些功能,是Trados的常用功能,对于每一个使用Trados进行计算机辅助翻译的人,尤其是自由译员,基本上每一次翻译实务都需要用到上面的这些功能。不管是自己积累还是甲方翻译公司提供,翻译记忆库和术语库都能明显提高翻译的准确度、一致性和效率。而且,这两个系统有很明显的网络效应,经过沉淀积累,译者对它们的倚赖会越来越大,它们能发挥的效能也越来越强。我想,这是使用Trados的同学们有目共睹,深有同感的。
今天这篇文章,不会聚焦上面这些核心功能,而是一个不常使用,或者容易被忽略的一个核心功能:
  • 插件与集成:Trados拥有丰富的第三方插件生态系统以及与其他业务系统的深度集成能力,如与机器翻译引擎(如DeepL、Google翻译等)的对接,实现人工译后编辑工作流,或是与企业内容管理系统(CMS)、客户关系管理系统(CRM)等的整合,提高企业级翻译项目的整体效率。
我希望通过本文,介绍一种使用Trados插件,将机器翻译(本文使用的DeepL为例)和AI(本文使用ChatGPT-4为例)集成到计算机辅助翻译的流程当中,大幅度提高翻译效率和效果。

机器翻译和译后编辑

随着人工智能技术的飞速发展,机器翻译(Machine Translation, MT)平台和引擎的能力不断增强,它们在处理大量文本翻译任务时展现出前所未有的效率和广泛性。这种技术进步确实极大地改变了专业译者的工作模式。
过去,翻译工作往往需要译者从零开始,逐字逐句地进行人工翻译,这是一个既耗时又耗力的过程。而今,机器翻译能够提供初步的翻译稿,译者的工作重心更多地转向了“译后编辑”(Post-Editing)阶段:在机器翻译生成的文本基础上,人工进行修正、润色、调整语序和风格等,以确保译文的准确度、流畅度和自然度,符合目标语言的习惯表达和文化背景。
这种工作方式有它显而易见的优势,最大的优势就是能够提高效率。机器翻译可以快速处理大规模文本,为译者节省了从头翻译的时间,使他们能够集中精力处理机器难以完美处理的语言细节和文化差异。
不过,尽管机器翻译技术取得了长足的进步,但它仍然存在局限性,尤其是在处理高度创意性、文化特定性强或语境复杂的内容时。因此,译者的专业知识、语言敏感性和文化理解仍然是不可或缺的,他们在“译后编辑”中的作用对于产出高质量翻译内容至关重要。
在我看来,机器翻译+译后编辑(Machine Translation Post Editing)中,机器翻译引擎负责织锦,而译者负责添花。

AI和大语言模型

大语言模型(Large Language Models, LLMs)随着ChatGPT的火爆而备受关注。大语言模型是经过大规模数据集训练的深度学习模型,特别是基于Transformer架构的自然语言处理模型。这些模型因其庞大的参数量(通常包含数十亿到数千亿参数)而得名,能够学习到语言的深层次结构和复杂模式,展现出强大的语言理解和生成能力。
大语言模型能够根据给定的提示或上下文生成连续、有意义的文本,包括文章创作、故事续写、对话响应生成等。它们能够模拟不同风格和语境,从正式的新闻报道到日常对话,表现出高度的灵活性和多样性。
除了生成文本,这些模型还能用于理解复杂的查询、情感分析、语义解析等任务,它们能够捕捉文本中的隐含意义、情感色彩和逻辑关系,为信息检索、问答系统和智能客服等应用提供支持。
凭借对多语言数据的学习,大语言模型能实现高质量的机器翻译,不仅限于直接翻译,还能在不同语言间传递文化和语境的细微差别。
由于其强大的语言理解和生成能力,大语言模型在“译后编辑”乃至整个翻译流程中展现出了巨大潜力。这些模型通过学习海量的语言数据,不仅能够生成连贯、自然的文本,还能在一定程度上理解和适应不同的语言风格及上下文,从而在译后编辑阶段提供有效的辅助,比如:可以根据上下文自动检测并建议修改机器翻译中的语法错误、词汇不当或不自然的表达,减轻译者的工作负担,提高编辑效率;帮助保持译文与原文或特定项目要求的风格及术语一致性,通过提示词,制定特定领域或偏好的表达方式,使译文更加贴合目标受众的阅读习惯。
虽然大语言模型的能力很强大,但译者还是不能当甩手掌柜,只能说自己又可以将一部分译后编辑的工作量交出去,而担任质量的把关者,相当于项目总监。

准备机器翻译和大语言模型的API

接下来,正式开始本文的实际操作部分,这篇文章按照上面的思路,希望通过Trados的插件,将机器翻译+AI译后编辑整合起来,实现快速翻译,并形成质量相当不错译文。
本文使用的软件、插件、API包括:
  • SDL Trados 2019 Freelance(本文假设你有Trados)
  • custom.mt插件(需要注册账号,免费账号有用量限制)
  • DeepL的API(需要注册账号,免费账号可以翻译最多500,000 个字符每月。如果想翻译更多的内容,需要升级到DeepL API Pro。)
  • OpenAI的第三方付费API(用于调用ChatGPT)

申请DeepL的API

DeepL是一家专注于高质量语言翻译技术的公司,前身为Linguee。它以提供异常精准的机器翻译结果而闻名,核心产品之一是其翻译平台,包括网页端界面、客户端程序和API服务。DeepL利用先进的神经网络技术和大量的高质量语料库,其翻译结果在多个语言对中经常获得比其他知名翻译工具更高的评价,尤其是对于语言的自然流畅度和上下文理解。除了文本翻译,DeepL还允许用户上传Word、Excel、PowerPoint、PDF等多种格式的文档,直接获得翻译后的文档,保持原有的格式和布局,对于办公和学术用途非常便利。DeepL还提供API接口,让开发者能够将DeepL的翻译功能集成到自己的应用程序、网站或其他软件解决方案中。这为需要自动化翻译流程的企业和项目提供了强大的支持。
获取DeepL API的步骤相对直接,以下是获取DeepL API密钥的步骤:
  1. 注册DeepL账户
      • 如果你还没有DeepL账户,首先访问DeepL官方网站 (https://www.deepl.com/zh/pro-api?cta=header-pro-api),点击页面中间的“免费注册”,按照指示创建一个新的账户。需要你的邮箱地址和设置密码,并输入信用卡信息,但不会扣费,除非升级到pro账号。
  1. 登录账户
      • 注册或已有账户的用户,请登录到DeepL账户。
  1. 访问API页面
      • 登录后,导航至DeepL的API相关页面(https://www.deepl.com/zh/your-account/keys)。可以看到,系统已经生成了一个默认的API,你可以直接使用这个API,也可以创建一个新的API,不过免费账户最多只能创建2个API。
      notion image
注意,API密钥是非常重要的认证信息,允许你的应用程序以你的身份访问DeepL的翻译服务。请务必将这个密钥妥善保存,不要泄露给他人,并且最好直接在你的应用程序代码或配置文件中以安全的方式存储。

获取OpenAI的第三方付费API

因为OpenAI 未在中国提供服务,所以申请官方的API非常困难。 只能曲线救国,使用第三方API,比如“https://aihubmix.com/register?aff=VWPY”(这是我的推荐链接,你通过这个链接注册,我也不会拿到任何返利),他们提供第三方的OpenAI API 密钥,速度快,且很具性价比,1 美元 OpenAI API 额度只需人民币4.2元。
OpenAI 的 API 按 token 计费,输入输出都会计入费用。收费费率如下:
Model
Prompt
Completion
gpt-3.5-turbo
$0.002 / 1K tokens
$0.002 / 1K tokens
gpt-4
$0.03 / 1K tokens
$0.06 / 1K tokens
gpt-4-32k
$0.06 / 1K tokens
$0.12 / 1K tokens
根据经验粗略估计,对于英文文本,1 个 token 大约为 4 个字符或 0.75 个单词。
注册登录之后,在“充值”页面,点击“充值”,可以先小额充1美元试一下。填写电子邮件,提交订单,会跳转到支付宝支付页面。
支付成功后,会来到卡密页面,记得复制卡密
notion image
回到前面的“充值”页面,输入刚刚购买的卡密,点击“兑换”,就到账了。
notion image
接下来,到“令牌”页面(https://aihubmix.com/token),“创建令牌”,改个名称,比如“Trados”,其他都可以保持不变,点击提交。你的“API令牌秘钥”就创建好了。
notion image

注册Custom.MT 并完成配置

Custom.MT 是一家专注于机器翻译和本地化服务的AI和机器学习的机构。他们帮助翻译和本地化团队实施和优化AI模型,以提高翻译效率和质量。Custom.MT 的旗舰产品是 Custom.MT Console,这是一个集成了多种本地化工具的机器翻译管理平台。
Trados Connector 是 Custom.MT 提供的一个插件,专门用于 Trados Studio。Trados Connector 允许用户将多种定制、自有和开源机器翻译模型连接到 Trados Studio,从而增强翻译工作的效率和质量。 Trados Connector 支持超过20种不同的机翻引擎,无需再单独安装插件,而且可以集中管理机器翻译引擎,减少了在不同MT插件间切换的需要。还支持连接自定义大语言模型,包括开源模型。
本文就是通过Trados Connector这个插件整合DeepL和ChatGPT。
  1. 注册Custom.MT账号
点击主页右上角的“登录”,注册账号(https://console.custom.mt/account/signup),过程还是很简单的,注册完成之后需要在邮箱激活账号。
  1. 配置DeepL和ChatGPT
登录账号之后,来到你的控制中心(https://console.custom.mt/),在这里需要将你现有的API配置好。
点击DeepL最右侧的三个点,点击“Edit”,填入你在DeepL的API页面(https://www.deepl.com/zh/your-account/keys)创建的API,版本号选择V2,保存。
notion image
点击“OpenAI GPT-4-1106-preview”最右侧的三个点,点击“Edit”,填入你在aihubmix.com“令牌”页面(https://aihubmix.com/token)创建的API令牌,OPENAI_GPT_BASE栏填入https://aihubmix.com/v1,保存。之所以选择这个模型,是因为这个模型能力很强,支持很长的上下文,缺点是略贵。
notion image
  1. 创建模板(Templates)
在左侧导航栏点击Templates(https://console.custom.mt/templates/),创建新的模版。
点击红色的小加号,选择“Translation”配置机器翻译部分,语言对设置为“中英”,机翻引擎选择“DeepL”。
notion image
然后再点击红色的小加号,选择“Post-Editing”配置译后编辑的部分,Prompt选择你想要的译文风格(本文以Formal为例),Model会自动帮你选好你配置好的ChatGPT。
notion image
点击保存。

安装Trados插件并应用

  1. 下载插件
插件本身是免费的,可以在Trados的插件商店下载:
如果速度太慢,也可以用下面这个下载地址:
  1. 安装插件
双击下载好的插件文件,按提示完成安装。
点击“附加功能”标签,“插件”按钮,可以看到插件已经安装成功。
notion image
  1. 在新建项目的时候,设置“翻译资源”的步骤(也就是添加翻译记忆库的步骤),选择使用Custom.MT Translation(本文为了举例,只添加这一项而未添加其他翻译记忆库)
notion image
  1. 先返回你的控制面板(https://console.custom.mt/credentials/),复制你API里面的那个Key,填入插件弹出窗口的token栏,verify之后,选择Template。
notion image
接下去的步骤就按照平时的设置就好。

效果

本文挑选了一篇王孟源博士的博文《社会主义国家应该如何管理资本》作为示范,主题主要围绕着资本在社会主义体制下的定位展开,讨论了自由市场和民选体制在资本主义中的价值,以及社会主义体制下对资本运作的应有局限。同时,文章还探讨了如何防范资本的腐蚀政治权力的行为,以及对整体经济有负面影响的盈利机制。文章风格严谨,逻辑清晰,结构严密,采用了较为正式的学术性语言,同时也穿插了一些具体案例和数据来支撑观点。整体文体较为学术化,译文也应采取正式风格,符合本文前面在Custom.MT设置ChatGPT Prompt为Formal风格。在导入Trados前,作者将博文从繁体中文转换为简体中文,其他未做修改。翻译项目的翻译记忆库只添加了Custom.MT Translation插件,没有添加其他翻译记忆库。术语库只创建了空白的术语库文件。本文示例得到的译文没有经过人工修改和润色,是经过DeepL机器翻译和ChatGPT-4译后编辑的直接成品。
最为对比,同一篇文章上传到DeepL进行全文翻译,没有进行人工修改和润色。

响应速度

在Trados中,激活一行后,Trados会进行翻译记忆库搜索的动作,只不过在这里由于没有现成的翻译记忆库,Trados会使用Custom.MT插件。从视频可以看出,响应速度还是很快的,大部分会直接返回结果,少部分需要等待几秒钟。状态栏会显示NMT标签,表示这个翻译结果是“神经机器翻译”(Neural Machine Translation)。

翻译对比

对正文的翻译进行对比
中文原文
自由市场和民选体制,并不是资本主义的核心价值;资本利益的最大化才是其体制设计和演化的先决条件。
DeepL翻译
The Libreville Field and the elected system are not the core values of capitalism; it is the maximization of capital's interests that is the prerequisite for the design and evolution of its institutions.
DeepL翻译+ChatGPT-4译后编辑
The core values of capitalism do not encompass the Libreville Field or the institution of the popular vote; rather, the fundamental prerequisite for the formulation and progression of its institutions is the maximization of capital's interests.
这一句,DeepL的翻译有一个严重错误,因为机翻缺乏大语言模型那种对上下文的“理解”,把“自由市场”断成了“自由市”“场”,也就是加蓬首都自由市的场,所以翻译成了Libreville Field。ChatGPT将这一个错误保留了下来。
ChatGPT使用了更具体的术语,如“the institution of the popular vote”,在语言上更加正式和学术化。
中文原文
因此,资本必须凌驾于政治权力之上。
DeepL翻译
Therefore, capital must be above political power.
DeepL翻译+ChatGPT-4译后编辑
Consequently, it is imperative that capital holds a position of superiority over political authority.
DeepL版本略显简单和单薄,没有什么语气,也并不正式。ChatGPT版本则明显更加正式和强调,这可能在需要强调资本对政治权力的超越性的上下文中更为有效。“a position of superiority”和“political authority”使得句子更加详细和精确。
中文原文
然而资本来自不同行业和集团,那麽资本主义政府的主要任务自然成为充当他们谈判、分赃、妥协的平台,因此才采纳民选制度、因此才要求绝对自由市场、因此才强调三权分立、因此才美化权力制衡、因此才吹捧多元社会、因此才标榜自由媒体、因此才设计政党轮替、并将游说业制度化以便依赖半公开竞标来压低资本收买政客的价格费用。
DeepL翻译
However, since capital comes from different industries and groups, the main task of the capitalist government naturally becomes to serve as a platform for them to negotiate, share the spoils, and make compromises. That is why it adopts the electoral system, that is why it demands an absolute Libreville field, that is why it emphasizes the separation of powers, that is why it glorifies checks and balances on power, that is why it touts a pluralistic society, that is why it touts a free media, that is why it designs the alternation of political parties, and that is why it institutionalizes the lobbying industry to rely on semi-open bidding to keep down the price of capital to buy politicians.
DeepL翻译+ChatGPT-4译后编辑
Nevertheless, given that capital originates from a diverse array of industries and collectives, the principal function of a capitalist administration is to act as a facilitator for these entities to engage in dialogue, distribute profits, and reach mutual agreements. This necessitates the implementation of an electoral system, the insistence on an unfettered marketplace in Libreville, the emphasis on the division of governmental powers, the exaltation of checks and balances, the advocacy for a pluralistic society, the endorsement of an independent media, the arrangement for the rotation of political parties, and the formalization of lobbying practices, which depend on a semi-transparent bidding process to moderate the cost of capital's influence on political figures.
DeepL的机器翻译继续保留“Libreville field”这个错误翻译,有趣的是,ChatGPT试图修改这个翻译,加入了“marketplace”,但仍然没有脱离机翻结果的基础(足以见得第一稿保证正确多么重要)。DeepL的翻译明显过于直译,并不算通顺。
ChatGPT版本通过增加连接词和逗号,提高了句子的流畅性;使用了更加正式和学术的语言,适合正式的文本或学术讨论;提供了更多的细节和解释,有助于读者更好地理解原文的意图
综合来看,DeepL机翻+ChatGPT译后编辑的版本更加准确、正式和详细。
如果想要看多几段的文本比较,可以下载文件

思考

翻译要被替代了?

自从各类机器翻译和AI翻译工具问世之后,“人工翻译即将被替代”的说法就甚嚣尘上。我个人并不这么认为。在我看来,机器翻译和AI翻译工具的问世,就像计算器的问世。计算器替代的是算盘、纸笔计算,但它并未也很难替代数学家。机器翻译和AI翻译工具替代的,也许是纸质词典和初步的语料库检索、平行语料检索工具,但它未必也很难替代翻译员。
机器翻译和AI翻译工具的问世,确实在某些领域和情境下提高了翻译效率,尤其是在处理大量、重复性高的文本翻译任务时。然而,人工翻译在很多方面仍然具有不可替代的优势。人工翻译能够更深刻地理解原文的文化背景和语境,从而提供更准确、更符合目标语言习惯的翻译。人工翻译在处理具有创造性、需要灵活运用语言的文本时,如文学作品、广告文案等,通常能提供更高质量的翻译。人工翻译能够更好地捕捉和传达原文的情感和语气,而机器翻译在这方面往往难以做到。对于结构复杂或含义模糊的文本,人工翻译能够更好地理解其含义,并提供合适的翻译,而机器翻译可能会产生错误或不准确的翻译。对于需要保密或定制化服务的翻译任务,人工翻译仍然是首选。
还有一个网上流传的段子“AI没办法背锅”。

ChatGPT类大语言模型的幻觉

本文进行测试的文本出现了一个特别有趣的现象,就是ChatGPT在文章标题翻译上出现严重“幻觉”。
中文标题
社会主义国家应该如何管理资本
DeepL翻译标题
How socialist countries should manage capital
DeepL翻译+ChatGPT-4译后编辑标题
Socialist nations ought to administer capital with stringent regulatory oversight and equitable distribution to ensure that the collective needs of the society are met while maintaining the principles of socialist ideology.
ChatGPT类的大语言模型有“补足内容”的强迫症。当它看到“How socialist countries should manage capital”这句话的时候,它不会觉得这是一个文章的标题,而是会把它当成是供它“补足”的线索,然后开始按照给定的Prompt进行长篇大论。
这个现象在一定程度上可以通过优化Prompt进行微调,但难以完全避免。
这从另一个侧面说明,人工翻译是没办法被替代的,即便通过大语言模型进行译后编辑,翻译的“最后一公里”仍然需要人工翻译进行把关。

成本

本文使用到的各类工具的成本如下:
Trados:现在已经有订阅制的Trados Freelance了,一年400美元。
notion image
DeepL的API:免费版每个月50万字符上限。
notion image
ChatGPT的第三方API:aihubmix.com的定价与OpenAI一致,但是我们能享受汇率优惠。
notion image
比较直观一点,我使用ChatGPT-4模型翻译了四五段,总共花了0.07美元:
notion image
Custom.MT:免费版每个月上限1万字符(characters),付费版是25欧元起跳。
notion image

结语

文章介绍了如何使用Trados插件整合DeepL和ChatGPT进行翻译工作,详细解释了注册Custom.MT账号,配置DeepL和ChatGPT,创建模板和安装Trados插件的步骤。文章还对比了DeepL机翻和DeepL机翻+ChatGPT译后编辑的翻译效果,并讨论了人工翻译是否会被机器翻译替代的问题,作者认为人工翻译在很多方面仍具有不可替代的优势。
在全球化的浪潮中,我们迎来了译者的黄金时代。随着互联网的普及和文化多元化的深入人心,现代技术,如机器翻译和AI工具,为译者提供了前所未有的辅助,使我们能够更高效地工作和产出,连接不同的文化和人群。现在可以说是译者最好的时代。
希望本文对各位同行有帮助。
相关文章
准备放弃用微信读书读英文书育儿思辨:孩子的学习,家长的角色与期待
Loading...
TZ
TZ
阅尽千帆终执手,此心安处是吾乡
最新发布
振臂高呼GPT必应
2025-2-3
将剑桥英英词典加入Alfred快捷搜索
2025-2-3
【转载】美国霸权的衰落
2025-2-2
将Perplexity加入Alfred快捷搜索
2025-2-1
五行旺衰
2025-1-30
正视中美差距
2025-1-30
2017-2025TZ.

阅千帆 | 阅尽千帆终执手,此心安处是吾乡

Powered byNotionNext 4.8.3.