從“人工翻譯”到“人機共譯”, 生成式AI時代百度如何為翻譯留下新注解?
智東西
作者 | 程茜
編輯 | 漠影
ChatGPT風靡,它展現(xiàn)出來的能力讓一些崗位面臨危機感,內(nèi)容創(chuàng)作工作者首當其沖。這之中,翻譯人員作為典型的文字工作者,如何在大模型時代快速擁抱技術,變“恐懼”為動力?AI的颶風會顛覆翻譯行業(yè)嗎?
智東西4月3日報道,今天下午,在2023中國翻譯協(xié)會年會上,首屆全國翻譯技術大賽正式啟動。前沿技術突飛猛進的當下,翻譯工作者的工作模式發(fā)生了“翻天覆地”的變化。
“首屆全國翻譯技術大賽”正式啟動
大賽由中國外文局、全國翻譯專業(yè)學位研究生教育指導委員會指導,中國翻譯協(xié)會、中國外文局翻譯院、大連外國語大學主辦,百度翻譯作為承辦單位之一。
作為首個如此高規(guī)格的全國翻譯技術大賽,與此前的翻譯比賽不同,本次大賽聚焦譯后編輯能力考查。除了以選手的翻譯結(jié)果好壞作為評判標準外,本次比賽還會以百度智能文檔翻譯平臺相關技術和產(chǎn)品為工具,增加了對選手使用機器翻譯技術的評判。
當下誕生的文心一言、ChatGPT等生成式AI產(chǎn)品背后都是依靠深度學習技術和大模型技術的發(fā)展,這些技術和產(chǎn)品正在對各行各業(yè)產(chǎn)生各種各樣的深刻影響,翻譯行業(yè)同樣如此,前沿技術正在改變這一行業(yè)的工作范式, 科技賦能翻譯行業(yè)、賦能國家翻譯能力建設已是大勢所趨,“人機共譯”創(chuàng)新工作模式亦是中國超500萬譯者需要重點關注的趨勢。
一、AI技術+翻譯的平衡點,人機共譯成為趨勢
前有能聊天、能撰稿、能翻譯、輔助創(chuàng)作的先進生產(chǎn)力工具ChatGPT、文心一言,后有微軟、谷歌將大型語言模型集成至辦公全家桶,內(nèi)容創(chuàng)作工作者的工作方式正在被重塑。這也讓很多打工人發(fā)出疑問,“未來,我的工作會不會被AI替代?”。
與此同時,機器翻譯技術的進步一直與翻譯人員是否會被取代如影隨形,毋庸置疑,隨著技術的進步,機器翻譯的效果會越來越趨向于專業(yè)人士翻譯的高質(zhì)量內(nèi)容,但與專業(yè)的翻譯人員相比,在短期內(nèi)這種差距不會消失。
在這一背景下,一個關鍵問題擺在翻譯行業(yè)面前,機器翻譯和純?nèi)斯しg的模式應該如何共存?回答這個問題,我們需要從目前這兩種翻譯模式的優(yōu)缺點說起。
純?nèi)斯しg的優(yōu)勢在于翻譯的流暢度、還原度都有較高保障,但相比于“以秒為單位速出結(jié)果”的機器翻譯來說,人工翻譯的時間成本更高,再加上前沿技術的發(fā)展誕生了越來越多的各行各業(yè)專業(yè)名詞,翻譯人員的學習壓力也進一步加重。
因此,機器翻譯技術的極速發(fā)展給人工翻譯帶來了一定緊迫感。
另一方面,機器翻譯除耗時短外,還能通過模型自學習涵蓋不同行業(yè)的專業(yè)知識,對于新信息的接收速度更快。不過,人們對于機器翻譯的不信任感仍然存在,且有大量實際研究證明,機器翻譯對于語言中的情感理解、文字組織能力都有一定欠缺。
綜合來看,純?nèi)斯しg與機器翻譯可以實現(xiàn)優(yōu)勢互補,人機共譯的新翻譯模式應運而生。
這種翻譯模式的出現(xiàn),不僅革新了翻譯人員的工作模式,也給翻譯行業(yè)提出了新的注解,其在機器翻譯與人工翻譯之間找到了一個更好的平衡點,合理運用前沿技術的基礎上保證翻譯的質(zhì)量。
由此可見,諸如機器翻譯等前沿技術的發(fā)展并不是一定要顛覆整個翻譯行業(yè),而是轉(zhuǎn)變成輔助人工的生產(chǎn)力工具,作為一種能有效提升人工效率的存在。
二、百度智能文檔翻譯平臺化身先進生產(chǎn)力工具
翻譯行業(yè)從業(yè)者工作模式的變革,必然伴隨著工具的進一步革新。
以此次大賽為例,百度翻譯為大賽提供翻譯技術和比賽平臺支持,參賽選手采用百度智能文檔翻譯平臺提供的技術和服務,這一平臺是以機器翻譯為核心的新一代智能自學習文檔翻譯平臺,可謂是人機共譯工作范式下的工具集大成者。
首屆全國翻譯技術大賽官網(wǎng)-百度智能文檔翻譯平臺
人機共譯模式下,翻譯人員做的工作更像是成為機器翻譯文本的編輯,因此,人機共譯模式不僅要考察機器翻譯能力,更為重要的是人與機器的協(xié)作是否流暢、便捷。
1、囊括4萬+個翻譯方向,能化身各行業(yè)“翻譯專家”
百度智能文檔翻譯平臺支持全球200多個語言互譯、超4萬個翻譯方向,并且擁有學術、新聞、生物醫(yī)藥、金融財經(jīng)等多個專業(yè)領域翻譯模型,使得翻譯效率提升100% ,在專業(yè)領域該平臺的翻譯準確率超過90%。
當在翻譯平臺上傳關于學術期刊和機器人研究的相關文章時,百度智能文檔翻譯平臺的翻譯速度并沒有受到文章翻譯類型等影響。在描述“軟體機器人模擬毛蟲運動方式”時,其文字部分使用短句將英文中的長句分開,更符合中文的閱讀習慣。
上為“機器人”相關PDF文件,下為“學術論文”研究相關Word文件
2、支持多類型文檔上傳,支持實時編輯+格式一比一對應
該平臺對于上傳的文檔限制較小,支持Word、Excel、PPT、PDF等多種格式文檔。
進入翻譯工作臺后,該平臺會為用戶提供整頁預覽和逐句對照兩種模式,右上角會有編輯譯文與導出按鈕,方便翻譯人員對其中部分措詞進行修改、完善。
并且對于PDF版本的學術論文,其譯文界面還會完全對照原文的格式。
3、6大一級領域+40個二級領域,權(quán)威高效的專業(yè)術語
還有一點與其他翻譯工具不同的是,這一平臺內(nèi)置了百度翻譯術語庫和全國名詞委術語庫。在提交文檔界面,該平臺會為用戶提供“術語提示”功能,其中包含工程科學、基礎科學、生物醫(yī)藥等6個一級領域及40個二級領域,基本覆蓋有翻譯需求的不同行業(yè)。
翻譯人員遇到更為前沿的學科內(nèi)容或不熟悉的技術領域時,這一工具可以為翻譯人員提供相關參考,省去翻譯人員額外檢索查證的時間。
即使前期沒有選擇相應“術語參考”領域,智能文檔翻譯平臺也會根據(jù)用戶劃詞的內(nèi)容去定位相應行業(yè)。
4、機翻+譯后+自學習,翻譯助手“專業(yè)性”漸趨人類
如一些專有名詞通常在論文中會有英語簡寫表述,但很多情況下這些專有名詞在不同行業(yè)中的意義完全不同。以GPT這個詞為例,在AI領域其意義是文本生成模型,而在醫(yī)藥領域GPT是谷丙轉(zhuǎn)氨酶。
比如,如果翻譯人員有特定研究領域,且相關專有名詞有一定的重復性,在編輯譯文的過程中,智能文檔翻譯平臺還會根據(jù)用戶修改的譯文進行自學習,并在之后的翻譯文件中優(yōu)化翻譯結(jié)果,使得機器翻譯的結(jié)果與理想譯文不斷趨近。
綜上所述,百度智能文檔翻譯平臺將機器翻譯(MT)、譯后編輯(PE)、模型自學習納入其翻譯體系,能夠大幅提升人機共譯模式的工作效率及效果。
百度智能文檔翻譯平臺與人工翻譯、機器翻譯兩種模式的契合,使其成為人機共譯時代的“重量級”先進生產(chǎn)力工具。
三、十余年AI全棧技術布局,深度學習、大模型提升機翻流暢、準確度
從更宏觀的角度來看,機器翻譯概念誕生至今已經(jīng)超過70個年頭,隨著深度學習及大模型技術的發(fā)展,這一技術的產(chǎn)業(yè)化格局正在被重塑。
此次2023中國翻譯協(xié)會年會4月4日的翻譯技術主題論壇上,百度翻譯還將聯(lián)合中國外文局翻譯院、中國翻譯協(xié)會翻譯技術委員會共同發(fā)布《2023機器翻譯技術及產(chǎn)業(yè)應用藍皮書》。
《2023機器翻譯技術及產(chǎn)業(yè)應用藍皮書》
技術的發(fā)展正在為翻譯行業(yè)注入新鮮血液,隨著機器翻譯技術的不斷變革,主流機器翻譯方法也在不斷迭代。在深度學習技術發(fā)展的背景下,能模擬人類翻譯過程的神經(jīng)網(wǎng)絡機器翻譯出現(xiàn),2015年百度發(fā)布全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡機器翻譯系統(tǒng),使得翻譯效果在語言表示、語義理解和譯文生成等方面都有顯著提升。
面向未來,正如藍皮書所說,以ChatGPT、文心一言(ERNIE Bot)為代表的新一代預訓練模型技術在語言理解與生成,特別是低資源、長篇章以及多模態(tài)的場景應用中表現(xiàn)出強大能力和發(fā)展?jié)摿Γc人的互動性和反饋學習能力不斷增強。
因此,機器翻譯在當下已經(jīng)呈現(xiàn)出強大的產(chǎn)業(yè)化生命力。該技術在企業(yè)智能化升級、行業(yè)數(shù)字化建設等場景中的應用正在不斷普及。以中石化全球戰(zhàn)略為例,百度企業(yè)級智能翻譯平臺可以支持其全球化戰(zhàn)略的龐大翻譯需求。
百度智能文檔翻譯平臺應用場景示意
這背后,離不開百度在深度學習與機器翻譯領域的前瞻布局。
追溯至2010年,彼時深度學習仍處于發(fā)展初期,百度就已經(jīng)開始布局深度學習,并于3年后建立全世界首個深度學習研究院(IDL)。今年2月,全球市場調(diào)研機構(gòu)IDC發(fā)布的數(shù)據(jù)顯示,2022年下半年,百度已經(jīng)穩(wěn)居中國深度學習平臺市場綜合份額第一。
在機器翻譯領域,百度十余年來在多語言機器翻譯、神經(jīng)網(wǎng)絡機器翻譯、跨模態(tài)機器翻譯等方面持續(xù)突破。目前,百度翻譯已形成核心技術領先、產(chǎn)品矩陣豐富、產(chǎn)業(yè)應用廣泛的發(fā)展生態(tài)。
當下,大模型和生成式AI時代的到來,正在為機器翻譯留下新的注解。
與此同時,機器翻譯的技術變革帶來的應用擴展,也為翻譯人員提出了更高的要求。可以看出,前沿技術的突破是不可逆轉(zhuǎn)的發(fā)展趨勢,作為翻譯工作者如何在當下?lián)肀把丶夹g,找到平衡點,是置身于行業(yè)中的工作人員與掌握前沿科技的科技大廠都需要關注的事情。
結(jié)語:機器翻譯技術、應用大飛躍,為翻譯行業(yè)開辟新賽道
人機共譯已經(jīng)成為當下翻譯行業(yè)從業(yè)者的趨勢,隨著機器翻譯在翻譯質(zhì)量、系統(tǒng)性能、實用性、規(guī)模化應用等方面均取得了較大飛躍,與人工翻譯的契合度越來越高。
與此同時,技術的發(fā)展與進階中,勢必會對各行各業(yè)產(chǎn)生影響,這一背景下,翻譯工作者更快擁抱前沿技術,并將其化身為真正的生產(chǎn)力工具才能在前沿技術發(fā)展的浪潮中站穩(wěn)腳跟。
隨便看看:
- [數(shù)據(jù)]融資丨「ZDNS」完成億元C輪融資,中科院資本、新鼎資本領投
- [數(shù)據(jù)]Android 15新功能!手機關機也能定位谷歌Pixel
- [數(shù)據(jù)]2024年夏季游戲節(jié)將于6月7日舉行 預計大型游戲?qū)l(fā)布重大
- [數(shù)據(jù)]魅族20 “定勝青”配色,你喜歡嗎?#魅族20
- [數(shù)據(jù)]小米14 Lite獲得印度BIS認證 可能很快推出
- [數(shù)據(jù)]新產(chǎn)品 新場景 新生活 家電“新物種”助推消費煥新升級
- [數(shù)據(jù)]企云方全面預算系統(tǒng):財務智能引領企業(yè)戰(zhàn)略規(guī)劃
- [數(shù)據(jù)]2022中國大陸半導體廠商排名:長江存儲第三 海思第六#科技
- [數(shù)據(jù)]海信S59系列AI遠場語音控制智能電視上市 售價2999元起
- [數(shù)據(jù)]一加Nord CE 2于2024年3月獲得OxygenOS
相關推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件