語(yǔ)言對(duì)翻譯、機(jī)器翻譯與人工翻譯以及困境
Date: 2019-07-12 09:56:18Source: 志遠(yuǎn)翻譯
一種語(yǔ)言被翻譯成另一種語(yǔ)言時(shí),就形成了語(yǔ)言對(duì)。英語(yǔ)被翻譯成西班牙語(yǔ)時(shí),就會(huì)稱為和英語(yǔ)-西班牙語(yǔ)語(yǔ)言對(duì)。如果能夠以相反的方式翻譯信息,就會(huì)創(chuàng)建第二語(yǔ)言對(duì):西班牙語(yǔ)-英語(yǔ)語(yǔ)言對(duì)。語(yǔ)言對(duì)允許信息從一種語(yǔ)言(源語(yǔ)言)共享和傳輸?shù)搅硪环N語(yǔ)言(目標(biāo)語(yǔ)言)。
世界上大約有 6500 種語(yǔ)言。如果每一種語(yǔ)言都有一個(gè)語(yǔ)言對(duì),那么它們的數(shù)量將超過 3600 萬。如果您把使用人數(shù)少于 1000 人的 2000 種語(yǔ)言排除掉,那么您就把必要的語(yǔ)言對(duì)減少到了 2000 多萬。雖然這是一個(gè)偉大的目標(biāo),但開始的時(shí)候最好是針對(duì)目前互聯(lián)網(wǎng)上使用的 1500 種語(yǔ)言。關(guān)注這 1500 種語(yǔ)言,潛在的語(yǔ)言對(duì)就會(huì)減少到 225 萬對(duì)。
按使用人數(shù)排序,世界上排名前十的語(yǔ)言是法語(yǔ)、馬來印度尼西亞語(yǔ)、葡萄牙語(yǔ)、孟加拉語(yǔ)、阿拉伯語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、印度斯坦語(yǔ)、英語(yǔ)和漢語(yǔ)普通話。如果把這些語(yǔ)言和其他 1490 種常用的語(yǔ)言結(jié)合起來使用,就需要3 萬多對(duì)語(yǔ)言。如果這些主要語(yǔ)言都有彼此的樞軸,那么仍然需要不到 30萬種語(yǔ)言對(duì)才能將其本地語(yǔ)言提供給互聯(lián)網(wǎng)上 99% 的用戶。
為什么這很重要?一直以來,商業(yè)研究就有證明,消費(fèi)者更有可能購(gòu)買以其母語(yǔ)呈現(xiàn)的產(chǎn)品并且閱讀其相關(guān)信息。
世界上有超過 20 億人,但是,根據(jù)戴維·克里斯特爾著作的《英語(yǔ)作為一門全球語(yǔ)言》一書,只有大約 4 億人把英語(yǔ)作為第一語(yǔ)言,另有 6 億人把英語(yǔ)作為第二語(yǔ)言。這表明世界上超過一半的人口,即超過 10 億的人不會(huì)說英語(yǔ)。這是一個(gè)巨大的市場(chǎng),如果您的信息只以英語(yǔ)呈現(xiàn),您將無法接觸這些市場(chǎng)。
機(jī)器翻譯和總體語(yǔ)言對(duì)
幾十年來,計(jì)算機(jī)一直被用來創(chuàng)建術(shù)語(yǔ)庫(kù)和翻譯記憶數(shù)據(jù)庫(kù)。隨著計(jì)算速度的提高、翻譯算法的進(jìn)步,收集數(shù)據(jù)所花費(fèi)的時(shí)間大大減少,計(jì)算機(jī)翻譯的進(jìn)步呈指數(shù)級(jí)增長(zhǎng)。
術(shù)語(yǔ)庫(kù)從一種語(yǔ)言中提取單個(gè)單詞,并將其直接翻譯成另一種語(yǔ)言中的字面對(duì)等詞。翻譯記憶庫(kù)是一個(gè)將文本片段(獨(dú)特的短語(yǔ)、習(xí)語(yǔ)或概念等)與等效翻譯相匹配的數(shù)據(jù)庫(kù)。這不僅保證了您的文本的連貫性,也保證了所有翻譯文件的一致性。更好的是,由于保存了這些翻譯,未來的翻譯將會(huì)更快、更便宜。就速度和成本而言,您建立的術(shù)語(yǔ)庫(kù)和翻譯記憶的越多,您的項(xiàng)目就會(huì)完成得越快,您節(jié)省的錢也就越多。
使用術(shù)語(yǔ)庫(kù)和翻譯記憶進(jìn)行翻譯有兩個(gè)主要系統(tǒng):基于規(guī)則的系統(tǒng)和統(tǒng)計(jì)系統(tǒng)?;谝?guī)則的系統(tǒng)關(guān)注語(yǔ)法規(guī)則、術(shù)語(yǔ)的準(zhǔn)確度等。統(tǒng)計(jì)系統(tǒng)并不關(guān)注語(yǔ)言規(guī)則,而是關(guān)注分析先前翻譯的數(shù)據(jù)對(duì)中的數(shù)據(jù),以使其更加流暢。
學(xué)術(shù)論文、醫(yī)學(xué)論文等翻譯經(jīng)常需要精確性和高度的可靠性?;谝?guī)則的翻譯更適合這類文本。
機(jī)器翻譯的困境
機(jī)器翻譯可以打開以前沒能打開的翻譯市場(chǎng),同時(shí)大幅減少進(jìn)入全球市場(chǎng)所需的配對(duì)數(shù)量。使用機(jī)器翻譯的缺點(diǎn)是需要人工監(jiān)督。目前,還沒有計(jì)算機(jī)模型能夠產(chǎn)生具有人工翻譯質(zhì)量的文件。由于有太多的習(xí)語(yǔ)和口語(yǔ),太多的詞匯歧義和太多的文化差異,使得機(jī)器翻譯看起來像翻譯而不是地道的產(chǎn)品。
毫無疑問,機(jī)器翻譯正在翻譯行業(yè)留下屬于自己的印記,通過使用計(jì)算技術(shù)可以獲得的語(yǔ)言對(duì)的數(shù)量具有革命性的意義,有時(shí),您需要理解的只是信息的要點(diǎn)。在這種情況下,您可以通過使用機(jī)器翻譯從而以本地化的語(yǔ)言接觸到全球受眾。然而,如果出現(xiàn)一個(gè)錯(cuò)誤、誤解或誤判,就可能會(huì)導(dǎo)致巨大的合同損失、在文化上的重大冒犯,或者就像醫(yī)學(xué)文本的情況一,甚至導(dǎo)致出現(xiàn)生命損失。意義接近的翻譯永遠(yuǎn)不能成為好的翻譯。
對(duì)于希望向不斷擴(kuò)大的全球市場(chǎng)傳遞信息的企業(yè)來說,這個(gè)領(lǐng)域已然成熟。然而,不可忽視的是,必須意識(shí)到有一名精通源語(yǔ)言和目標(biāo)語(yǔ)言的翻譯的重要性,以確保信息準(zhǔn)確無誤,從而不會(huì)出現(xiàn)不準(zhǔn)確、錯(cuò)誤或令人感到尷尬或冒犯的內(nèi)容。
機(jī)器翻譯 人工翻譯