挪開大數(shù)據(jù),大內(nèi)容就在這里
Date: 2019-06-29 19:34:55Source: 志遠翻譯
在過去十年的大部分時間里,大數(shù)據(jù)是一種技術(shù)現(xiàn)象,而不是其他任何一種技術(shù)現(xiàn)象,企業(yè)試圖利用這種技術(shù)為自己謀利。人們在網(wǎng)絡(luò)生活中每天采取的成千上萬的行動可以被用來定位廣告,識別趨勢,甚至預(yù)測行為,這是一個誘人的想法。市場營銷部門和整個公司都以數(shù)據(jù)作為“21 世紀的石油”為前提。
這些公司挖掘了我們的搜索歷史,我們的瀏覽行為和我們的上網(wǎng)習(xí)慣,其中一些公司通過銷售或使用它來瞄準他們的市場獲得了巨大的利潤。
現(xiàn)在又出現(xiàn)了一種新的現(xiàn)象。最近的數(shù)據(jù)濫用丑聞使大數(shù)據(jù)運動黯然失色,將行業(yè)重點轉(zhuǎn)移到了一個更可持續(xù)的模式上:走進這些宏大的內(nèi)容里。
想想互聯(lián)網(wǎng)有多大。它真的很大。有 550 億個網(wǎng)頁。如果每一頁都有 100字,那就是 5.5 萬億字。這可能是一個保守的估計。顯然,并非所有這些內(nèi)容對擁有這些內(nèi)容的公司都有用。這些頁面中有許多包含填充語、文本或法律術(shù)語。從大內(nèi)容的角度來看,真正讓營銷人員感興趣的頁面是那些可以被收獲并對數(shù)據(jù)分析人員有用的頁面。那么,什么是“大內(nèi)容”?讓我們把電子商務(wù)的產(chǎn)品描述和評論作為最好的例子在這里,有數(shù)以百萬計的產(chǎn)品在互聯(lián)網(wǎng)上銷售,他們每一個都需要一個良好的書面描述,以有效地銷售。同樣,這些產(chǎn)品中的絕大多數(shù)都在站點上提供了一個或多個客戶評論。如果他們是信息和明確,他們可以幫助買家作出自己的決定,也可以幫助零售商采取任何反饋在船上。所有這些都是與特定產(chǎn)品相關(guān)的內(nèi)容。
因此,有許多有用的內(nèi)容,但你如何處理這些信息,現(xiàn)在它是現(xiàn)成的?現(xiàn)在我們知道所有這些信息都存在,我們確定為一個 語言服務(wù)提供商,它很可能在某一點上需要多種語言,要在多個國家/地區(qū)銷售產(chǎn)品,就需要本地化。然而,所涉及的龐大字數(shù)排除了傳統(tǒng)的每天 2000 字的翻譯方法,因為這太費時了。
這就是機器翻譯譯后編輯 (MTPE) 和眾包的用武之地。有效處理如此大量內(nèi)容的一種行之有效的方法是大規(guī)模機器翻譯,并使用大量經(jīng)過審查的語言學(xué)家對其進行后期編輯并優(yōu)化其對讀者的影響。在工業(yè)中,使用 NMT 正迅速成為一種普遍現(xiàn)象。然而,仍然有陷阱與機器轉(zhuǎn)換和準確性仍然是問題。這就是我們引入人的元素以確保質(zhì)量的地方。但是,由于“大內(nèi)容”項目中的字數(shù)太多,采用眾包策略是加快這一過程的一種快速而有效的方法。通過吸引多種語言,并為他們提供成為成功的后編輯所需的培訓(xùn)和知識,我們可以產(chǎn)生更快的、有質(zhì)量保證的結(jié)果。
這就是為什么眾包仍然是 Joncker 和整個行業(yè)的一個重要焦點,在大內(nèi)容時代,這種方法顯然是唯一可持續(xù)的解決方案之一。
翻譯公司
- 上一篇:來自同齡人的力量
- 下一篇:品牌或產(chǎn)品全球化不再是新概念