2011年,百度正式推出百度翻譯,入主在線翻譯。從2011年6月百度翻譯上線以來,憑借“翻譯質(zhì)量、產(chǎn)品功能、使用體驗(yàn)”等方面的優(yōu)勢(shì),備受用戶認(rèn)可,在翻譯領(lǐng)域后來居上。最新數(shù)據(jù)顯示,百度每天還響應(yīng)著300余萬來自網(wǎng)頁搜索的翻譯請(qǐng)求和600余萬的詞典翻譯請(qǐng)求。此外,百度翻譯還在2011年底新上線了中日翻譯,翻譯的語言種類逐步擴(kuò)充。
不斷提升翻譯質(zhì)量 用效果贏取用戶
對(duì)于翻譯產(chǎn)品來說,翻譯的準(zhǔn)確性與否是最重要的。百度翻譯在卓越的機(jī)器翻譯技術(shù)、領(lǐng)先的語料挖掘和過濾技術(shù)、強(qiáng)大的海量計(jì)算技術(shù)、可靠的web前端技術(shù)四大領(lǐng)先技術(shù)的支撐下,取得了“后發(fā)先至”的效果。以語料發(fā)掘和過濾技術(shù)為例,百度翻譯全新的互聯(lián)網(wǎng)雙語語料挖掘技術(shù)方案,使得1000萬句對(duì)被有效過濾為更加精準(zhǔn)的400萬,從而幫助翻譯質(zhì)量得到明顯提升。
此前曾有一個(gè)試驗(yàn)評(píng)測(cè),通過選擇一個(gè)反應(yīng)用戶需求的測(cè)試集,首先人工翻譯這個(gè)測(cè)試集的每個(gè)句子,得到多個(gè)人工翻譯結(jié)果,然后機(jī)器翻譯結(jié)果和人工翻譯結(jié)果比較,得分越高(BLEU值,0至1之間),翻譯質(zhì)量越好。在這方面,百度翻譯全面領(lǐng)先競(jìng)爭(zhēng)對(duì)手,尤其在口語翻譯方面,優(yōu)勢(shì)更為明顯。
和試驗(yàn)測(cè)評(píng)一樣,在實(shí)例翻譯中百度翻譯也有著更加精準(zhǔn)的翻譯效果,尤其是在有明顯中國(guó)特色的成語、俗語、網(wǎng)絡(luò)流行語等方面。以“好好學(xué)習(xí)天天向上、有木有、我勒個(gè)去、神馬都是浮云”等為例,百度翻譯的翻譯結(jié)果分別是“Study hard and make progress every day、Yes or no、What the hell、Everything is nothing”,翻譯內(nèi)容可靠。
不僅如此,百度翻譯還在細(xì)節(jié)方面不斷優(yōu)化和提升,“投訴功能”讓每一個(gè)意見和建議都能得到及時(shí)回復(fù);“雙語對(duì)照查看”,更加符合本土用戶的閱讀習(xí)慣;“分享收藏”則順應(yīng)了社交時(shí)代的發(fā)展趨勢(shì)。
領(lǐng)先的研發(fā)團(tuán)隊(duì) 兼具國(guó)際視野與本土執(zhí)行
在百度翻譯領(lǐng)先的產(chǎn)品質(zhì)量和翻譯效果的背后,是一支兼具國(guó)際視野與本土執(zhí)行的高戰(zhàn)斗力研發(fā)團(tuán)隊(duì)。
據(jù)了解,百度翻譯研發(fā)團(tuán)隊(duì)組建于2010年初,從最初的3名正式員工加上一個(gè)實(shí)習(xí)生的“編制”,不斷發(fā)展壯大成為了由世界級(jí)機(jī)器翻譯專家王海峰博士和吳華博士領(lǐng)銜,同時(shí)擁有眾多在機(jī)器翻譯、語料發(fā)掘、海量計(jì)算、Web前端技術(shù)等領(lǐng)域掌握核心技術(shù)、有著多年實(shí)戰(zhàn)經(jīng)驗(yàn)的“精英團(tuán)隊(duì)”。
以王海峰博士為例,作為百度基礎(chǔ)技術(shù)首席科學(xué)家,王海峰博士多年以來一直致力于搜索、自然語言處理、機(jī)器翻譯、語音技術(shù)、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、推薦及個(gè)性化等領(lǐng)域的研發(fā),其研究成果大量應(yīng)用于眾多廣泛使用的產(chǎn)品中,也發(fā)表過大量一流國(guó)際期刊論文及頂級(jí)國(guó)際會(huì)議論文,并申請(qǐng)了中國(guó)、美國(guó)及日本等多個(gè)國(guó)家專利20余項(xiàng)。而且王海峰博士還是頂級(jí)國(guó)際學(xué)術(shù)組織ACL(The Association for Computational Linguistics)50年歷史上唯一當(dāng)選副主席的華人。
頂級(jí)的領(lǐng)軍人物和強(qiáng)悍骨干成員,讓百度翻譯團(tuán)隊(duì)不僅具備國(guó)際化的視野格局,同時(shí)還擁有本地化的執(zhí)行能力,這些保證了百度翻譯在不借助于任何外力和資金的情況下,完全依靠自主研發(fā)和自有技術(shù),在短短一年的時(shí)間內(nèi),就推出了有著優(yōu)異表現(xiàn)的高質(zhì)量翻譯產(chǎn)品。 |