小朋友你是否有很多問號?疫情期間不打游戲卻在背ABC,百度翻譯日活同比增長40%
曉查 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
新冠疫情讓學(xué)生們經(jīng)歷了一個最長的寒假。同樣是學(xué)生,可能經(jīng)歷的是不同的寒假。
游戲公司今年第一季度的收入創(chuàng)下新高,還有學(xué)生集體給在線課堂App打一星。
就在我以為學(xué)生大多數(shù)都在家里打團(tuán)戰(zhàn)上分的時候,另一個數(shù)據(jù)驚到了我,“后浪”們遠(yuǎn)比想象中更好學(xué)。
百度最近公布了一個數(shù)據(jù):百度翻譯2020年第一季度DAU(日活躍用戶)同比增長40%,環(huán)比增長10%。
我腦海里不禁浮現(xiàn)了周董的歌詞:
“小朋友你是否有很多問號?為什么別人在玩游戲,我卻靠在墻壁背我的ABC?!?/p>
這說明不僅用戶相比去年大幅增加,相比疫情爆發(fā)前,大家更愛學(xué)習(xí)了?
這不可能??!帶著這樣的疑惑,我查閱了應(yīng)用商店里的幾大主流翻譯App,全部都是4.5星以上的好評。
可能是疫情期間沒法接受老師面對面輔導(dǎo),現(xiàn)在只能用AI翻譯軟件來代替了吧??墒怯心敲炊嗝赓M翻譯軟件,為什么大家在疫情期間紛紛選擇了百度翻譯?
為什么是百度翻譯
打開百度翻譯的更新記錄,我似乎明白了。
因為新冠疫情,很多公司都放慢了軟件開發(fā)的腳步,更著重于bug修復(fù)這樣的常規(guī)升級,功能性升級幾乎沒有。
而百度翻譯是唯一一個在疫情期間進(jìn)行重大更新的翻譯軟件,從8.3.0一路升級到8.5.2。
連李彥宏看了更新內(nèi)容,也親自發(fā)文感嘆技術(shù)的進(jìn)步:只有機器才有可能同時會200種語言。
百度翻譯從8.5.0版開始,加入的新功能有:
【200種語言】率先支持全球200種語言互譯!助你暢游全球;【考試大數(shù)據(jù)】新增中高考、四六級單詞考點大數(shù)據(jù),考頻統(tǒng)計、題型分布、真題例句解析,你想了解的這都有;【AI詞典】視頻講解單詞,跟讀評測打分,個性化考試資源,全新查詞體驗;【同聲傳譯】機器同傳震撼來襲!實時上屏,即說即譯;【中英自由說】語音翻譯新增中英混合識別,無縫自由切換!
尤其是第二項更新,因為今天疫情的特殊原因,讓學(xué)生的英語學(xué)習(xí)被耽擱。時間不等人,中學(xué)生在畢業(yè)生面對升學(xué)壓力,學(xué)習(xí)英語的需求更強了。
所以百度翻譯在App中增加了面向?qū)W生群體的單詞考頻及題型大數(shù)據(jù),單詞講解及情景演繹小視頻,根據(jù)用戶興趣推薦內(nèi)容,AI互動跟讀評測,每日跟讀等功能。
今年還增加了針對四六級、高考等考試大數(shù)據(jù)。高考題庫更是放在了顯眼位置,方便考試在查單詞的時候查閱題庫,加深印象。
此外,百度翻譯還加強了語音、圖像AI能力,提供從口語測評功能,對發(fā)音進(jìn)行跟讀打分并提供智能發(fā)音糾錯能力,提升學(xué)生口語水平。
拍照翻譯能力讓學(xué)生在閱讀英文文章時能快速查詢單詞,提高學(xué)習(xí)效率。
也是因為這個原因,百度翻譯能在行業(yè)大勢放緩的環(huán)境下實現(xiàn)用戶的增長。應(yīng)用商店里,許多學(xué)生用戶給予5星好評。
因為引入的新功能,百度翻譯也和其他競品拉開了差距,從網(wǎng)友評論中也能看出,百度翻譯是靠人性化功能在競爭中奪取了用戶。
同時疫情背景下,高質(zhì)量醫(yī)學(xué)領(lǐng)域翻譯、防疫經(jīng)驗分享等翻譯需求激增。百度的多領(lǐng)域翻譯技術(shù),采用預(yù)訓(xùn)練+精細(xì)化訓(xùn)練、以及領(lǐng)域自適應(yīng)方法,研發(fā)了領(lǐng)域定制翻譯引擎,其中生物醫(yī)藥領(lǐng)域翻譯在抗擊疫情方面發(fā)揮了重要作用。
這也是百度翻譯在疫情期間用戶激增的另一個重要原因。
百度翻譯的技術(shù)優(yōu)勢
僅有功能更新還不足以讓用戶好評,一款翻譯軟件好不好才是關(guān)鍵所在,機器翻譯得好不好關(guān)鍵在于背后的自然語言處理(NLP)技術(shù)。
這一點,百度應(yīng)該更有發(fā)言權(quán),近年來在NLP上的進(jìn)步有目共睹。
百度2015年率先在世界上發(fā)布了互聯(lián)網(wǎng)NMT系統(tǒng),引領(lǐng)機器翻譯進(jìn)入神經(jīng)網(wǎng)絡(luò)翻譯時代,曾獲得國家科技進(jìn)步二等獎,中國電子學(xué)會科技進(jìn)步一等獎,還在2019年在國際權(quán)威機器翻譯評測WMT2019獲得中英翻譯第一名。
歷經(jīng)4年多的積累與優(yōu)化,百度翻譯質(zhì)量更優(yōu),文本、拍照、語音、離線翻譯均已替換成全新系統(tǒng)。
去年,百度提出的知識增強語義表示模型ERNIE 2.0在16項中英文任務(wù)表現(xiàn)超越谷歌的BERT和XLNet。
先進(jìn)的NLP技術(shù)和中文數(shù)據(jù)資源加持,讓百度翻譯在中英翻譯的體驗上超過國外同類軟件。
李彥宏感慨機器能懂200種語言,然而機器能做到這一點,卻相當(dāng)不容易,因為除去大語種,大部分語言的互譯資源是稀缺的,無法供AI學(xué)習(xí)足夠多的知識。
憑借20年在搜索上的積累,百度通過從互聯(lián)網(wǎng)上挖掘多語言數(shù)據(jù),并采用回譯技術(shù)進(jìn)行數(shù)據(jù)增強,在一個季度內(nèi)將翻譯的語種擴充了近7倍,讓百度神經(jīng)機器翻譯(NMT)成為全球支持語種數(shù)量最多的翻譯系統(tǒng)。
百度這么做,一方面是照顧被忽視的小語種用戶,另一方面也是保護(hù)稀缺語言不徹底消失,秉承技術(shù)向善。
百度CTO王海峰曾表示,機器翻譯經(jīng)歷了70年的發(fā)展,已經(jīng)實現(xiàn)質(zhì)量飛躍,從科幻理想落地現(xiàn)實應(yīng)用。
又比如這次重點推出同聲傳譯功能,其實王海峰帶領(lǐng)的團(tuán)隊早在2018年就發(fā)表了論文,讓同聲傳譯低時延、高質(zhì)量,接近人類水平,當(dāng)時在國外技術(shù)論壇上引起不小的轟動。
如今經(jīng)過兩年的技術(shù)迭代,這項技術(shù)已經(jīng)趨于成熟,成功應(yīng)用于數(shù)十場大型國際會議,伴隨翻譯App飛入尋常百姓家。
百度還將聯(lián)合谷歌、Facebook、清華大學(xué)等國內(nèi)外機構(gòu),在7月份在領(lǐng)域頂級會議ACL舉辦首屆同傳研討會,共同推進(jìn)AI同聲傳譯技術(shù)的發(fā)展。
同時,百度開放了全球首個面向真實場景的中英文同傳數(shù)據(jù)集,并舉辦首屆同傳評測,促進(jìn)本領(lǐng)域技術(shù)發(fā)展。
疫情改變教育方式
這一次,百度翻譯App的增長,讓我們看到疫情正在悄悄改變生活方式。
過去地域、經(jīng)濟的不平衡讓一些孩子能獲得更多教育資源,AI技術(shù)的出現(xiàn)讓英語教育資源的成本大大降低。
因為疫情,讓學(xué)生更多地通過互聯(lián)網(wǎng)技術(shù)來學(xué)習(xí)知識,在線教育更普及。通過百度App,我們才意識到,原來AI技術(shù)已經(jīng)可以成熟地用在英語教育里。
新冠疫情反而沒有讓學(xué)生放松學(xué)習(xí),如果沒有AI技術(shù),我們很難想象教育水平的差異會擴大到什么程度,現(xiàn)在AI技術(shù)讓每個人都能公平地接觸到海量教育資源,百度在內(nèi)的一眾翻譯軟件開發(fā)商真是做了件大大的好事。