@科研黨,這大概是最好用的論文閱讀神器了,還免費
截屏翻譯、PDF雙語同屏對照、文獻(xiàn)搜索、寫作優(yōu)化全都有
魚羊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
這位道友,不知嗑鹽途中,你是否也有閱讀英文論文效率低下的煩惱?
作為一個arXiv天天見的英語渣,本蒟蒻反正是在挖掘論文閱讀神器的道路上不能自拔。
這不最近,就又被網(wǎng)友們種草了一款桌面翻譯軟件。
淺試一下,翻譯PDF的效果是醬嬸的:
還有逐句對照功能:
如果只是想看一眼摘要,隨手截屏就OK,同樣有中英文對照:
媽媽再也不用擔(dān)心我刪回車刪到手抽筋(手動狗頭)。
△PDF中直接復(fù)制出的文本有多余換行,影響翻譯效果
這樣的功能,來自最近更新升級的網(wǎng)易有道詞典9。有一說一,一眼看去效果確實有點頂~
進(jìn)一步翻翻有道詞典官網(wǎng),就會發(fā)現(xiàn)此番進(jìn)化,這個工具強(qiáng)調(diào)的就是提高“學(xué)術(shù)生產(chǎn)力”。
至于究竟是不是那么回事,咱們不妨一起仔細(xì)試上一試。
從論文檢索到論文寫作全流程可用
讀英文文檔,翻譯PDF是剛需。
此前,學(xué)術(shù)好幫手谷歌翻譯就有PDF文檔翻譯功能。
不過,谷歌的文檔翻譯總有那么點小毛病。
比如,容易出現(xiàn)版面錯亂的問題,導(dǎo)致你似乎每個字都能看懂,湊一起就不知道啥意思了。
舉個例子,原文的表格長這樣:
用谷歌翻譯,你會得到這樣一個文字錯位、多少有點影響理解的結(jié)果:
相比之下,有道給出的結(jié)果長這樣:
可以說在版面保持這方面,有道詞典明顯勝過一籌。
而比谷歌翻譯更加方便的是,有道詞典還有直觀的雙語對照功能。
畢竟雖然機(jī)翻能夠提高閱讀效率,但完全脫離英文原文看論文還是不太現(xiàn)實的。
相比兩個文檔來回倒這樣手忙腳亂的操作,直接同屏對照方便許多。
更妙的一點是,有道詞典此次“學(xué)術(shù)進(jìn)化”,對計算機(jī)、醫(yī)學(xué)、金融經(jīng)濟(jì)學(xué)等專業(yè)領(lǐng)域進(jìn)行了針對性優(yōu)化,能夠提升術(shù)語翻譯的準(zhǔn)確性。
還支持自定義術(shù)語表。
比如說,你發(fā)現(xiàn)文章self-attention這個詞沒有翻譯出來,可以直接選中這個詞并選擇術(shù)語矯正,將其加入到術(shù)語庫。應(yīng)用術(shù)語庫之后,有道詞典再遇上同樣的術(shù)語,就都能保持一致的翻譯。
除了把本職的翻譯工作整得更加方便準(zhǔn)確,與其他翻譯工具不同的是,有道詞典9這回甚至還打算包辦科研黨的寫論文全流程。
他們直接和ReadPaper、Aminer合作,內(nèi)置論文檢索服務(wù),官方說法是:
覆蓋40種以上專業(yè)領(lǐng)域,包含3億文獻(xiàn)資料。
△亮點自尋
搜索的過程中,也可以打開雙語對照按鈕,快速閱讀摘要。
就這還沒完,甚至在你寫論文的時候,有道詞典9也能派上用場:其“AI英文寫作批改”功能,能夠智能識別語法錯誤、提供例句參考、“母語級”句子潤色,還能自動標(biāo)注引用來源、生成參考文檔信息……
“學(xué)術(shù)”詞典背后的技術(shù)秘籍
有道詞典9這一條龍學(xué)術(shù)服務(wù),說得上是直奔科研黨心巴而來。
而這些緊貼學(xué)術(shù)需求的功能背后,技術(shù)挑戰(zhàn)也很值得說道說道。
PDF文檔翻譯:基于視覺技術(shù)的PDF解析算法
先說說最亮眼的PDF文檔翻譯功能。
PDF文檔翻譯本身是一個比較復(fù)雜的問題,涉及多個處理環(huán)節(jié),包括PDF文檔解析、Word文檔渲染、翻譯策略、翻譯結(jié)果回填等等。
尤其對于不可解析的PDF(掃描PDF)而言,頁面中的文字、矢量、圖片等要素其實都包含在同一張圖片內(nèi),無法直接解析獲得。
這時,就需要先通過OCR技術(shù),識別出其中的各種基本要素,再轉(zhuǎn)換得到可編輯的文檔。
這里面的難點在于,相較于單純的文字識別,OCR識別論文文檔任務(wù)會更重。因為不只是文字,論文中表格、圖像、公式,如果不能被精準(zhǔn)識別出來,會很容易出現(xiàn)內(nèi)容丟失、排版錯亂的問題。
此外,為了讓版面與原文保持一致,頁面的單欄、多欄、頁眉、頁腳等信息,AI都需要準(zhǔn)確判斷出來,這樣才可能在可編輯文檔中恢復(fù)出原有版面和內(nèi)容。
針對不可解析PDF,有道主要從兩個方面進(jìn)行了改進(jìn)。
文字識別方面,有道自研的OCR算法集成了業(yè)內(nèi)領(lǐng)先的文字檢測和識別模型,能達(dá)到更高的文字召回率,同時能覆蓋幾十種主要語種。
版面識別方面,采用“分而治之”的策略。
具體而言,在通過版面分析模型得到版面基本信息之后,AI會根據(jù)不同的組成結(jié)果,采取不同的提取策略。
舉個例子,在遇到以文字為主、富含表格的常見版面時,有道詞典會主要采取文字組段算法和表格分析算法來處理文檔。
而以圖像為主、背景構(gòu)成復(fù)雜的特殊版面,則原樣保留原有版面的所有要素,集中注意力處理文字,最后進(jìn)行多層疊加渲染。
除此之外,在許多細(xì)節(jié)上,有道也進(jìn)行了優(yōu)化,以使最終呈現(xiàn)給用戶的版面更加準(zhǔn)確規(guī)整。
比如文本框的透明化處理、換行符的插入規(guī)則處理等。
專業(yè)領(lǐng)域翻譯模型
前面提到,除了通用翻譯,在有道詞典9中,用戶還可以選擇醫(yī)學(xué)、計算機(jī)等專業(yè)領(lǐng)域,來進(jìn)一步提高翻譯的準(zhǔn)確性。
每一個專業(yè)領(lǐng)域背后,其實都對應(yīng)著一個獨立翻譯模型。
具體而言,技術(shù)團(tuán)隊收集了大量不同專業(yè)領(lǐng)域的數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)翻譯模型進(jìn)行了定制化訓(xùn)練和增強(qiáng)。
這樣一來,即使是Pneumonoultramicroscopicsilicovolcanoconiosis這樣的術(shù)語,也能夠被準(zhǔn)確翻譯出來。
除此之外,一般在線機(jī)器翻譯算法都是以句子為單位翻譯的,而針對文檔翻譯的需求,有道詞典9這次引入了篇章算法。也就是說,AI在進(jìn)行翻譯時,會聯(lián)合上下文句子來改進(jìn)翻譯質(zhì)量。
如此看來,網(wǎng)易有道詞典9這波號稱“最強(qiáng)桌面翻譯軟件”,并不是瞎吹牛,而是有備而來。
事實上,除了技術(shù)細(xì)節(jié)上的新嘗試,有道詞典化身“科研神器”背后,也有著更長期的技術(shù)積累。
比如在神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)方面,網(wǎng)易有道在2016年已著手自研神經(jīng)網(wǎng)絡(luò)翻譯模型YNMT,是國內(nèi)最早開展自研機(jī)器翻譯技術(shù)的團(tuán)隊之一。
在OCR技術(shù)方面,2017年,網(wǎng)易有道就上線了卷積神經(jīng)網(wǎng)絡(luò) + 循環(huán)神經(jīng)網(wǎng)絡(luò)的OCR引擎,到現(xiàn)在已經(jīng)能支持100多語種的識別,還具備語種自動判別和混合識別的能力。
當(dāng)然啦,對咱們來說,最關(guān)鍵的還是免費好用,入股不虧。
9月13號開始,文檔翻譯免費版面向所有用戶上線。
最后的最后,如果你還有什么別的寶藏科研神器,評論區(qū)大力種草走起呀~
— 完 —