安妮 發(fā)自 凹非寺
量子位 出品 | 公眾號 QbitAI
聯(lián)合國發(fā)言生成器了解一下?
最近,有研究人員真就搞出了一個。手握這個生成器,你就可以無限生成逼真的聯(lián)合國演講風格的內(nèi)容。
快速傳遞假新聞、隨口就能生成仇恨言論、冒充知名人物進行演講……這個模型讓人細思極恐,令人深感不安。
做這樣一個系統(tǒng)時間和金錢成本很高吧?
這么想就大錯特錯了。研究人員表示的,整個模型只需要13個小時的訓練,總共花費不超過7.8美元,也就是人民幣54元。
也就是說,半天時間,一頓晚飯錢的成本,你也能讓AI偽造一系列聯(lián)合國發(fā)言。推特網(wǎng)友評論道,現(xiàn)在終于理解為什么有些模型不應該開源了。
可怕。
真假難辨的效果
研究人員用三類任務展示了這個模型的效果,在每種任務上,模型都能Hold住相關(guān)場景,生產(chǎn)出假新聞、假言論。
一是一般性的主題,比如氣候變化、核裁軍等。
氣候變化仍然是所有國家關(guān)注的主要問題,世界各國領(lǐng)導人和馬里政府重申了這一承諾,呼吁聯(lián)合國通過一系列解決眾多人面臨的嚴重局勢的緊急措施,面對氣候變化。作為一個穆斯林國家,穆斯林國家堅信促進和平、安全與發(fā)展的國際合作的重要性。
在這一段假新聞里,無論是口吻、用詞還是行文邏輯,AI模型生成的文本都顯得逼真。
第二種任務是模仿聯(lián)合國秘書長的口吻對事件進行公開評論。
相比于第一種任務,這個任務需要的觀點輸出更明確,難度也進一步提升。
AI模型的表現(xiàn)如何?看看生成效果:
聯(lián)合國秘書長強烈譴責這種發(fā)生在摩加迪沙的恐怖致命襲擊事件?!ù颂幱惺÷裕┪覀兿M麌H社會也將響應對“非洲之角”和平與安全的呼吁,并希望蘇丹將繼續(xù)執(zhí)行自己的安全理事會決議制度。
如果是呼吁和平的言論還好,最可怕的是,這個模型還能產(chǎn)生惡意煽動性言論。
研究人員展示的第三種效果就是生成充滿惡意和煽動性言論,到底能到哪種程度。
在這個任務中,AI分別就“難民是恐怖分子”和“移民是艾滋病傳播的罪魁禍首”兩個命題生成假言論,內(nèi)容更是讓人看了脊背發(fā)涼。
這樣一個模型,到底是怎樣在半天時間+54塊錢成本的情況下做出來的?
開源模型
研究人員表示,從頭開始訓練語言模型是一項復雜的任務,需要大量的數(shù)據(jù)和計算力來進行,借助別人已經(jīng)開源的項目進行研究,也不失為一種性價比高的選擇。
在這個項目中,訓練數(shù)據(jù)是由Baturo等此前研究匯集的1970-2016年聯(lián)合國7507次發(fā)言的文本。
在這么多次演講中,已經(jīng)討論過很多話題。研究人員表示,在使用這個數(shù)據(jù)集前,這些演講被分成了283593個段落,并清理文本中的噪聲,使用spaCy進行標記。
論文What Drives the International Development Agenda? An NLP Analysis of the United Nations General Debate 1970-2016地址:
https://arxiv.org/abs/1708.05873
數(shù)據(jù)集搞定后,模型訓練又成了大問題。在這個階段,研究人員采用了開源模型:AWD-LSTM模型進行預訓練。
這是2017年由Salesforce研究院的Stephen Merity等人提出的模型,論文中提出了一系列基于詞的語言模型正則化和優(yōu)化策略,這些策略可在不改變現(xiàn)LSTM模型的基礎上應用。
論文Regularizing and Optimizing LSTM Language Models地址:
https://arxiv.org/abs/1708.02182
研究人員用Wikitext-103數(shù)據(jù)集進行預訓練,借助fast.ai庫,最終,AWD-LSTM模型在NVIDIA K80 GPU上訓練不到13個小時,就完成了模型的訓練,成本僅用了7.80美元(54元)。
多重身份的一作
這篇論文出自Joseph Bullock和Miguel Luengo-Oroz之手。
一作Joseph Bullock有3重身份:一是United Nations Global Pulse小組成員,二是英國杜倫大學(Durham University)數(shù)據(jù)科學研究所的一員,三是杜倫大學粒子物理現(xiàn)象學研究所的成員。
Miguel Luengo-Oroz是United Nations Global Pulse的數(shù)據(jù)科學家。
這篇論文也將出現(xiàn)在長灘上舉辦的Conference on Machine Learning AI for Social Good Workshop上。
傳送門
論文Automated Speech Generation from UN General Assembly Statements: Mapping Risks in AI Generated Texts地址:
https://arxiv.org/abs/1906.01946
原報道地址:
https://www.technologyreview.com/f/613645/ai-fake-news-deepfakes-misinformation-united-nations/
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關(guān)村。期待有才氣、有熱情的同學加入我們!相關(guān)細節(jié),請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)