“聽我說謝謝你”還能用古詩來說?清華搞了個“據(jù)意查句”神器,一鍵搜索你想要的名言警句
朋友圈高級文案神器來了
明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
艾瑞巴得,又有神器來拯救文盲了!
天氣太熱只會念叨一句“熱死了”?發(fā)朋友圈翻來覆去才憋出幾個字?
這個檢索神器值得了解一下。
只要在搜索框里輸入你想表達(dá)的意思,如“熱死了”。
立刻就能有20個表達(dá)這一意思的句子任君挑選。
句子類型還能按需選取,名言警句、歇后語、古詩文都不在話下。
并且給出的名言還會注明出處作者,這下再也不用啥話都往迅哥兒身上套了。
怪不得網(wǎng)友直呼:朋友圈文案高級表達(dá)查找替換系統(tǒng)。
而且,我們在試玩了幾輪后發(fā)現(xiàn),這個神器在hold住網(wǎng)絡(luò)俗語“精髓”上的表現(xiàn)有些出人意料。
比如這兩天大家都在說的“精神內(nèi)耗”。
它給出了一段盧梭的話,完全拿捏住了詞語本來的意思,語言逼格立馬提升好幾度。
甚至還能找出意思相近的古詩文。
來自歐陽修《秋聲賦》中的這句“百憂感其心,萬事勞其形,有動乎中,必遙其情”,說的意思就是焦慮使人精神疲憊。
果真是能通殺古今了。
于是,我們找來了更多網(wǎng)絡(luò)流行語喂給它,看看還能擦出什么火花~
聽我說謝謝你,但古詩版
第一個要嘗試的網(wǎng)絡(luò)名句,是“聽我說,謝謝你”。
神器反向輸出結(jié)果中,意思最為貼近的是王維的這句“舉世無相識,終身思舊恩”。
這句詩中明確體現(xiàn)了說話主體人表達(dá)感謝之意,稱得上是“聽我說謝謝你”的究極上流版。
還有在句式上非常接近的結(jié)果,是溫庭筠筆下的“知我意,感君憐”。
最讓人意想不到的,是神器反向輸出了《將進(jìn)酒》里的“與君歌一曲,請君為我傾耳聽”。
乍看之下,這個答案好像是錯的。
但要知道“聽我說謝謝你”能成為梗,就是因為防疫人員尷尬被迫聽歌事件……
這么看,反向輸出神器還意外扣了題。
不只是這句梗,還有很多網(wǎng)絡(luò)用語,反向輸出神器的回答都是貌似不著邊際,但又讓人覺得異常契合。
比如輸入“無語子”,給出的詩句有:
滿懷心腹事,盡在不言中。
這不就是大家表達(dá)無語時的真實心境嗎?因為不便明說,所以沉默,所以無語。
還有這句“你品,你細(xì)品”,輸出的詩句也都帶有了仔細(xì)品讀、反復(fù)回味的意思。
那么,這個好用又好玩的神器,到底是什么來頭呢?
來自清華的“據(jù)意查句”
以上說的這個好登西,是由清華推出的“據(jù)意查句”神器——WantQuotes。
誕生自清華大學(xué)計算機(jī)系自然語言處理與社會人文計算實驗室(THUNLP),項目指導(dǎo)教師為孫茂松教授和劉知遠(yuǎn)副教授。
能夠快速從全世界這么多語料中找到你想要的句子,這個神器主要靠的是一個超大的數(shù)據(jù)集和一個推薦模型。
數(shù)據(jù)集包含了英語、現(xiàn)代漢語和文言文三大部分。
其中,英語部分有6108個名言警句和126713個上下文文本段;
現(xiàn)代漢語部分,包含有3004句名言和408433個相關(guān)上下文;
文言文部分,則有4438段文言典故(包括古詩)和116537段相關(guān)上下文。
推薦模型方面,本文提出使用BERT作為句子編碼器來學(xué)習(xí)名言警句和相關(guān)文本表示。
但由于絕大多數(shù)名言警句的表達(dá)都非常凝練,但是可能其中每個背后的意義又包含很多層,所以在本方法中,研究人員將義原引入到編碼器中。
簡單來說,義原是語言學(xué)中最小的語義單位。語言學(xué)家認(rèn)為義原體系在任何語言中都適用,不與特定語言相關(guān)。
舉個例子,“男孩”這個詞可以由“人類”、“男性”、“兒童”這個三個義原表示,“女孩”則可以由“人類”、“女性”、“兒童”的組合來表達(dá)。
因此在模型中引入義原后,就能很好解決詞義消歧的問題,并且能更準(zhǔn)確地捕捉到詞與詞之間的關(guān)系。
也就是讓模型把語言學(xué)得更加透徹。
而在具體任務(wù)對比中可以看到,本文方法的性能均優(yōu)于其他方法。
同時用消融實驗驗證了訓(xùn)練方法的有效性(下表最后三行結(jié)果)。
在只給出左側(cè)文本的條件下,本文方法的結(jié)果依舊優(yōu)于過去方法。
還有反向詞典和AI作詩系統(tǒng)
看到這里你可能覺得這項工作有點似曾相識。
沒錯,那個之前爆火的“反向詞典”也來自這個實驗室。
所謂“反向”,就是和常規(guī)詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。
比如還是這句“聽我說謝謝你,因為有你,溫暖了四季”,用成語應(yīng)該怎么說?
反向詞典可以立馬拋出幾十乃至上百個選項出來,并且還會標(biāo)注推薦程度。
背景顏色越深,代表系統(tǒng)推薦程度越高。
要是碰上啥看不懂的,鼠標(biāo)一點,就能查看具體釋義。
而除了拯救現(xiàn)代失語人外,他們還讓AI嘗試過寫古詩,之前也在網(wǎng)絡(luò)上爆火過。
不得不說,THUNLP真是要把AI+中文玩出花了。
該實驗室由孫茂松教授領(lǐng)銜,教師隊伍中還有劉洋教授和劉知遠(yuǎn)副教授。
前不久,THUNLP還獲得了ACL 2022最佳演示論文獎(Best Demo Paper Award)。
該獎項是ACL系列會議對System Demonstration論文授予的最佳論文獎項,每屆會議基于評審人員評估的系統(tǒng)貢獻(xiàn)度、完成度、影響力及會議演示綜合效果的綜合評價評選出一篇獲獎?wù)撐摹?/p>
One More Thing
目前,“反向詞典”在網(wǎng)頁端和微信小程序上都能使用,APP在路上了。
“據(jù)意查句”還只能在網(wǎng)頁端使用(需要掃碼關(guān)注公眾號登陸一下子)。
另外,團(tuán)隊表示還是希望大家在使用時多給反饋、多提建議。
比如給好的推薦名句點贊,如果看到有錯誤之處也能直接指正。
對了,研發(fā)團(tuán)隊還表示,作為開源項目隨時歡迎大家加入,參與項目設(shè)計&開發(fā)、提出需求、反饋問題。
感興趣的話就去官網(wǎng)戳戳公告吧~
“據(jù)意查句”官網(wǎng):
https://wantquotes.net/
“反向詞典”官網(wǎng):
https://wantwords.net/
參考鏈接:
https://weibo.com/5198011111/LE58vxn0N?
— 完 —
- 4o-mini華人領(lǐng)隊也離職了,這次不怪小扎2025-08-19
- 宇樹機(jī)器人“撞人逃逸”火到國外,王興興回應(yīng):下次不遙控了2025-08-16
- 突破Claude-4編程上限!自進(jìn)化Agent框架拿下新SOTA,已開源2025-08-19
- 讓OpenAI只領(lǐng)先5天,百川發(fā)布推理新模型,掀翻醫(yī)療垂域開源天花板2025-08-11