AI知識(shí)圖譜,讓我擼到了一只「天山上的雪豹」
用知識(shí)圖譜讓科普活起來(lái)
金磊 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
云吸貓這個(gè)詞,最近太火了!
火到有拿「云吸貓」開(kāi)始變現(xiàn)的,還有用「云吸貓」來(lái)寫(xiě)畢業(yè)論文的……
喵星人可以說(shuō)打出了一套「可愛(ài)組合拳」,攻占了大片互聯(lián)網(wǎng)江山。
最近,這種流行趨勢(shì)似乎有了升級(jí)——云擼國(guó)家一級(jí)保護(hù)動(dòng)物「雪豹」,你敢信?
這是一款由騰訊聯(lián)合WWF打造、名為「神秘雪豹在哪里」的微信小程序。而且上線2天,便有超過(guò)10萬(wàn)人在使用。
打開(kāi)后便有一只活靈活現(xiàn)的雪豹映入眼簾:
搖晃著小腦袋,無(wú)辜的眼神四處打量,還有那柔順的毛發(fā)(愛(ài)了愛(ài)了,好想舔屏吸上一口)……
咳咳,言歸正傳。
通過(guò)首頁(yè)下方文字的介紹,了解到雪豹是唯一一種分布在中國(guó)的大型貓科動(dòng)物(大貓),也是分布海拔最高的一種。
點(diǎn)擊雪豹身上的四個(gè)白色點(diǎn)點(diǎn),還對(duì)其「頭部結(jié)構(gòu)」、「毛發(fā)」、「整體外形」以及「尾巴」等,都有了非常詳盡的了解。
看到這里,讓人不禁有了想要更深入了解它的沖動(dòng)。
在第二個(gè)模塊便對(duì)它的成長(zhǎng)過(guò)程做詳盡的描述,包括「幼崽發(fā)育」、「亞成體」、「成年」以及「孕期生產(chǎn)」。
看著雪豹從小小的一只,到長(zhǎng)大成年,再到孕育誕生新的小生命,仿佛在短短的幾分鐘便經(jīng)歷了它的「完整生命過(guò)程」。
那它的生存環(huán)境如何?是否有天敵?別急,在第三和第四個(gè)版塊中也有所介紹。
在第三個(gè)版塊「同域」中,展示了與雪豹相關(guān)的同域物種生物鏈圖譜:
點(diǎn)擊物種的名稱,發(fā)亮的連線兩端聯(lián)系著食物鏈中的獵物與捕食者。 與連接線相同顏色的物種,是鏈中的捕食者;物種顏色一致,表示是同類(lèi)物種。
同樣,在第四個(gè)版塊「環(huán)境」中,也對(duì)雪豹生存的環(huán)境做了相應(yīng)的介紹。
不僅如此,在界面下方的「進(jìn)化與科學(xué)發(fā)現(xiàn)」以及「研究和保護(hù)」版塊,對(duì)雪豹的起源、研究做了更深入的介紹。
短短的幾分鐘時(shí)間,通過(guò)這樣一個(gè)小程序,不僅僅是對(duì)雪豹這種生物有了非常詳盡的科普,更像是伴隨著經(jīng)歷了它的「前世今生」。
而在這背后,便是來(lái)自騰訊云小微AI知識(shí)圖譜的硬核技術(shù)。
知識(shí)圖譜的「前世今生」
在體驗(yàn)過(guò)「神秘雪豹在哪里」這款小程序之后,一個(gè)非常直觀的感受就是:
它能夠圍繞著雪豹這個(gè)主體,將與它相關(guān)的形形色色的資料,都能非常有序地關(guān)聯(lián)到一起。不僅邏輯清晰,而且還一目了然。
而這就是知識(shí)圖譜的力量。
那么,知識(shí)圖譜的能力為什么如此強(qiáng)悍?這就要從它的起源講起。
知識(shí)圖譜的概念并不是非常新,其思路可以追溯到上世紀(jì)五六十年代的「知識(shí)表示形式」——語(yǔ)義網(wǎng)絡(luò)?(Semantic Network)。
語(yǔ)義網(wǎng)絡(luò)是由相互連接的「節(jié)點(diǎn)」和「邊」組成:
- 節(jié)點(diǎn)表示概念或者對(duì)象。
- 邊表示他們之間的關(guān)系。
知識(shí)圖譜和語(yǔ)義網(wǎng)絡(luò)較為類(lèi)似,但語(yǔ)義網(wǎng)絡(luò)更側(cè)重于表示概念與概念之間的關(guān)系,而知識(shí)圖譜更側(cè)重于表示實(shí)體之間的關(guān)系。
再通俗一點(diǎn)的去說(shuō),知識(shí)圖譜其實(shí)就是不斷挖掘、建立實(shí)體之間的關(guān)系,而且這種關(guān)系必須是客觀現(xiàn)實(shí)存在的。
那我們熟知的籃球選手姚明來(lái)舉個(gè)例子。
姚明的「隊(duì)友」是易建聯(lián);他的「妻子」是葉莉……知識(shí)圖譜便將現(xiàn)實(shí)世界中的「隊(duì)友」和「妻子」等關(guān)系,變成語(yǔ)義網(wǎng)絡(luò)中的「邊」,憑借關(guān)系連接起姚明、易建聯(lián)、葉莉等代表著人物實(shí)體的「節(jié)點(diǎn)」。
當(dāng)然,除此之外,物理世界中還存在很多隱性或復(fù)雜的關(guān)系。通過(guò)不同關(guān)系的挖掘,每一個(gè)與姚明相關(guān)的實(shí)體,都能連接更多實(shí)體,整個(gè)語(yǔ)義網(wǎng)絡(luò)便得以成倍延伸,知識(shí)圖譜也愈發(fā)豐富龐大。
總結(jié)來(lái)看,知識(shí)圖譜具有以下特點(diǎn):
- 知識(shí)圖譜是一種特殊的圖數(shù)據(jù):是帶標(biāo)記的有向?qū)傩詧D。
- 知識(shí)圖譜是一種人類(lèi)可識(shí)別且對(duì)機(jī)器友好的知識(shí)表示:采用了人類(lèi)容易識(shí)別的字符串來(lái)標(biāo)識(shí)各元素;同時(shí),可以很容易地被計(jì)算機(jī)識(shí)別和處理。
- 知識(shí)圖譜自帶語(yǔ)義、蘊(yùn)涵邏輯含義和規(guī)則:結(jié)點(diǎn)對(duì)應(yīng)現(xiàn)實(shí)世界中的實(shí)體或者概念,每條邊或?qū)傩砸矊?duì)應(yīng)現(xiàn)實(shí)中的一條知識(shí);可以根據(jù)人類(lèi)定義的規(guī)則,推導(dǎo)出知識(shí)圖譜數(shù)據(jù)中沒(méi)有明確給出的知識(shí)。
那么回到「神秘雪豹在哪里」,知識(shí)圖譜是如何具體實(shí)現(xiàn)其功能的呢?
騰訊云小微的「AI知識(shí)大腦」
能夠讓這款小程序展現(xiàn)的知識(shí),如此一目了然、深入人心,離不開(kāi)騰訊云小微AI知識(shí)圖譜的強(qiáng)大能力。
但其實(shí),這種能力在「神秘雪豹在哪里」的展現(xiàn)知識(shí)冰山一角。
以今年騰訊全球數(shù)字生態(tài)大會(huì)中與真人一起同臺(tái)亮相的「AI助手」那笙為例,便可對(duì)其更加了解。
通過(guò)視頻可以看到,AI助手即便面對(duì)「可令怕」這般新型流行詞,都能夠迅速「猜到」是killing part。
而后再以“夏令營(yíng)活動(dòng)”為「中心」,順著中代表著“可令怕”關(guān)系的「邊」,找到“回歸大自然”、“享受冒險(xiǎn)與挑戰(zhàn)”、“露營(yíng)看星星”等「節(jié)點(diǎn)」。
就像是賦予了AI助手真正的知識(shí)大腦一般。
在這個(gè)過(guò)程中,體現(xiàn)了騰訊云小微AI知識(shí)圖譜的三方面能力。
首先,是知識(shí)抽取。
知識(shí)抽取,是指從半結(jié)構(gòu)/非結(jié)構(gòu)化的文件中,通過(guò)自然語(yǔ)言理解(NLP)的技術(shù),能夠抽取出:
這段話里所描述的實(shí)體是什么?實(shí)體的關(guān)系是什么?實(shí)體的屬性是什么?
最后,將抽取出的知識(shí)要素,以SPO三元組的形式展現(xiàn)出來(lái)。
(注:SPO三元組,即主語(yǔ)-謂語(yǔ)-賓語(yǔ)三元組,是用來(lái)表示事物的一種方法和形式。)
騰訊云小微知識(shí)圖譜平臺(tái),支持從豐富的行業(yè)數(shù)據(jù)中抽取出行業(yè)信息,助力行業(yè)伙伴構(gòu)建行業(yè)專(zhuān)屬的知識(shí)圖譜。
其次,是知識(shí)融合。
經(jīng)歷上一個(gè)「知識(shí)抽取」過(guò)程后,實(shí)體、關(guān)系以及各類(lèi)屬性信息就像是一些雜亂無(wú)章的拼圖;此外,由于知識(shí)的質(zhì)量不一、來(lái)源不同,會(huì)存在一些干擾拼圖。
在實(shí)際應(yīng)用中,來(lái)自各行各業(yè)的數(shù)據(jù)、知識(shí),更是存在這樣的問(wèn)題。
知識(shí)融合的作用,就是將這些良莠不齊的知識(shí),分類(lèi)規(guī)整好——將來(lái)自不同知識(shí)庫(kù)的同一實(shí)體融合在一起。
為了打破各行業(yè)間的知識(shí)孤島,騰訊云小微以自有的海量通用知識(shí)為中心,通過(guò)實(shí)體鏈接、屬性融合等多種「知識(shí)融合」技術(shù),連接各行業(yè)的知識(shí)圖譜。
最后,是關(guān)聯(lián)多源異構(gòu)的行業(yè)數(shù)據(jù)。
在經(jīng)過(guò)上述的兩個(gè)步驟之后,要想實(shí)現(xiàn)形成更靈活的知識(shí)大腦,還需要經(jīng)歷一個(gè)關(guān)聯(lián)的過(guò)程。
這全靠騰訊云小微將多源異構(gòu)的行業(yè)數(shù)據(jù),諸如不同行業(yè)的文件、表格、音頻、視頻,全鏈接到「知識(shí)圖譜」中,從而賦予AI助手更豐富的能力,例如深度問(wèn)答、主動(dòng)推薦等。
此外,大規(guī)模知識(shí)庫(kù)的構(gòu)建與應(yīng)用,還少不了「知識(shí)更新」等技術(shù)的支持。
……
這便是騰訊云小微AI知識(shí)圖譜體現(xiàn)的強(qiáng)悍技術(shù)硬實(shí)力。
而通過(guò)這樣的技術(shù),讓「神秘雪豹在哪里」和「那笙」在科普和AI助手上應(yīng)用,也不難看出知識(shí)圖譜所擁有的潛在且廣泛的應(yīng)用價(jià)值。
AI知識(shí)圖譜的價(jià)值與未來(lái)
進(jìn)入互聯(lián)網(wǎng)時(shí)代以來(lái),人類(lèi)世界所產(chǎn)生的數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng)。
如何將海量、異構(gòu)、動(dòng)態(tài)的大數(shù)據(jù),加以表達(dá)、組織、管理、利用,是一個(gè)急需且必須解決的問(wèn)題。
知識(shí)圖譜,便是一種非常有效的方式,可以讓網(wǎng)絡(luò)的智能化水平更高,更加接近于人類(lèi)的認(rèn)知思維。
因此,它的應(yīng)用前景十分的廣泛。
例如在智能搜索中,搜索引擎在面對(duì)用戶輸入的查詢時(shí),不僅僅是查找關(guān)鍵詞這么簡(jiǎn)單,而是對(duì)查詢內(nèi)容做一個(gè)語(yǔ)義理解。
而后進(jìn)行歸一化、知識(shí)庫(kù)匹配等一系列操作后,再將結(jié)果返回給用戶。
在此基礎(chǔ)上,更加深入的應(yīng)用就是語(yǔ)音助手,像蘋(píng)果Siri、谷歌Assistant等,能夠以準(zhǔn)確簡(jiǎn)潔的自然語(yǔ)言為用戶提供問(wèn)題的解答。
在社交網(wǎng)絡(luò)平臺(tái)也是如此,例如Facebook在2013年推出的Graph Search,可以通過(guò)知識(shí)圖譜,將人、地點(diǎn)、事件等聯(lián)系在一起,并在海量的社交網(wǎng)絡(luò)中,尋找和自己有相關(guān)性其他事物。
由此再展開(kāi),推薦系統(tǒng)也是知識(shí)圖譜的應(yīng)用之一。我們?cè)诰W(wǎng)購(gòu)、刷短視頻等時(shí),經(jīng)常遇到的「你可能感興趣的產(chǎn)品」、「你可能認(rèn)識(shí)的人」,都離不開(kāi)知識(shí)圖譜的應(yīng)用。
更垂直于行業(yè)來(lái)講,知識(shí)圖譜應(yīng)用于金融、醫(yī)療、教育等領(lǐng)域,也可以帶來(lái)更好的領(lǐng)域知識(shí)、更低金融風(fēng)險(xiǎn)等益處。
科技除了要硬核,更應(yīng)該「向善」
其實(shí),在開(kāi)頭介紹「神秘雪豹在哪里」時(shí),故意留下了一個(gè)伏筆,就是小程序頂部的第四個(gè)版塊——環(huán)境。
在這個(gè)界面的文字介紹中可以了解到,雪豹所生存的家園,正式支撐著我們每個(gè)人日常生活的大江大河的源頭。
例如長(zhǎng)江、黃河,華夏文明的母親河;湄公河,東南亞的母親河;雅魯藏布江,中國(guó)西藏和印度東部的母親河……
因此,雪豹作為我國(guó)一級(jí)稀有保護(hù)動(dòng)物,我們?nèi)ナ刈o(hù)的它們的同時(shí),也是在守護(hù)著我們自己的家園、生態(tài)。
利用AI知識(shí)圖譜,騰訊取代了傳統(tǒng)的科普方式,把枯燥、零散的知識(shí)以專(zhuān)業(yè)的數(shù)據(jù)結(jié)構(gòu)連接起來(lái),讓我們更直觀生動(dòng)的了解各類(lèi)知識(shí)。這是騰訊科技公益互助計(jì)劃在生態(tài)領(lǐng)域公益保護(hù)的全新探索。
此外,小程序還提供了體驗(yàn)四川臥龍國(guó)家級(jí)自然保護(hù)區(qū)的雪豹「巡護(hù)員」工作的功能,可以讓我們?yōu)楸Wo(hù)稀有動(dòng)物、保護(hù)自然生態(tài)獻(xiàn)一份力。
而這背后,便是騰訊「科技向善」的價(jià)值觀。
目前,騰訊云小微AI團(tuán)隊(duì)已經(jīng)通過(guò)與行業(yè)專(zhuān)家合作(如中科院昆明植物所)、公司內(nèi)數(shù)據(jù)資源整合、線上資源積累等多種方式,建設(shè)了數(shù)十個(gè)通用領(lǐng)域知識(shí)圖譜,包含億級(jí)實(shí)體及十億級(jí)關(guān)系。
相信在不就的未來(lái),騰訊云小微可以讓公益變得更加生動(dòng)、有趣,也可以讓吸引更多人參與其中。
最后,要問(wèn)科技的魅力到底是什么?
或許答案正如騰訊所體現(xiàn)的——造福社會(huì)、造福人類(lèi)。
你說(shuō)呢?
參考鏈接:
https://zhuanlan.zhihu.com/p/71128505
https://mp.weixin.qq.com/s/Y1mhFyvwx1IhKZWtzx14NA
- 商湯林達(dá)華萬(wàn)字長(zhǎng)文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來(lái)2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08