三個(gè)大模型組隊(duì)挑戰(zhàn)o1,實(shí)測(cè)360多模型協(xié)作干掉提示詞工程
多模型合作,多系統(tǒng)協(xié)同
克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
OpenAI o1的橫空出世,開啟了大模型演化的新范式——Inference law(推理定律)。
正如英偉達(dá)AI科學(xué)家Jim Fan所說,o1的出現(xiàn)標(biāo)志著大模型研發(fā)者開始把集中在訓(xùn)練階段的投入,開始轉(zhuǎn)移到了推理過程。
Jim還引用了機(jī)器學(xué)習(xí)先驅(qū)Rich Sutton的經(jīng)典文章《苦澀的教訓(xùn)》中的話說,只有兩種技術(shù)可以讓(AI)計(jì)算的潛能無限擴(kuò)展——學(xué)習(xí)和搜索。
而現(xiàn)在,是時(shí)候把目光聚焦在后者了。
在推理側(cè)投入更多資源,模型也就有了更完備的思考過程,投入的增加換來的是質(zhì)的提升。
在國(guó)內(nèi),360創(chuàng)始人周鴻祎的理念與之不謀而合,而且360更早就提出了“慢思考”的理念,并在技術(shù)架構(gòu)和產(chǎn)品中都付諸了應(yīng)用。
同時(shí),360還在其AI產(chǎn)品中強(qiáng)調(diào)多模合作,讓來自不同廠商的大模型“抱團(tuán)取暖”,為國(guó)內(nèi)模型追趕OpenAI,找到了一條可行的道路。
從o1看大模型“慢思考”
雖然o1的具體思考過程始終是OpenAI的至高機(jī)密,但可以肯定的是,思維鏈(Chain of Thought, CoT)在其中扮演了重要角色。
OpenAI在關(guān)于o1的報(bào)告中表示,思維鏈能讓模型學(xué)會(huì)認(rèn)識(shí)并糾正錯(cuò)誤,學(xué)會(huì)將棘手的步驟分解為更簡(jiǎn)單的步驟,甚至學(xué)會(huì)嘗試不同方法,極大地提高了模型的推理能力。
今年的AI頂會(huì)ICLR上,谷歌大腦推理團(tuán)隊(duì)創(chuàng)建者Denny Zhou,清華姚班校友、斯坦福助理教授、斯隆獎(jiǎng)得主馬騰宇等人的一篇論文,更是揭開了思維鏈的無限潛能。
透過現(xiàn)象看本質(zhì),從某種程度上看,思維鏈的本質(zhì)就是2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主卡尼曼在《思考快與慢》中提出的“系統(tǒng)2”,也就是“慢思考”系統(tǒng)。
所謂“系統(tǒng)2”或“慢思考”,是指復(fù)雜、有意識(shí)的推理,與之相對(duì)的是“系統(tǒng)1”或“快思考”,即簡(jiǎn)單無意識(shí)的直覺。
而o1的表現(xiàn)證明,這種適用于人類的“慢思考”理念,對(duì)大模型來說同樣適用。
但應(yīng)當(dāng)注意的是,這兩種系統(tǒng)在人腦中是同時(shí)存在、相互配合的,在大模型當(dāng)中也不應(yīng)被割裂開來。
周鴻祎認(rèn)為,o1遵循的可能就是“雙系統(tǒng)理論(Dual Process Theory)”,其核心在于快慢兩種系統(tǒng)的協(xié)同運(yùn)作。
作為“百模大戰(zhàn)”的選手,周鴻祎和360,也是“慢思考”以及“多系統(tǒng)協(xié)同”的思考者和先行者。
7月底的ISC.AI大會(huì)上,周鴻祎就宣布,要“打造慢思考系統(tǒng),從而增強(qiáng)大模型的慢思考能力”。
基于“多系統(tǒng)協(xié)同”機(jī)制,360利用多個(gè)模型組成的智能體框架,實(shí)現(xiàn)了大模型從“快思考”到“慢思考”的轉(zhuǎn)變,并打造出了兩款明星AI產(chǎn)品——360AI搜索和360AI瀏覽器。
讓不同大模型“抱團(tuán)取暖”
360AI搜索一共有簡(jiǎn)潔回答、標(biāo)準(zhǔn)回答和深入回答三種模式,其中一次深入回答會(huì)可能就要涉及7-15次的大模型調(diào)用。
比如可能會(huì)涉及1次意圖識(shí)別模型調(diào)用,1次搜索詞改寫模型調(diào)用,5次搜索調(diào)用,1次網(wǎng)頁(yè)排序調(diào)用,1次生成主回答調(diào)用,1次生成追問調(diào)用……
在多個(gè)模型的協(xié)同配合下,360AI搜索形成了這樣的工作鏈路:
- 首先利用意圖分類模型,對(duì)用戶的問題進(jìn)行意圖識(shí)別;
- 接著用任務(wù)路由模型對(duì)問題進(jìn)行拆解,不同的問題可以劃分成“簡(jiǎn)單任務(wù)”、“多步任務(wù)”和“復(fù)雜任務(wù)”,對(duì)多個(gè)模型進(jìn)行調(diào)度;
- 最后構(gòu)建AI工作流,使多個(gè)大模型協(xié)同運(yùn)作。
比如面對(duì)一道古詩(shī)詞中譯英題目,路由模塊就會(huì)調(diào)用起翻譯、反思等多個(gè)模型,讓這些模型分工配合、共同完成任務(wù)。
而且最新版本還在生成答案過程中進(jìn)一步加強(qiáng)了多模型協(xié)作,將其作為了一種獨(dú)立的回答模式。
三個(gè)不同模型分別扮演生成初步答案的專家、檢查回答的反思者和最終給出答案的總結(jié)者。
例如在這個(gè)案例中,作為專家的Kimi提到了問題的關(guān)鍵,但表述不夠鮮明,在反思模型360智腦的建議下,豆包進(jìn)行了重新總結(jié),形成了直擊問題的解答。
這樣的工作模式不僅將快慢思考協(xié)同和反思機(jī)制引入了AI應(yīng)用,更通過不同模型的交叉驗(yàn)證,進(jìn)一步提高了整體表現(xiàn)。
在另一款A(yù)I產(chǎn)品——360AI瀏覽器當(dāng)中,16家廠商的54款大模型也已齊聚一堂,可以實(shí)現(xiàn)多種傳統(tǒng)瀏覽器所不具備的能力。
AI瀏覽器可以10秒鐘總結(jié)上萬字英文學(xué)術(shù)論文,針對(duì)其中的細(xì)節(jié)也可以盡情發(fā)問。
可以沉浸式翻譯pdf文檔,原文和譯文同步滾動(dòng)、隨時(shí)對(duì)照。
還能化身“AI省流俠”,分分鐘幫忙總結(jié)在線視頻內(nèi)容并劃出重點(diǎn),還能根據(jù)視頻架構(gòu)繪制腦圖,甚至分析創(chuàng)作風(fēng)格……
不僅在線文檔和視頻可以解析,這一系列分析功能,對(duì)于本地文件也同樣適用。
更為方便的是,360AI瀏覽器還有移動(dòng)端版本,在手機(jī)上也能隨時(shí)利用AI輔助上網(wǎng)沖浪。
已經(jīng)入駐360AI瀏覽器、同樣基于CoE架構(gòu)的AI助手(bot.360.com),則可根據(jù)任務(wù)類型和模型特長(zhǎng)自動(dòng)調(diào)度最合適的大模型。
無需切換平臺(tái),就能直接對(duì)話54款大模型,或者對(duì)話更加強(qiáng)大混合大模型,想選哪個(gè)就選哪個(gè)。
AI助手同樣支持「多模型協(xié)作」,用戶可以從54款模型中任選3款,分別做專家、反思者和總結(jié)者。
未來,360還會(huì)推出由五個(gè)甚至更多模型協(xié)作完成任務(wù)的版本。
還是在360AI瀏覽器中,AI助手還上線了“模型競(jìng)技場(chǎng)”?(bot.360.com),支持54款大模型產(chǎn)品的“同臺(tái)競(jìng)技”,最新版本中還上線了“組隊(duì)較量”、“匿名比拼”、“隨機(jī)對(duì)戰(zhàn)”等功能。
總的來說,360AI搜索還是360AI瀏覽器雖然側(cè)重點(diǎn)有所不同,但背后體現(xiàn)的還是那個(gè)核心理念——
在進(jìn)行“慢思考”的同時(shí),不卷單一模型的能力,而是讓模型“抱團(tuán)取暖”,博采眾長(zhǎng),形成“眾人拾柴火焰高”的局面。
當(dāng)然,這樣做的意義,也不僅僅是為用戶帶來了更好的AI體驗(yàn),對(duì)各大模型的開發(fā)者而言同樣是一種激勵(lì)。
我們知道,大模型研發(fā)投入巨大,唯有足夠多的用戶才能夠收回成本。
而依托360AI搜索、瀏覽器、安全衛(wèi)士等入口,360將能夠觸達(dá)10億用戶的入口開放給了大模型開發(fā)者。
這也是阿里、騰訊、百度等大廠,以及大模型六小虎紛紛加入360AI架構(gòu)的重要原因。
所以,360與這十多家廠商雙向奔赴,實(shí)現(xiàn)了模型與AI應(yīng)用相互促進(jìn)、彼此發(fā)展的良性循環(huán)。
模型競(jìng)技場(chǎng)更是給國(guó)產(chǎn)大模型提供了一個(gè)在競(jìng)爭(zhēng)中學(xué)習(xí)的平臺(tái),以及獲得用戶評(píng)價(jià)的絕佳機(jī)會(huì),塑造了更加積極進(jìn)取的氛圍。
“消滅”Prompt工程
從技術(shù)層面上看,在理念與產(chǎn)品之間架起橋梁的,是360獨(dú)創(chuàng)的CoE(Collaboration-of-Experts,專家協(xié)同)架構(gòu)。
CoE架構(gòu)集合了數(shù)量更多的大模型和專家模型,通過思維鏈和“多系統(tǒng)協(xié)同”的方式實(shí)現(xiàn)了“快思考”和“慢思考”的有機(jī)結(jié)合。
在思路上,CoE與o1選擇了相近的路線,但是在深度上走得更遠(yuǎn)——
o1無論再怎么融合,也無外乎是OpenAI的自家模型,CoE卻是海納百川,集合了數(shù)量更多的大模型和專家模型。
△CoE架構(gòu)原理圖
而且,CoE架構(gòu)中還接入了很多十億甚至更小參數(shù)的專家模型,使得整個(gè)系統(tǒng)更加智能,在獲得高質(zhì)量回答的同時(shí),節(jié)約推理資源、提升響應(yīng)速度。
早在CoE架構(gòu)剛發(fā)布的時(shí)候,基于CoE集各家所長(zhǎng)的混合大模型能力就超過了(當(dāng)時(shí)最強(qiáng)的)GPT-4o。
該混合大模型在翻譯、寫作等12項(xiàng)指標(biāo)的測(cè)試中取得了80.49分的綜合成績(jī),超越了GPT-4o的69.22分;而且除了代碼以外,其余11項(xiàng)指標(biāo)均優(yōu)于GPT-4o。
而且CoE架構(gòu)對(duì)所有模型都敞開懷抱,比OpenAI在開放協(xié)作的道路上走的更遠(yuǎn)……
另外,無論是OpenAI的o1,還是360的CoE,都將讓大模型的發(fā)展走向一個(gè)新的趨勢(shì)——
復(fù)雜的人工環(huán)節(jié)將實(shí)現(xiàn)自動(dòng)化,具體到大模型當(dāng)中,就是“消滅”Prompt工程。
乍一看有些反直覺,因?yàn)樵谖覀兪褂么竽P蜁r(shí),提示詞的好壞對(duì)生成內(nèi)容有著決定性的影響,其重要性不言而喻。
但仔細(xì)想想又并不矛盾——大模型等AI應(yīng)用,歸根結(jié)底是要為了人類而服務(wù);
而提示工程卻是讓人類去適應(yīng)模型的工作方式,簡(jiǎn)直“倒反天罡”。
所以,提示工程固然重要,但不該成為普通用戶使用大模型的“絆腳石”。
解決的思路就是將提示詞的設(shè)計(jì)工作,像其他任務(wù)一樣,作為思維鏈中的一環(huán),交給大模型來做。
這樣的模式下,提示工程的靈魂依然被保留,但在用戶的視野當(dāng)中逐漸淡化,形成一種“消亡”的感觀。
這種模式背后所反映的,也是360對(duì)AI未來發(fā)展的一點(diǎn)期許——
實(shí)現(xiàn)AI向著更多人的普惠,讓大模型不再“高居廟堂”,而是成為萬家燈火。