國(guó)產(chǎn)ChatGPT大戰(zhàn)弱智吧效果實(shí)測(cè)!網(wǎng)頁(yè)端小程序均已上線(xiàn),人人可玩
不用排隊(duì)直接可玩!
楊凈 蕭簫 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“中國(guó)版ChatGPT首發(fā)”,爭(zhēng)得不可開(kāi)交,熱鬧卻一直沒(méi)個(gè)結(jié)果——
自ChatGPT發(fā)布以來(lái),目前進(jìn)展最快的國(guó)內(nèi)產(chǎn)品也僅是開(kāi)啟了內(nèi)測(cè),不知道啥時(shí)候才能玩上。
結(jié)果現(xiàn)在有讀者跟我們爆料,一個(gè)中文版類(lèi)ChatGPT產(chǎn)品已經(jīng)悄然上線(xiàn)。
不是預(yù)告、也不是開(kāi)啟小范圍測(cè)試,而是直接人 人 可 用?!中國(guó)版ChatGPT這不就來(lái)了嗎!
聽(tīng)起來(lái)有些玄幻,不過(guò)我們點(diǎn)進(jìn)主頁(yè)試了試,發(fā)現(xiàn)確實(shí)可玩:
這不得拿出十八般武藝與它較量一番?
我們注冊(cè)了一個(gè)賬號(hào),試試它的實(shí)際效果如何。
和中國(guó)版ChatGPT較量中文
這個(gè)官網(wǎng)顯示,寫(xiě)作貓同樣通過(guò)對(duì)話(huà)問(wèn)答來(lái)解決任務(wù),功能上包括但不限于三大方向。
- 其一,問(wèn)答功能,也就是問(wèn)啥答啥、“幫人思考”這一能力;
- 其二,文本生成功能,包括整理摘要大綱、寫(xiě)作文、翻譯等;
- 最后,圖片生成功能,描述圖片內(nèi)容并讓它直接生成。
從功能上看跟ChatGPT差不多,甚至還擁有ChatGPT所沒(méi)有的圖片生成功能。
當(dāng)然,還有手機(jī)端更方便一點(diǎn),進(jìn)入“對(duì)話(huà)寫(xiě)作貓”小程序就能隨時(shí)和它聊天了。
體驗(yàn)上還算比較簡(jiǎn)單直接,但都是表面功夫還得來(lái)看真本領(lǐng)。比如它的理解、邏輯能力如何,懂不懂常識(shí)。
既然是中國(guó)版ChatGPT,當(dāng)然得先來(lái)battle一下博大精深的中文。
首先看看它的中文理解能力是否過(guò)關(guān),請(qǐng)聽(tīng)題——“能穿多少穿多少”是什么意思?
不錯(cuò)。再試試高階一點(diǎn)的“國(guó)足和國(guó)乒誰(shuí)都贏(yíng)不了”?
沒(méi)想到,竟然連這種中文知識(shí)都具備了!
既然如此,是時(shí)候拿出一些弱智吧段子和它PK了,考考它的邏輯能力——
高中想提升升學(xué)率為什么不直接招大學(xué)生?
萬(wàn)萬(wàn)沒(méi)想到,問(wèn)完自己被扎了一刀:
招收大學(xué)生可能會(huì)對(duì)學(xué)校的教學(xué)質(zhì)量產(chǎn)生影響,因此高中不能直接招收大學(xué)生。
最后來(lái)考查一下它的常識(shí)。來(lái)個(gè)腦筋急轉(zhuǎn)彎試試:
看起來(lái)并沒(méi)有被問(wèn)題帶跑偏,還是比較理智的。
接下來(lái),進(jìn)入正經(jīng)的第二階段,評(píng)估一下它的內(nèi)容生成效果。
首先是生成速度上,文字平均在3~5秒左右,生成4幅圖則需要8秒左右,整體還是比較快的。
隨后就是生成內(nèi)容的實(shí)用程度了,簡(jiǎn)單來(lái)說(shuō)就是解決實(shí)際需求的能力。
例如,寫(xiě)小說(shuō)的故事情節(jié)是否完整?查閱到的知識(shí)是否直接可用?
先看生成情節(jié)的能力,確實(shí)是個(gè)完整的愛(ài)情故事……但等等,孫堅(jiān)和小喬,這輩分好像有億點(diǎn)點(diǎn)亂啊!
要是更玄幻一點(diǎn)呢?
天地之間、神秘的少年、精靈、森林……艾瑪有畫(huà)面了!
不論事實(shí)性如何,這同人文一般的情節(jié)倒是印證了最后那句“愛(ài)情可以超越一切外在因素的”……
然后是一些常規(guī)任務(wù)之外的需求,例如“角色扮演”:
整體測(cè)評(píng)來(lái)看,寫(xiě)作貓的中文理解和內(nèi)容生成能力還是不錯(cuò)的,但并不排除它還存在一些bug。
例如,某些回答乍一看合乎邏輯,但細(xì)究之下無(wú)法直視……
以及偶爾也會(huì)像微軟必應(yīng)一樣“發(fā)瘋”出現(xiàn)回答重復(fù)的問(wèn)題……
除此之外,我們也在測(cè)試時(shí)產(chǎn)生了一些疑惑。
例如,雖然它能實(shí)現(xiàn)翻譯功能:
但卻并不直接支持英文問(wèn)答。
此外,像ChatGPT能直接生成代碼的能力,寫(xiě)作貓也還不具備。
不過(guò)作為國(guó)內(nèi)率先開(kāi)箱即用的類(lèi)ChatGPT產(chǎn)品,也算是可圈可點(diǎn)。
總的來(lái)看,寫(xiě)作貓?jiān)谥形睦斫夂桶葱枭晌谋旧献龅貌诲e(cuò),但仍然和ChatGPT一樣存在一些“經(jīng)不起推敲”的回答。
這些問(wèn)題的產(chǎn)生原因是?而且有關(guān)英文和代碼生成的能力,也還不知道之后會(huì)不會(huì)上線(xiàn)。
帶著這些疑問(wèn),我們同背后的開(kāi)發(fā)團(tuán)隊(duì)聊了聊,了解到整個(gè)產(chǎn)品從開(kāi)發(fā)到上線(xiàn)的來(lái)龍去脈。
AI寫(xiě)作能力的自然延伸
秘塔寫(xiě)作貓團(tuán)隊(duì)針對(duì)我們提出的問(wèn)題進(jìn)行了解答。主要包括三個(gè)方面:
- 為什么能這么快上線(xiàn),并且直接做到開(kāi)箱即用?
- 存在上述bug的原因,會(huì)如何解決?
- 未來(lái)有什么樣的計(jì)劃?
首先,之所以能做到如此快地上線(xiàn),開(kāi)發(fā)人員表示“主要有兩個(gè)關(guān)鍵”。
第一點(diǎn),秘塔在大模型訓(xùn)練上有充分的積累。有個(gè)很巧妙的時(shí)間點(diǎn)在于,ChatGPT上線(xiàn)的同期,秘塔寫(xiě)作貓的AI寫(xiě)作功能也正式開(kāi)放,當(dāng)時(shí)就已經(jīng)實(shí)現(xiàn)小范圍出圈——
針對(duì)AI可能出現(xiàn)的問(wèn)題如行文流暢度、對(duì)中文的理解程度、以及翻譯腔等情況,寫(xiě)作貓都能比較好地解決。
此次也可以看到,對(duì)話(huà)寫(xiě)作貓同樣具備這些方面的能力,在涉及內(nèi)容創(chuàng)作等場(chǎng)景中表現(xiàn)不錯(cuò)。
除此之外,就秘塔寫(xiě)作貓整個(gè)產(chǎn)品體系來(lái)說(shuō),對(duì)話(huà)寫(xiě)作貓所具備多輪對(duì)話(huà)能力,其實(shí)也是在交互式指令A(yù)I寫(xiě)作上的自然延伸,允許用戶(hù)更自如地進(jìn)行內(nèi)容創(chuàng)作和修改。
換言之,相當(dāng)于對(duì)現(xiàn)有AI助手的能力進(jìn)行補(bǔ)充,這也是該產(chǎn)品的定位所在。
第二點(diǎn)在于技術(shù)上的優(yōu)化。相較于大廠(chǎng),秘塔的計(jì)算資源十分有限(不足千分之一),但團(tuán)隊(duì)?wèi){借多年積累的大語(yǔ)言模型相關(guān)研發(fā)經(jīng)驗(yàn),和各類(lèi)算法和工程上的優(yōu)化,實(shí)現(xiàn)了快速迭代。在大模型落地時(shí),降低了模型的通信量,以維持大語(yǔ)言模型的高效訓(xùn)練。
這背后也離不開(kāi)團(tuán)隊(duì)的技術(shù)實(shí)力。
秘塔科技CEO閔可銳,是復(fù)旦大學(xué)計(jì)算機(jī)系校友,隨后前往牛津攻讀數(shù)學(xué)系碩士、UIUC攻讀計(jì)算機(jī)博士,師從馬毅教授;除此之外,他還擁有豐富的產(chǎn)業(yè)經(jīng)驗(yàn),曾擔(dān)任玻森數(shù)據(jù)CTO&聯(lián)合創(chuàng)始人、獵豹移動(dòng)AI實(shí)驗(yàn)室負(fù)責(zé)人,并參與過(guò)谷歌AdSense基于內(nèi)容廣告建模組點(diǎn)擊率預(yù)測(cè)項(xiàng)目。
工程負(fù)責(zé)人唐悅,同樣復(fù)旦計(jì)算機(jī)系校友,他研發(fā)過(guò)多款A(yù)PP、游戲及工業(yè)機(jī)械臂等,曾在著名編程競(jìng)賽平臺(tái)TopCoder上取得構(gòu)架組排名第一。
總的來(lái)看,產(chǎn)品化經(jīng)驗(yàn)、技術(shù)上積累以及團(tuán)隊(duì)實(shí)力的疊加都是“加速”的原因,也就不奇怪秘塔對(duì)話(huà)寫(xiě)作貓為何能率先上線(xiàn)了。
至于仍然存在的一些bug,開(kāi)發(fā)人員也進(jìn)行了解釋?zhuān)⒈硎荆阂言诔掷m(xù)優(yōu)化中。
比如像面對(duì)重復(fù)性問(wèn)題會(huì)無(wú)法理解語(yǔ)義。團(tuán)隊(duì)解釋稱(chēng),這是因?yàn)槟P陀洃浟Α疤珡?qiáng)”了——
模型會(huì)“看到”之前自己的回答,從而比較“偷懶”地采用之前的回答。
還有像不支持英文,但仍有英文回答的現(xiàn)象。這是因?yàn)樗麄儍?nèi)部準(zhǔn)備的是簡(jiǎn)體中文訓(xùn)練數(shù)據(jù)集,其中不可避免會(huì)出現(xiàn)部分英文內(nèi)容,比如英語(yǔ)教學(xué)的文章。
在下個(gè)版本中,他們將加入英文語(yǔ)料來(lái)提升英文的理解和回答能力。
除此之外,團(tuán)隊(duì)還提及了這幾個(gè)方面的計(jì)劃。核心有兩個(gè)方面:持續(xù)迭代產(chǎn)品,優(yōu)化數(shù)據(jù)和算法。
持續(xù)迭代產(chǎn)品這塊,開(kāi)發(fā)程序讓用戶(hù)體驗(yàn)正是他們的思慮所在。
任何好的產(chǎn)品都離不開(kāi)用戶(hù)的反饋。ChatGPT在去年底發(fā)布,很重要的一個(gè)原因也是希望得到大量用戶(hù)的測(cè)試和反饋。
我們也在程序中設(shè)置了反饋機(jī)制,爭(zhēng)取不斷迭代優(yōu)化,讓更多的用戶(hù)認(rèn)可對(duì)話(huà)寫(xiě)作貓的價(jià)值。
至于像核心數(shù)據(jù)和算法這方面,團(tuán)隊(duì)也在持續(xù)優(yōu)化中,英文和代碼生成能力也將在后續(xù)版本中上線(xiàn)。
國(guó)內(nèi)ChatGPT產(chǎn)品現(xiàn)狀如何?
此番首個(gè)ChatGPT產(chǎn)品開(kāi)箱即用,再加上此前高校開(kāi)放類(lèi)ChatGPT產(chǎn)品內(nèi)測(cè),可以看到,國(guó)內(nèi)類(lèi)ChatGPT產(chǎn)品已呈現(xiàn)出百花待放、百家爭(zhēng)鳴的景象。
他們或來(lái)自大廠(chǎng)、高校機(jī)構(gòu),亦或是如秘塔科技這樣技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)公司;他們進(jìn)度不同,有已經(jīng)正在內(nèi)測(cè)、或者已處于上線(xiàn)前夕的團(tuán)隊(duì),也有的才開(kāi)始將ChatGPT作為企業(yè)重要的戰(zhàn)略方向,從頭打造為自身場(chǎng)景賦能;當(dāng)然更多的,是基于已有技術(shù)的升級(jí)迭代,而ChatGPT的出現(xiàn)則剛好驗(yàn)證了他們的技術(shù)選擇。
在ChatGPT以驚人的速度在全球爆火出圈之際,OpenAI的首席執(zhí)行官Sam Altman曾坦言:
ChatGPT是一個(gè)糟糕的產(chǎn)品,它真的不是為使用而設(shè)計(jì)的。
現(xiàn)在確實(shí)是一個(gè)激動(dòng)人心的時(shí)刻,但我認(rèn)為距離拐點(diǎn)還為時(shí)尚早。
深究原因,繞不過(guò)去的一點(diǎn),就是ChatGPT沒(méi)有事實(shí)的概念,無(wú)法判斷對(duì)錯(cuò),導(dǎo)致它有時(shí)候會(huì)“說(shuō)謊”。因此,如何讓ChatGPT真正能夠“使用”,也成為全球躬身入局的玩家需要應(yīng)對(duì)的難題。
如今國(guó)內(nèi)ChatGPT玩家百花待放的同時(shí),他們也逐漸進(jìn)入產(chǎn)品冷靜期——
開(kāi)始思考自身定位,如何將ChatGPT“用”到場(chǎng)景中去。
隨著對(duì)話(huà)寫(xiě)作貓的發(fā)布,國(guó)內(nèi)ChatGPT產(chǎn)品大致可以梳理成三類(lèi)。
第一是實(shí)用工具類(lèi)。圍繞著ChatGPT的通用助手特性,通過(guò)對(duì)話(huà)的方式來(lái)解決人類(lèi)日常問(wèn)題。
這其實(shí)是ChatGPT技術(shù)落地中最直觀(guān)、也是最快能產(chǎn)生價(jià)值的一種方式。
當(dāng)中代表就是秘塔對(duì)話(huà)寫(xiě)作貓。在ChatGPT發(fā)布之前,秘塔寫(xiě)作貓就已經(jīng)有多年相關(guān)產(chǎn)品經(jīng)驗(yàn)——以AI助手的角色在學(xué)界、產(chǎn)業(yè)界出圈。
對(duì)他們來(lái)說(shuō),如今對(duì)話(huà)寫(xiě)作貓的發(fā)布,其實(shí)也是進(jìn)一步完善了自己的產(chǎn)品體系。
第二是對(duì)話(huà)聊天類(lèi)。這一類(lèi)倒也并不陌生,是在A(yíng)IGC典型場(chǎng)景下誕生的AI社交產(chǎn)品。有了ChatGPT加持,不僅驗(yàn)證了AIGC乃至AGI的技術(shù)趨勢(shì),從產(chǎn)品的角度來(lái)看,還可以豐富他們的表達(dá)和組織語(yǔ)言的能力。
像AI對(duì)話(huà)軟件Glow、小冰等產(chǎn)品,也都在這場(chǎng)ChatGPT浪潮中吸引著資本市場(chǎng)的目光。
不過(guò)他們需要應(yīng)對(duì)的,是更嚴(yán)格的監(jiān)管和更復(fù)雜的內(nèi)容審查能力,從最近ChatGPT黑化、Bing發(fā)瘋等現(xiàn)象就可見(jiàn)一斑。
第三是產(chǎn)業(yè)類(lèi),這是以百度、科大訊飛等為代表的產(chǎn)業(yè)玩家,他們本身有深厚的技術(shù)與生態(tài)積累。
但場(chǎng)景中的高質(zhì)量數(shù)據(jù)要求,以及專(zhuān)業(yè)性強(qiáng)、容錯(cuò)率低等特性,決定了他們需要徹底解決ChatGPT“一本正經(jīng)地胡說(shuō)八道”的問(wèn)題,這顯然也不是短期可以實(shí)現(xiàn)的。
總的來(lái)看,國(guó)內(nèi)玩家的角色定位逐漸明晰,他們都有各自的場(chǎng)景和數(shù)據(jù)。但不可否認(rèn)的是,要讓ChatGPT能真正用起來(lái),核心依舊繞不開(kāi)技術(shù)。
從ChatGPT已具備的能力來(lái)看,它在長(zhǎng)文本理解、代碼生成、邏輯推理等功能上都做到了令人驚艷的效果。這一點(diǎn)國(guó)內(nèi)的確存在一定客觀(guān)差距,需要持續(xù)不斷地迭代和追趕。但技術(shù)上一旦實(shí)現(xiàn),結(jié)合場(chǎng)景數(shù)據(jù)也能快速落地。
開(kāi)箱即用,就是最快、也是最有效的迭代方式。
一如ChatGPT剛上線(xiàn)之時(shí),一方面,用戶(hù)給出直接的技術(shù)反饋,開(kāi)發(fā)者來(lái)以此對(duì)癥下藥。當(dāng)時(shí)網(wǎng)友吐槽數(shù)學(xué)邏輯性不強(qiáng)、存在事實(shí)性錯(cuò)誤等問(wèn)題,OpenAI在后續(xù)更新時(shí)也在逐漸解決優(yōu)化;
另一方面,用戶(hù)充當(dāng)免費(fèi)“提示工程師”的角色,幫助產(chǎn)品解決更多長(zhǎng)尾場(chǎng)景,激發(fā)更多技術(shù)能力。比如就有人在GitHub上梳理了ChatGPT的提示詞文檔。
秘塔科技在此先行一步,值得更多玩家參考。
感興趣的旁友可戳下方鏈接或進(jìn)入微信小程序“對(duì)話(huà)寫(xiě)作貓”,搶先體驗(yàn)啦!
玩耍地址:
https://xiezuocat.com/chat