他用GPT-3實現(xiàn)了「量子速讀」
有ChatGPT那味兒了
Alex 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
你是否曾為了查一個問題,翻書翻到頭禿?
要是書里有的內(nèi)容,一問便知就好了……等等,“一問便知”,這怎么有ChatGPT那味兒了?
話說,有人還真就由此思路開發(fā)出一個聊天Bot,做示例的書是馬可·奧勒留的《沉思錄》(全書共12卷,497則)。
只用幾分鐘,AI就能記下全書內(nèi)容。
然后隨便問個書里講過的東西,比如“如何處理負面情緒?”,AI可以快速掃描文本并給出高質(zhì)量回答,甚至還一條條給你列好。

原帖一發(fā)布,網(wǎng)友紛紛圍觀點贊。

開發(fā)者Dan Shippers稱,做出這個AI并不難,主要功臣就是語言大模型GPT-3,另外再加幾行代碼就搞定了。

另外,這哥們兒甚至還嗅到了一絲商機:
網(wǎng)上現(xiàn)在有很多受版權(quán)保護的文本、音視頻資料集,都能被做成聊天機器人!
對想獲取信息的人來說,有時一看給了錢自己還要慢慢整理,可能就放棄了;而要是能通過AI快速鎖定目標(biāo)內(nèi)容的話,應(yīng)該會有更多人愿意自掏腰包。

怎么做出來的?
用Dan哥的話來說,Bot制作過程主要分為3個步驟。
首先,當(dāng)然是找到整活的素材。比如整本《沉思錄》。
Dan哥從網(wǎng)上下載了《沉思錄》原著,將其保存在Google Dive的一個文件夾中。通過Google Drive,用戶可以將文件存儲在云端,并在設(shè)備間同步、共享。
然后再在谷歌的云端編程平臺Colab上,運行下面這段Python代碼,既能訪問Google Drive,還能輕松實現(xiàn)與GPT-3的互動。

Dan介紹稱,GPT-3能以任何文本素材為基礎(chǔ),給你整出一個聊天bot。
不過有個問題:單次能向GPT-3輸入的文本字數(shù)是有限的。
所以第二步,就是訪問存在Google Dive上的那個文件夾,再把整個文本素材劃分成一個個小塊,存到新的文件中。

第三步,當(dāng)用戶提問時,先通過OpenAI的API訪問書中包含相關(guān)解釋的小塊內(nèi)容,再把這些內(nèi)容傳到GPT-3中,整理出語言通順的回答。
具體代碼如下:

到此,為整本《沉思錄》專門定制的聊天機器人就做好了。
除此之外,基于此基本思路,Dan哥又把他喜歡的某系列播客節(jié)目也做成了聊天Bot。
他說自己曾在節(jié)目中聽到一個感興趣的名詞,但忘了是啥意思。平時想弄明白的話,不得不把一集內(nèi)容重新聽一遍。
但現(xiàn)在有了聊天Bot——重聽?不存在的。

Dan是何許人也?
話說回來,能從聊天機器上人看到新的商機,Dan哥的過往經(jīng)歷或許也產(chǎn)生了一定影響。
他本科畢業(yè)于賓夕法尼亞大學(xué)的文科類哲學(xué)系,但這位哥其實還是個技術(shù)大佬。

他從小學(xué)5年級就開始編程,在大學(xué)期間又和小伙伴創(chuàng)辦了一家軟件公司FireFly,收入在六位數(shù)以上。
他還在上大二時,不少科技公司就已拋來橄欖枝,但人家都拒絕了,說是想先完成學(xué)業(yè)。
大學(xué)一畢業(yè),他把FireFly賣給了知名業(yè)務(wù)軟件公司Pegasystems,賺到第一桶金。
緊接著,他在Pega擔(dān)任起項目負責(zé)人,并把業(yè)務(wù)部門的收入提高到百萬美元級別。
再后來,他從Pega出來,于2020年又創(chuàng)辦一家公司Every,主要創(chuàng)作商業(yè)類簡報和播客,目前已有6萬+訂閱用戶。
(怪不得他會想到把播客內(nèi)容做成聊天機器人)
目前除了自己開公司,Dan還兼任紅杉資本的Scout,為風(fēng)投者出謀劃策。
參考鏈接:
[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/
- 北大開源最強aiXcoder-7B代碼大模型!聚焦真實開發(fā)場景,專為企業(yè)私有部署設(shè)計2024-04-09
- 剛剛,圖靈獎揭曉!史上首位數(shù)學(xué)和計算機最高獎“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語言模型綜述》重大升級2024-04-10
- 谷歌最強大模型免費開放了!長音頻理解功能獨一份,100萬上下文敞開用2024-04-10