他用GPT-3實現(xiàn)了「量子速讀」
有ChatGPT那味兒了
Alex 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
你是否曾為了查一個問題,翻書翻到頭禿?
要是書里有的內容,一問便知就好了……等等,“一問便知”,這怎么有ChatGPT那味兒了?
話說,有人還真就由此思路開發(fā)出一個聊天Bot,做示例的書是馬可·奧勒留的《沉思錄》(全書共12卷,497則)。
只用幾分鐘,AI就能記下全書內容。
然后隨便問個書里講過的東西,比如“如何處理負面情緒?”,AI可以快速掃描文本并給出高質量回答,甚至還一條條給你列好。

原帖一發(fā)布,網友紛紛圍觀點贊。

開發(fā)者Dan Shippers稱,做出這個AI并不難,主要功臣就是語言大模型GPT-3,另外再加幾行代碼就搞定了。

另外,這哥們兒甚至還嗅到了一絲商機:
網上現(xiàn)在有很多受版權保護的文本、音視頻資料集,都能被做成聊天機器人!
對想獲取信息的人來說,有時一看給了錢自己還要慢慢整理,可能就放棄了;而要是能通過AI快速鎖定目標內容的話,應該會有更多人愿意自掏腰包。

怎么做出來的?
用Dan哥的話來說,Bot制作過程主要分為3個步驟。
首先,當然是找到整活的素材。比如整本《沉思錄》。
Dan哥從網上下載了《沉思錄》原著,將其保存在Google Dive的一個文件夾中。通過Google Drive,用戶可以將文件存儲在云端,并在設備間同步、共享。
然后再在谷歌的云端編程平臺Colab上,運行下面這段Python代碼,既能訪問Google Drive,還能輕松實現(xiàn)與GPT-3的互動。

Dan介紹稱,GPT-3能以任何文本素材為基礎,給你整出一個聊天bot。
不過有個問題:單次能向GPT-3輸入的文本字數是有限的。
所以第二步,就是訪問存在Google Dive上的那個文件夾,再把整個文本素材劃分成一個個小塊,存到新的文件中。

第三步,當用戶提問時,先通過OpenAI的API訪問書中包含相關解釋的小塊內容,再把這些內容傳到GPT-3中,整理出語言通順的回答。
具體代碼如下:

到此,為整本《沉思錄》專門定制的聊天機器人就做好了。
除此之外,基于此基本思路,Dan哥又把他喜歡的某系列播客節(jié)目也做成了聊天Bot。
他說自己曾在節(jié)目中聽到一個感興趣的名詞,但忘了是啥意思。平時想弄明白的話,不得不把一集內容重新聽一遍。
但現(xiàn)在有了聊天Bot——重聽?不存在的。

Dan是何許人也?
話說回來,能從聊天機器上人看到新的商機,Dan哥的過往經歷或許也產生了一定影響。
他本科畢業(yè)于賓夕法尼亞大學的文科類哲學系,但這位哥其實還是個技術大佬。

他從小學5年級就開始編程,在大學期間又和小伙伴創(chuàng)辦了一家軟件公司FireFly,收入在六位數以上。
他還在上大二時,不少科技公司就已拋來橄欖枝,但人家都拒絕了,說是想先完成學業(yè)。
大學一畢業(yè),他把FireFly賣給了知名業(yè)務軟件公司Pegasystems,賺到第一桶金。
緊接著,他在Pega擔任起項目負責人,并把業(yè)務部門的收入提高到百萬美元級別。
再后來,他從Pega出來,于2020年又創(chuàng)辦一家公司Every,主要創(chuàng)作商業(yè)類簡報和播客,目前已有6萬+訂閱用戶。
(怪不得他會想到把播客內容做成聊天機器人)
目前除了自己開公司,Dan還兼任紅杉資本的Scout,為風投者出謀劃策。
參考鏈接:
[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/
- 北大開源最強aiXcoder-7B代碼大模型!聚焦真實開發(fā)場景,專為企業(yè)私有部署設計2024-04-09
- 剛剛,圖靈獎揭曉!史上首位數學和計算機最高獎“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語言模型綜述》重大升級2024-04-10
- 谷歌最強大模型免費開放了!長音頻理解功能獨一份,100萬上下文敞開用2024-04-10