桌面版ChatGPT登臺(tái)演講,能視頻通話還會(huì)實(shí)時(shí)讀屏,GPT-4o最新demo再次驚艷:“能力還是被低估了”
還有Sora最新作品一同亮相
克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
GPT-4o桌面端最新Demo,與Sora的新作品一同亮相“歐洲AI春晚”VivaTech。
現(xiàn)場,OpenAI工作人員不僅展示了觀眾期待已久的“視頻通話”,還試著讓ChatGPT發(fā)表了演講。
在視頻聊天當(dāng)中,即使給它的只有一幅抽象的簡筆畫,它也能立馬get到這是巴黎地標(biāo)。
然后再給它看一眼地鐵圖,指一指當(dāng)前位置,就能火速設(shè)計(jì)出乘車路線。
而且,除了能像移動(dòng)端一樣通過攝像頭感知環(huán)境之外,桌面端的ChatGPT還能夠?qū)ζ聊粌?nèi)容進(jìn)行讀取,結(jié)合代碼現(xiàn)場debug。
一系列震撼的演示效果,讓前線的Tom’s Guide編輯Ryan Morrison感嘆,GPT的語音功能和GPT-4o的潛力,看來是被低估了。
桌面端“視頻通話”震撼全場
在現(xiàn)場給400多名觀眾演示ChatGPT最新功能的,是OpenAI開發(fā)者體驗(yàn)主管Romain Huet。
本來Huet打算用手機(jī)來演示,結(jié)果受到現(xiàn)場技術(shù)條件限制無法展示,于是改用Mac,但也正是如此觀眾們才有機(jī)會(huì)看到它的屏幕讀取能力。
一開始,Huet問ChatGPT能不能給現(xiàn)場的觀眾講一點(diǎn)什么,然后ChatGPT真就像模像樣地打起了招呼。
不過Huet覺得這樣的開場白還不夠有氣勢,于是提示它面前是一大群人,它馬上就心領(lǐng)神會(huì),改用了更“燃”的措辭和語氣。
當(dāng)然,Huet沒有讓ChatGPT一直講下去,而是在做完開場白之后改由自己來介紹其最新功能。
所有對話,即使跨越語言也能快速響應(yīng),現(xiàn)場Huet就要求ChatGPT把自己說的英文翻譯成法語,整個(gè)過程行云流水。
另外,看上去是bug,但也許是feature的一點(diǎn)是,翻譯出的法語還帶著一些美國口音,不過Huet表示之后會(huì)進(jìn)行優(yōu)化,讓ChatGPT說外(非英)語時(shí)更像當(dāng)?shù)厝恕?/p>
又是一通補(bǔ)充講解之后,人們期待的“視頻通話”功能終于正式登場了。
只見Huet現(xiàn)場用筆畫出了埃菲爾鐵塔和凱旋門的草圖,結(jié)果ChatGPT只看了一眼就直接識(shí)破。
Huet自己也打趣地對它說,”非常感謝你,我畫的這么爛你都能看懂?!?/p>
這還沒完,Huet緊接著又掏出了一張巴黎地鐵圖,用手指了指當(dāng)前的大概位置。
然后,ChatGPT立刻就給出了前往埃菲爾鐵塔的乘車路線,隨著Huet的一句Thank You,現(xiàn)場爆發(fā)了潮水般的掌聲。
作為OpenAI負(fù)責(zé)開發(fā)者體驗(yàn)的主管,Huet和ChatGPT一起現(xiàn)場搞起了代碼。
Huet通過復(fù)制到剪貼板的方式,讓客戶端讀取了一段React框架編寫的網(wǎng)頁代碼,結(jié)果ChatGPT立馬就把代碼的語言、功能介紹得頭頭是道。
甚至還當(dāng)眾進(jìn)行了Debug,通過讓ChatGPT讀取屏幕,Huet告訴它目前這個(gè)網(wǎng)頁存在不能根據(jù)屏幕寬度進(jìn)行適配的問題。
通過幾輪對話,Huet成功借助ChatGPT的幫助,完美解決了這個(gè)問題,再次收獲了觀眾的掌聲。
One More Thing
在現(xiàn)場,Huet還播放了一段用Sora為大會(huì)創(chuàng)作的新視頻,由于現(xiàn)場生成時(shí)間較長,觀眾看到的視頻預(yù)先制作好的,這也是活動(dòng)中唯一一個(gè)提前做好的效果。
一同展示的還有聲音克隆引擎Voice Engine,Huet錄制了一段20秒的聲音樣本,并用VE進(jìn)行了完美復(fù)刻,而且只需一個(gè)按鈕,就能從英語切換到法語、日語等其他語言,并在Sora中應(yīng)用。
不過由于安全問題仍未解決,Sora和Voice Engine依舊不能公開發(fā)布,想體驗(yàn)的朋友要再等一等了。
另外,說到克隆聲音的問題,寡姐和OpenAI關(guān)于Sky的爭議剛好也有了新消息。
華盛頓郵報(bào)稱,根據(jù)其所獲得的文件和錄音顯示,給Sky配音的女演員的確另有其人。
而且,寡姐所稱的受到奧特曼邀請發(fā)生在去年9月,而配音演員的招募在5月就已開始。
不過,仍然有網(wǎng)友認(rèn)為,就算真的是另找了一名演員,也不能說明OpenAI就沒有模仿寡姐的意圖。
但無論OpenAI的意圖如何,真正給Sky配音的演員卻是無辜的,也有表演的權(quán)利。
不少網(wǎng)友發(fā)聲對她表示同情:
Sky的配音演員同樣有權(quán)利使用她自己的聲音,難道因?yàn)椋ü呀悖┦敲?,所擁有的知識(shí)產(chǎn)權(quán)就比普通人更多嗎?
進(jìn)一步地,我認(rèn)為雖然“OpenAI侵犯了寡姐的‘公開權(quán)’”這個(gè)觀點(diǎn)比單純的侵犯知識(shí)產(chǎn)權(quán)的想法好些,但仍然站不住腳。
總之,寡姐拋向OpenAI的子彈仍未落地,我們不妨一邊吃瓜,一邊等待著GPT-4o視頻對話的正式更新。
參考鏈接:
[1]https://vimeo.com/949419199
[2]https://www.tomsguide.com/ai/chatgpt/i-finally-saw-a-live-demo-of-chatgpt-4o-voice-if-anything-it-is-underhyped
[3]https://www.washingtonpost.com/technology/2024/05/22/openai-scarlett-johansson-chatgpt-ai-voice/