100年前的北京Vlog火了!大神利用AI修復(fù)古董紀(jì)錄片,還原1920年的京城生活
十三 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
百年前的北京是什么樣子?
最近,一位叫大谷Spitzer的微博網(wǎng)友,便利用AI技術(shù),將人民日?qǐng)?bào)4年前發(fā)布的1920年北京黑白影像資料,做了修復(fù)工作:完成了上色、修復(fù)幀率、擴(kuò)大分辨率等步驟。
如此工作滿足了大批網(wǎng)友的好奇心,視頻一經(jīng)發(fā)布便得到了大量的關(guān)注:分享超過12萬次、評(píng)論3萬+、點(diǎn)贊5萬+。
有網(wǎng)友評(píng)論到:
視頻里人怎么也想象不到,一百年后會(huì)有一個(gè)人躺在床上拿著一個(gè)神奇的物品能夠觀察到他們當(dāng)時(shí)的一舉一動(dòng)吧??茖W(xué)和巫術(shù)果然就是一線之隔。
還有網(wǎng)友贊嘆道:
Wow~ 一百年前的vlog。
不是概念的,宏觀的,文字的,被描述的,被審視的。完全打破我的模糊想象,被觸動(dòng)了。
當(dāng)然,還有感慨二環(huán)不堵了的……
話不多說,一起來體驗(yàn)下吧。
時(shí)光旅行,體驗(yàn)100年前的北京生活
1920年的北京,入城出城的“客流”還算較多,有騎馬的、有坐轎子的、有坐人力車的,當(dāng)然多數(shù)人還是步行。
而在城內(nèi)集市中,也是熙熙攘攘,好不熱鬧。當(dāng)然,在那個(gè)年代,人們應(yīng)該是對(duì)錄影設(shè)備感到非常新奇了,圖中的小哥駐足了良久,癡癡的看著鏡頭。
路邊街頭的小吃生意也是不錯(cuò)(看完想來一屜小籠包了……)。
寺廟里燒香拜佛的人們絡(luò)繹不絕,當(dāng)時(shí)的香火可比現(xiàn)在要鼎盛啊。
但細(xì)心的網(wǎng)友也發(fā)現(xiàn):除了寺廟,在大街上很少看見女人。
再來到巷子里的百姓生活:小孩買了吃的蹲坐在別人家門口,然后被趕走了……
還有熟人見面鞠躬打招呼的場(chǎng)景。
可以看到男女打招呼的方式還是有些區(qū)別。網(wǎng)友對(duì)此還調(diào)侃道:蘿卜蹲?
還有網(wǎng)友表示:真是百年巨變,沒想到一百年前這么懂禮節(jié)。
當(dāng)然,還有網(wǎng)友表示:100年了,狗狗長(zhǎng)得還是一樣的……
最后,讓我們一起來俯瞰百年前的北京城。
AI修復(fù)百年古董老電影
雖然博主大谷Spitzer沒有介紹具體采用了哪些AI技術(shù),但其實(shí)修復(fù)老電影的工作也有許多。
今年2月,我們報(bào)道了國(guó)外網(wǎng)友Denis Shiryaev利用一種增強(qiáng)程序(Gigapixel AI),將1896年的古董電影《火車進(jìn)站》,轉(zhuǎn)變成了4K 60fps高清“大電影”。
在修復(fù)幀率方面,主要采用的技術(shù)是AI插值。
據(jù)Shiryaev介紹,他采用的是一種叫做Gigapixel AI的商業(yè)圖像編輯軟件(付費(fèi))。這款軟件由Topaz實(shí)驗(yàn)室創(chuàng)造,可以讓圖像的質(zhì)量提升600%。
它利用一種專有的插值算法,對(duì)圖像做分析、識(shí)別其細(xì)節(jié)和結(jié)構(gòu),最后將額外的“信息”填充到圖像中。
這個(gè)工作量是什么概念?
普通的高清是1920×1080,總像素為2073600,而4K高清是3840×2160,總像素是8294400。
也就是說,光是要把普通高清提升到4K高清,就需要額外填充600萬個(gè)像素。
不僅如此,還需要弄清楚如何顯示這些額外的像素,這就是插值過程的用武之地。
插值估計(jì)每個(gè)新像素要顯示什么內(nèi)容,這個(gè)過程是基于它們周邊的像素。對(duì)于這一點(diǎn),有許多方法可以來衡量。
最近鄰?(Nearest Neighbor)方法,會(huì)簡(jiǎn)單地用與其最近鄰相同的顏色填充空白像素。它雖然簡(jiǎn)單而有效,但結(jié)果是一個(gè)鋸齒狀、明顯像素化的圖像。
雙線性插值?(Bilinear Interpolation)方法需要更多的處理能力,但它基于最近的兩個(gè)像素來分析空白像素,并在它們之間生成一個(gè)梯度,這會(huì)讓圖像變得更加清晰。
而雙三次插值?(Bicubic Interpolation)會(huì)對(duì)其16個(gè)最近鄰像素進(jìn)行了采樣,這樣就會(huì)讓著色變得精確,但仍然存在圖像模糊的問題。
通過結(jié)合雙線性插值和雙三次插值,就可以生成光學(xué)質(zhì)量損失最小的放大圖像。
而這一過程,Gigapixel AI利用深度卷積神經(jīng)網(wǎng)絡(luò)來完成。
解決了像素低的問題,還需要解決視頻卡頓問題。
Gigapixel AI在關(guān)鍵幀之間進(jìn)行“想像”之后,把這些想像出來的幀插進(jìn)去。
而它插入的幀數(shù)多到可以讓視頻速率提高到60 FPS。
這就是古董電影也能變得如此清晰、流暢的原因。
至于著色工作,同樣是利用神經(jīng)網(wǎng)絡(luò),從一堆彩色照片開始,將它們轉(zhuǎn)換成黑色和白色,然后再重建彩色原圖。
奉上完整視頻,你想穿越嗎?
最后,我們?cè)谖哪┓钌洗蠊萐pitzer的完整視頻鏈接,里面還在各個(gè)場(chǎng)景中配上了背景音樂。
如此的場(chǎng)景,令不少網(wǎng)友想起老舍先生《想北平》中的一段話:
我所愛的北平不是枝枝節(jié)節(jié)的一些什么,而是整個(gè)兒與我的心靈相黏合的一段歷史,一大塊地方,多少風(fēng)景名勝,從雨后什剎海的蜻蜓一直到我夢(mèng)里的玉泉山的塔影,都積湊到一塊,每一小的事件中有個(gè)我,我的每一思念中有個(gè)北平,這只有說不出而已。
那么,在看到百年前栩栩如生的生活狀態(tài),你會(huì)有想穿越回去的沖動(dòng)嗎?
快來評(píng)論區(qū)寫下你的感受吧~
參考鏈接:
https://weibo.com/2395607675/J0ZsQnP6a?filter=hot&root_comment_id=4502616270201172&type=comment
https://arstechnica.com/science/2020/02/someone-used-neural-networks-to-upscale-a-famous-1896-video-to-4k-quality/
- 商湯林達(dá)華萬字長(zhǎng)文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設(shè)計(jì),讓70年經(jīng)驗(yàn)“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機(jī)器人人人人人塞滿了!2025-08-08