中文「大大大大大」模型開源開放!從吟詩作畫寫代碼到蛋白質(zhì)預(yù)測全都有,源代碼可編程API均奉上
AI時代的新型基礎(chǔ)設(shè)施
魚羊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
中文領(lǐng)域的“大大大大大”模型,開源開放了!
一口氣10+個大模型聯(lián)手登場,能寫詩、寫作文、寫代碼,還能畫畫、做視頻、看圖說話。
戳進(jìn)主頁,不僅代碼可下載,Notebook、在線Demo也已就位。
直接就是在線可玩,開箱即用。
煉丹師福音還不止如此。
在這個名為魔搭ModelScope的開源社區(qū)里,你甚至可以1行代碼就實現(xiàn)模型推理:
△一行pipeline完成模型推理
10行代碼搞定調(diào)優(yōu)訓(xùn)練(finetune):
不得不說,這波開源有點(diǎn)東西。
如此大手筆,確實也并非哪家研究機(jī)構(gòu)的SOLO,而是由國內(nèi)AI工業(yè)界和學(xué)界聯(lián)合推動:
阿里達(dá)摩院與CCF開源發(fā)展委員會共同發(fā)起,首批合作機(jī)構(gòu)包括瀾舟科技、智譜AI、深勢科技、中國科學(xué)技術(shù)大學(xué)、浙江大學(xué)等,陣容蔚為壯觀。
更多細(xì)節(jié),咱們一起研究研究。
以模型為核心的中文AI開源社區(qū)
要說魔搭ModelScope有何不同之處,答案其實就在社區(qū)名字里:以模型為中心,搭建AI應(yīng)用服務(wù)。
因此社區(qū)剛成立,就已經(jīng)有300+模型上線,其中包括10多個大模型和150+ SOTA模型。并且其中1/3都支持中文。
就說最近大火的AI畫畫,在模型庫里一搜,就能找到對應(yīng)的模型。
點(diǎn)進(jìn)可體驗的通義-文本生成圖像大模型,即使你完全是AI小白,也能直接體驗。
比如讓AI生成一張“小雞戴墨鏡唱歌跳舞”的圖片。
結(jié)果是這樣的:
還有更潮酷的。
輸入“一張柯基犬在時代廣場騎自行車的照片。它戴著墨鏡和沙灘帽”,就能得到:
你想要什么樣的圖片?自己來試試吧,下面是傳送門:
紅極一時的GPT-3中文復(fù)刻版也在魔搭社區(qū)上架了,寫起古詩來可謂有模有樣。
在AI for Science方面,“中國版AlphaFold2”——深勢科技的Uni-Fold同樣亮相魔搭。
輸入蛋白質(zhì)單體的一級結(jié)構(gòu),就能在線預(yù)測蛋白質(zhì)的三級結(jié)構(gòu)啦。
此外,會寫爽文、以10億參數(shù)輕量化模型登頂CLUE(中文語言理解榜單)的瀾舟科技孟子系列模型,智譜AI同時支持101種語言的預(yù)訓(xùn)練模型……都能在魔搭上找到并體驗。
并且正如前文所說,魔搭提供的不僅僅是模型下載和使用,還把環(huán)境安裝、推理驗證、訓(xùn)練調(diào)優(yōu)、模型部署的一站式服務(wù)都搭好了。
環(huán)境安裝方面,魔搭支持本地環(huán)境快捷安裝,提供了Python whl包安裝和源碼安裝。
同時也支持云端Notebook免安裝,一鍵就能開啟在線Notebook實訓(xùn)平臺。
模型推理方面,基于魔搭提供的封裝Python SDK,開發(fā)者只寫一行代碼,就能快速驗證和使用模型。
模型調(diào)優(yōu)方面,魔搭同樣提供了簡單易用的調(diào)用接口,以及靈活的配置文件設(shè)計,實現(xiàn)了10行代碼運(yùn)行一個調(diào)優(yōu)任務(wù)。
最后,在模型部署上,魔搭支持云端、本地、設(shè)備端等多種部署方式。
值得一提的是,魔搭還給開發(fā)者們提供了不少免費(fèi)算力資源。
其中,8核32G的CPU資源不僅免費(fèi),還可無限續(xù)杯。
GPU算力方面,則有16小時的免費(fèi)V100資源可用。并且多貢獻(xiàn)多得。
魔搭社區(qū),為什么是現(xiàn)在?
那么,問題來了,這么多家產(chǎn)業(yè)界和學(xué)術(shù)界研究機(jī)構(gòu),怎么就湊到一塊兒搞起新的開源平臺來了?
究其根本,其實還是一個AI落地應(yīng)用,尤其是AI大模型產(chǎn)業(yè)化應(yīng)用的問題。
一方面,我們能看到,AI技術(shù)正在各個領(lǐng)域迅猛發(fā)展。在頂尖的學(xué)界、產(chǎn)業(yè)界研究機(jī)構(gòu)里,AI模型們的更新迭代可謂是日新月異。
但另一方面,AI技術(shù)本身的門檻仍然很高。尤其是在大模型上,以模型為核心,算法、算力、數(shù)據(jù)三位一體的重要性更加突顯。
更不用說,到了具體的應(yīng)用層面,由于現(xiàn)在的技術(shù)仍無法實現(xiàn)“一個模型打天下”,后續(xù)還有大量模型調(diào)優(yōu)、二次開發(fā)工作要做。
開源無疑是推動AI技術(shù)更快走向大眾的神兵利器。
問題是,在今天,盡管GitHub之類的代碼托管平臺已經(jīng)非常成熟,但各種開源資源實際上還是非常分散,并且往往被框架、渠道等因素所限制。
也就是說,對于更廣大的開發(fā)人員來說,現(xiàn)在仍缺少統(tǒng)一的中立社區(qū),能把海量模型、算力、數(shù)據(jù)高效地匯聚到一處。
就是在這樣的背景之下,達(dá)摩院等中國AI玩家們一拍即合,共同攢出了魔搭這么一個大招。
簡單來說,魔搭社區(qū)核心提供的價值就是“模型即服務(wù)(Model as a Service,簡稱MaaS)”:
開源,并且提供開源之后模型的使用服務(wù)。
讓普通開發(fā)者能更低門檻地把模型跑起來。讓AI,尤其是AI大模型不再是少數(shù)人的游戲。
從這個意義上來說,我們可以將模型分散開源視作AI開源的1.0模式,而魔搭社區(qū)則是在探索AI開源2.0時代的新范式。
說到MaaS,其實并非全新概念。
之所以此前并未激起太大水花,與其本身面臨的困難不無關(guān)系:
一方面,需要AI技術(shù)、優(yōu)質(zhì)模型本身的積累達(dá)到一定數(shù)量。
另一方面,圍繞模型展開服務(wù)也就意味著大量資源的調(diào)度。
簡而言之,單靠一家公司、一個機(jī)構(gòu)是很難真正做到“模型即服務(wù)”的。
因而此中國科研機(jī)構(gòu)們強(qiáng)強(qiáng)聯(lián)手,積極貢獻(xiàn)出一大波先進(jìn)大模型、SOTA模型,屬實不易。
對于本土AI開發(fā)者而言,不可謂不是一個好的開始。
阿里巴巴集團(tuán)資深副總裁、達(dá)摩院副院長周靖人還透露,接下來,魔搭社區(qū)還會每月上新,達(dá)摩院將長期支持社區(qū)的維護(hù)和發(fā)展。
AI時代的新型基礎(chǔ)設(shè)施
如果將AI技術(shù)帶來的變革視作第四次工業(yè)革命,那么AI技術(shù)的落地,終將從依賴專家調(diào)參的手工作坊時代,走向工業(yè)化大生產(chǎn)時代。
在這其中,預(yù)訓(xùn)練模型就是關(guān)鍵所在。
中國計算機(jī)學(xué)會副理事長、瀾舟科技創(chuàng)始人兼CEO周明博士表示:
魔搭這樣的AI模型社區(qū)堪稱AI時代的基礎(chǔ)設(shè)施,能將預(yù)訓(xùn)練模型以較低門檻提供給廣大開發(fā)者,讓AI惠及全社會。
中國科學(xué)院院士、CCF開源發(fā)展委員會主任王懷民也認(rèn)為:
開源是AI發(fā)展的重要驅(qū)動力,魔搭作為新型的AI開源社區(qū),不僅將有力推動AI邁向廣泛的落地應(yīng)用,還將助力中國從開源世界的參與者逐步成長為引領(lǐng)者。
需要正視的是,作為國內(nèi)第一個MaaS社區(qū),魔搭還只是一個開始。
只有當(dāng)更多開發(fā)者參與其中,在得到模型服務(wù)的同時,讓AI在各個領(lǐng)域應(yīng)用落地,不斷拓展AI模型新的發(fā)展空間和可能性,這樣一個開源社區(qū)才能真正work。
我們離大規(guī)模、可復(fù)制的AI大工業(yè)時代,才可能更近一步。
那么,你會參與進(jìn)來嗎?
魔搭社區(qū)地址:modelscope.cn
— 完 —