各種AI模型拿來就能用!五大深度學習模型庫大盤點
乾明 編輯整理
量子位 出品 | 公眾號 QbitAI
你知道PyTorch Hub嗎?
這個Facebook的深度學習模型庫,一問世就引發(fā)了巨大關(guān)注。
因為它太強了:
ResNet、BERT、GPT、VGG、PGAN、MobileNet等深度學習領(lǐng)域的經(jīng)典模型,只需輸入一行代碼,就能一鍵調(diào)用。
不過,人工智能領(lǐng)域,這樣的模型庫不僅僅只有PyTorch Hub一個,還有其他4個(來自@愛可可-愛生活):
TensorFlow Hub、TensorFlow Models、Model Zoo、Models – IBM Developer
在這些地方,深度學習模型同樣能夠“拿來就能用”。
PyTorch Hub
官方介紹,PyTorch Hub是一個簡易API和工作流程,為復現(xiàn)研究提供了基本構(gòu)建模塊,包含預訓練模型庫。
PyTorch Hub支持Colab,能與論文代碼結(jié)合網(wǎng)站Papers With Code集成,用于更廣泛的研究。
此外,F(xiàn)acebook還鼓勵學者把自己的模型發(fā)布到這里來,來讓PyTorch Hub越來越強大。
目前,PyTorch Hub有26個模型可以使用,它們分別是:
Deeplabv3-ResNet101、Transformer (NMT)、WaveGlow、ResNext WSL、DCGAN on FashionGen、Progressive Growing of GANs (PGAN)、BERT、GPT、GPT-2、Transformer-XL、U-Net for brain MRI、SSD、Tacotron 2、RoBERTa、AlexNet、Densenet、FCN-ResNet101、GoogLeNet、Inception_v3、MobileNet v2、ResNet、ResNext、ShuffleNet v2、SqueezeNet、vgg-nets、Wide ResNet
PyTorch Hub:
https://pytorch.org/hub
GitHub地址:
https://github.com/pytorch/hub
相關(guān)報道:
PyTorch Hub發(fā)布!一行代碼調(diào)用最潮模型,圖靈獎得主強推
TensorFlow Hub
官方介紹,TensorFlow Hub是一個庫,用于發(fā)布、發(fā)現(xiàn)和使用機器學習模型中可重復利用的部分。
模塊是一個獨立的 TensorFlow 圖部分,其中包含權(quán)重和資源,可以在一個進程中供不同任務(wù)重復使用(稱為遷移學習)。
從而實現(xiàn)使用較小的數(shù)據(jù)集訓練模型;改善泛化效果,以及加快訓練速度。
目前,TensorFlow Hub一共有20個API、75個用于文本嵌入的模塊、71個用于圖像特征向量模塊,以及2個用于視頻分類的模塊等等。
模塊基本上全來自谷歌官方,來自谷歌AI的有大多數(shù),還有一些來自DeepMind。
TensorFlow Hub支持使用語言、網(wǎng)絡(luò)、提供者、數(shù)據(jù)集以及類型來對模塊進行精確篩查。其中有8個模塊支持中文。
TensorFlow Hub:
https://www.tensorflow.org/hub
GitHub地址:
https://github.com/tensorflow/hub
TensorFlow Models
一個GitHub上的存儲庫,包含了許多在TensorFlow中實現(xiàn)的模型,一共分為兩類:官方模型和研究模型。
官方模型,是使用TensorFlow的高級API的示例模型的集合。
它們能夠得到良好的維護、測試,并與最新的穩(wěn)定的TensorFlow API保持同步。項目創(chuàng)建者表示,推薦新的TensorFlow用戶從這里開始,目前可用的模型有:
BERT、Boosted Trees、MNIST、ResNet、Transformer、Wide_deep
研究模型,是研究人員在TensorFlow中實現(xiàn)的大量模型集合。它們在發(fā)布分支中不受官方支持或不可用;模型維護等方面取決于各個研究人員。目前有51個模型,覆蓋計算機視覺、自然語言處理領(lǐng)域等等。
TensorFlow Models:
https://github.com/tensorflow/models/
Model Zoo
這個平臺,由新加坡名為Jing Yu Koh本科生牽頭搭建。與上述的幾個平臺不同,這個平臺上提供預訓練模型,不僅僅只是完全針對于Pytorch或者TensorFlow。
在每個模型上,會標注出這個模型在GitHub的標星數(shù)量,模型適用的框架、領(lǐng)域以及模型的使用條件/用途。
目前已經(jīng)收集了數(shù)百個模型,覆蓋的領(lǐng)域包括計算機視覺、自然語言處理、強化學習、無監(jiān)督學習、音頻和語音、生成模型。
涉及到的框架有:TensorFlow、Caffe、Caffe2、PyTorch、MXNet、Keras、Chainer。
Model Zoo:
https://modelzoo.co/
Models – IBM Developer
IBM開放的預訓練深度模型庫,目前一共有32個模型,分為可部署和可訓練模型兩類,涉及18個領(lǐng)域,分別是:
聲音分類、音頻特征提取、音頻建模、面部識別、圖像分類、圖像特征提取、圖像到圖像的翻譯或轉(zhuǎn)換、圖像到文本的翻譯、語言建模、命名實體識別、自然語言處理、圖片中的目標檢測、安全、文本分類、文本特征提取、文本到圖像的翻譯、時間序列預測、視頻分類
Models – IBM Developer
https://developer.ibm.com/exchanges/models/all/
小結(jié)
最后,小小總結(jié)一下。
上文提到的這些深度模型庫中,有一些是專用的,比如PyTorch Hub、TensorFlow Hub和TensorFlow Models,只能夠在PyTorch框架或者TensorFlow中使用,但其使用起來非常方便,能夠快速調(diào)用部署。
其他的,比如Model Zoo則是由個人開發(fā)者收集,覆蓋面很廣泛,模型也很多,但相對來說,部署起來并沒有直接利用PyTorch Hub或TensorFlow Hub方便。
大家可以根據(jù)自己的需求選擇相應(yīng)深度學習庫。
利用好了,可以事半功倍~