国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

PaddleHub 1.0正式發(fā)布：一鍵模型加載，十行代碼完成遷移學習

量子位的朋友們 2019-07-08 14:56:03 來源：量子位

允中發(fā)自凹非寺

量子位編輯 | 公眾號 QbitAI

飛槳(PaddlePaddle)核心框架Paddle Fluid v1.5已經(jīng)發(fā)布，而作為其關鍵工具，用來遷移學習的PaddleHub也進行了全面更新，正式發(fā)布了1.0版本。

全新的PaddleHub模型和任務更加豐富，為用戶提供了覆蓋文本、圖像和視頻三大領域八大任務的40+預訓練模型，同時還在飛槳官網(wǎng)上開辟了PaddleHub的網(wǎng)頁。

本文將對PaddleHub及其更新做更加全面的介紹。

PaddleHub是什么

深度學習模型的價值在AI時代不斷增大。要想得到一個高質(zhì)量的深度學習模型，離不開4個要素，優(yōu)秀的算法、充足的算力、豐富的數(shù)據(jù)以及專家知識。大家在深度學習中常常遇到以下問題：

一些研究領域只有少量標注數(shù)據(jù)，且數(shù)據(jù)標注成本較高，不足以訓練一個足夠魯棒的神經(jīng)網(wǎng)絡
大規(guī)模神經(jīng)網(wǎng)絡的訓練依賴于大量的計算資源，這對于一般用戶而言難以實現(xiàn)
應對于普適化需求的模型，在特定應用上表現(xiàn)不盡如人意

PaddleHub就是為了解決對深度學習模型的需求而開發(fā)的工具。

它基于飛槳領先的核心框架，精選效果優(yōu)秀的算法，提供了百億級大數(shù)據(jù)訓練的預訓練模型，方便用戶不用花費大量精力從頭開始訓練一個模型。PaddleHub可以便捷地獲取這些預訓練模型，完成模型的管理和一鍵預測。

配合使用Fine-tune API，可以基于大規(guī)模預訓練模型快速完成遷移學習，讓預訓練模型能更好地服務于用戶特定場景的應用。

PaddleHub有什么特色

1、通過PaddleHub，開發(fā)者可以便捷地獲取飛槳生態(tài)下的所有預訓練模型，涵蓋了圖像分類、目標檢測、詞法分析、語義模型、情感分析、語言模型、視頻分類、圖像生成八類主流模型40余個，如圖1 所示。飛槳還發(fā)布了PaddleHub的官方網(wǎng)頁，對各個預訓練模型的應用提供了詳實的介紹。

△?圖1 PaddleHub提供了40+官方預訓練模型

2、PaddleHub引入了模型即軟件的概念，通過Python API或者命令行工具，一鍵完成預訓練模型地預測。此外還借鑒了Anaconda和pip軟件包管理的理念設計了一套命令行接口。

深度學習時代，模型發(fā)展的趨勢會逐漸向軟件工程靠攏；未來模型可以當作一個可執(zhí)行程序，一鍵預測；也可以是第三方庫，通過模型插拔的方式提高開發(fā)者的開發(fā)效率。

同時模型會有版本的概念，通過不斷迭代升級的方式提升我們模型的效果。通過命令行工具，可以方便快捷的完成模型的搜索、下載、安裝、預測等功能，對應的關鍵的命令分別是search，download，install，run等。

如以下示例，在安裝完成飛槳和PaddleHub以后（具體安裝方法見后文示例），使用詞法分析模型LAC，可以一鍵實現(xiàn)分詞。

$ hub run lac --input_text "今天是個好日子"
[{'word': ['今天', '是', '個', '好日子'], 'tag': ['TIME', 'v', 'q', 'n']}]

再如以下示例所示，是一個目標檢測的例子，通過hub run 調(diào)用不同的目標檢測模型，一行即可完成預測，同時也可以快速體驗哪個模型能更符合開發(fā)的需求。

$ hub run yolov3_coco2017 --input_path test.jpg 
$ hub run faster_rcnn_coco2017 --input_path test.jpg

△?圖2 PaddleHub一鍵完成預訓練模型地預測

3、通過PaddleHub Fine-tune API，結(jié)合少量代碼即可完成大規(guī)模預訓練模型的遷移學習。下面一節(jié)我們也會全面介紹PaddleHub的API。

PaddleHub API全景

PaddleHub API的全景圖如圖3所示。

為了更好幫助用戶更好的應用預訓練模型，PaddleHub對Fine-tune做了6個層次的抽象。

△?圖3 PaddleHub Fine-tune API全景

數(shù)據(jù)集Dataset：PaddleHub提供多種NLP任務和CV任務的數(shù)據(jù)集，用戶也可以在自定義數(shù)據(jù)集上完成Fine-tune。
數(shù)據(jù)預處理Reader：PaddleHub的數(shù)據(jù)預處理模塊Reader對常見的NLP和CV任務進行了抽象。
預訓練模型Module：Module代表了一個預訓練模型。
優(yōu)化策略Strategy：在PaddleHub中，Strategy類封裝了一系列適用于遷移學習的Fine-tune策略。Strategy包含了對預訓練參數(shù)使用什么學習率變化策略，使用哪種類型的優(yōu)化器，使用什么類型的正則化等。
運行配置 RunConfig：在PaddleHub中，RunConfig代表了在對Task進行Fine-tune時的運行配置。包括運行的epoch次數(shù)、batch的大小、是否使用GPU訓練等。
遷移任務Task：PaddleHub預置了常見任務的Task。Task代表了一個Fine-tune的任務。任務中包含了執(zhí)行該任務相關的Program、數(shù)據(jù)Reader、運行配置等內(nèi)容。每種Task都有自己特有的應用場景以及提供了對應的度量指標，用于適應用戶的不同需求。預置的任務類型包括圖像分類、文本分類、序列分類和多標簽分類各類任務。

PaddleHub還支持用戶可以通過繼承BasicTask來實現(xiàn)自己的任務。

PaddleHub封裝了finetune、eval、finetune_and_eval、predict等直觀的基礎接口，讓開發(fā)者更方便完成模型的遷移和應用。

如何快速開始

△?圖4 PaddleHub Fine-tune API使用

接下來本文結(jié)合實際案例，講述如何快速使用PaddleHub實現(xiàn)十行代碼完成文本分類遷移。

場景是標注數(shù)據(jù)不多中文文本分類場景，如何提高分類的精度和模型的泛化能力。

這里的方案是借助ERNIE + PaddleHub Finetune API，除去安裝，只想要5個步驟，10行代碼即可解決這一問題。

這里先介紹一下ERNIE，它是百度發(fā)布的知識增強的預訓練模型，通過建模海量數(shù)據(jù)中的詞、實體及實體關系，學習真實世界的語義知識。

具體來說，ERNIE 模型通過對詞、實體等語義單元的掩碼，使得模型學習完整概念的語義表示。

相較于 BERT 學習原始語言信號，ERNIE 直接對先驗語義知識單元進行建模，增強了模型語義表示能力。

ERNIE在多個公開的中文數(shù)據(jù)集上進行了效果驗證，包括語言推斷、語義相似度、命名實體識別、情感分析、問答匹配等自然語言處理各類任務上，均超越了語義表示模型 BERT 的效果。

接下來開始實戰(zhàn)演練PaddleHub。

1. 安裝

$ pip install paddlepaddle 
#CPU安裝命令

或者

$ pip install paddlepaddle-gpu # GPU安裝

以上命令是安裝CPU或者GPU版本的飛槳。通過以下命令則可以安裝PaddleHub。

$ pip install paddlehub

另外，PaddleHub內(nèi)置了深度學習可視化工具VisualDL的依賴，通過VisualDL，可以很好的對深度學習任務進行可視化。

2. 選擇預訓練模型

在完成安裝飛槳與PaddleHub，import導入相應模塊后，一行代碼即可加載預訓練模型。只要1分鐘，你就能得到萬級別GPU小時訓練出來的ERNIE模型。當然也可以支持BERT模型調(diào)用，只需要更換不同的模型名稱即可。

import paddle.fluid as fluid
import paddlehub as hub
module = hub.Module(name="ernie")
inputs, outputs, program = module.context(trainable=True, max_seq_len=128)

第二步是獲取模型上下文，包括了預訓練模型的輸入Tensor，輸出Tensor還有計算圖。這里面有個關鍵參數(shù)是trainable。如果trainable為True，那么就是一個fine-tune的任務，預訓練模型的參數(shù)會做微調(diào)，以更好的適應頂層的應用、如果trainable為False，那么就預訓練模型參數(shù)保持不變，將它當作特征提取器。對于ERNIE模型而言，不推薦使用特征提取，一定要通過Finetune的方式才能取得更好的效果。

3. 數(shù)據(jù)處理

選擇模型后就是進行數(shù)據(jù)預處理，針對不同的遷移任務做了一系列數(shù)據(jù)處理的封裝。

dataset = hub.dataset.ChnSentiCorp()
reader = hub.reader.ClassifyReader(
 dataset=dataset,
 vocab_path=module.get_vocab_path(),
 max_seq_len=128)

hub.dataset.ChnSentiCorp() 會自動從網(wǎng)絡下載數(shù)據(jù)集并解壓到用戶目錄下。

4. 策略配置

接下來開始配置Fine-tune時用到的優(yōu)化策略。針對ERNIE與BERT類任務，PaddleHub封裝了適合這一任務的遷移學習優(yōu)化策略AdamWeightDecayStrategy

strategy = hub.AdamWeightDecayStrategy(
 learning_rate=5e-5,
 weight_decay=0.01,
 lr_scheduler="linear_decay",
)
config=hub.RunConfig(use_cuda=True, num_epoch=3,batch_size=32,checkpoint_dir=" ckpt_dir",strategy=strategy)

5. 創(chuàng)建遷移學習任務

組建移學習任務這塊也非常簡單，首先是選擇預訓練的模型輸出，作為我們句子的特征。

在這里ERNIE我們選擇pooled_output作為句子的特征輸出。也可以通過獲取sequence_output來得到詞粒度的特征，這個特征般用于序列標注。

pooled_output = outputs["pooled_output"]
# feed_list的Tensor順序不可以調(diào)整
feed_list = [
 inputs["input_ids"].name,
 inputs["position_ids"].name,
 inputs["segment_ids"].name,
 inputs["input_mask"].name,
]
cls_task = hub.TextClassifierTask(
 data_reader=reader,
 feature=pooled_output,
 feed_list=feed_list,
 num_classes=dataset.num_labels,
 config=config)
cls_task.finetune_and_eval()

Finetuning API非常智能，會自動完成評估，保存最優(yōu)模型還有自動可視化的功能。Finetune API訓練過程中會自動對關鍵訓練指標進行打點，啟動程序后執(zhí)行下面命令

$ visualdl --logdir ckpt_dir/vdllog -t ${HOST_IP}

其中${HOST_IP}為本機IP地址，如本機IP地址為192.168.0.1，用瀏覽器打開192.168.0.1:8040，其中8040為端口號，即可看到訓練過程中指標的變化情況

6. 模型預測

通過Finetune完成模型訓練后，在對應的ckpt_dir目錄下，會自動保存驗證集上效果最好的模型。接下來可以按照如下的示例進行預測。

# Data to be prdicted
data = [
 ["這個賓館比較陳舊了，特價的房間也很一般?？傮w來說一般"], ["交通方便；環(huán)境很好；服務態(tài)度很好 房間較小"],["還稍微重了點，可能是硬盤大的原故，還要再輕半斤就好了。其他要進一步驗證。貼的幾種膜氣泡較多，用不了多久就要更換了，屏幕膜稍好點，但比沒有要強多了。建議配贈幾張膜讓用用戶自己貼。"],[ "前臺接待太差，酒店有A B樓之分，本人check－in后，前臺未告訴B樓在何處，并且B樓無明顯指示；房間太小，根本不像4星級設施，下次不會再選擇入住此店啦"], ["19天硬盤就罷工了~~~算上運來的一周都沒用上15天~~~可就是不能換了~~~唉~~~~你說這算什么事呀~~~"]]
index = 0
run_states = cls_task.predict(data=data)
results = [run_state.run_results for run_state in run_states]
for batch_result in results:
 # get predict index
 batch_result = np.argmax(batch_result, axis=2)[0]
 for result in batch_result:
 print("%s\tpredict=%s" % (data[index][0], result))
 index += 1

除了以上的介紹，PaddleHub還在AI Studio和AIBook上提供了IPython NoteBook形式的demo，開發(fā)者可以直接在平臺上在線體驗PaddleHub帶來的各種便捷。

此外，AI studio平臺還發(fā)布了億元算力支持計劃，提供了“每日運行贈12小時”和“連續(xù)5天運行贈48小時”兩種機制共同服務，每天都得能輕松獲得！

該平臺集成算力、教程、樣例模型、工程開發(fā)、在線部署的能力, 乃至比賽平臺，滿足從0基礎學習到技術落地的全生命周期，幫助開發(fā)者全面掌握深度學習技術的各方各面。

項目地址：

https://github.com/PaddlePaddle/PaddleHub?fr=lzw2

下載最新版本的Paddle Fluid v1.5，請點擊閱讀原文或查看以下鏈接：

http://www.paddlepaddle.org.cn?fr=lzw2

— 完 —

PaddleHub 深度學習

量子位的朋友們

超詳細！2025科技創(chuàng)變者大會最新議程公布！2025-08-21
中科慧遠發(fā)布CASIVIBOT，以九年積累開啟AOI與機器人協(xié)同的品質(zhì)檢測新時代2025-08-20
嚯！剛剛，張麻子陪我玩黑猴了2025-08-19
機器人全產(chǎn)業(yè)鏈接會 FAIR plus 2026媒體見面會在京召開2025-08-16

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

PaddleHub 1.0正式發(fā)布：一鍵模型加載，十行代碼完成遷移學習

PaddleHub是什么

PaddleHub有什么特色

PaddleHub API全景

如何快速開始

相關閱讀

Diffusion Model一發(fā)力，GAN就過時了？？？

機器學習研究今年誰最火？幾何深度學習成最大贏家，Reddit為提名選手吵成一團

TensorFlow，危！拋棄者正是谷歌自己

從“幾何深度學習”看深度學習江湖的統(tǒng)一

Keras將死于谷歌之手？reddit網(wǎng)友寫“送葬文”，引發(fā)熱議

LSTM之父再稱ResNet、GAN等五大網(wǎng)絡都有他的功勞，網(wǎng)友卻說：自負大于引用數(shù)

熱門文章

標準化3D生成質(zhì)量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

PaddleHub 1.0正式發(fā)布：一鍵模型加載，十行代碼完成遷移學習

PaddleHub是什么

PaddleHub有什么特色

PaddleHub API全景

如何快速開始

相關閱讀

Diffusion Model一發(fā)力，GAN就過時了？？？

機器學習研究今年誰最火？幾何深度學習成最大贏家，Reddit為提名選手吵成一團

TensorFlow，危！拋棄者正是谷歌自己

從“幾何深度學習”看深度學習江湖的統(tǒng)一

Keras將死于谷歌之手？reddit網(wǎng)友寫“送葬文”，引發(fā)熱議

LSTM之父再稱ResNet、GAN等五大網(wǎng)絡都有他的功勞，網(wǎng)友卻說：自負大于引用數(shù)

熱門文章

標準化3D生成質(zhì)量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

PaddleHub 1.0正式發(fā)布：一鍵模型加載，十行代碼完成遷移學習

Diffusion Model一發(fā)力，GAN就過時了？？？

機器學習研究今年誰最火？幾何深度學習成最大贏家，Reddit為提名選手吵成一團

TensorFlow，危！拋棄者正是谷歌自己

Keras將死于谷歌之手？reddit網(wǎng)友寫“送葬文”，引發(fā)熱議

LSTM之父再稱ResNet、GAN等五大網(wǎng)絡都有他的功勞，網(wǎng)友卻說：自負大于引用數(shù)

標準化3D生成質(zhì)量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行