国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

一水 2024-06-19 16:56:00 來源：量子位

允許免費生成合成數(shù)據(jù)

排名超過Llama-3-70B，英偉達Nemotron-4 340B問鼎競技場最強開源模型！

前兩天，英偉達突然開源了其通用大模型Nemotron的3400億參數(shù)版本。

就在最近，競技場更新了排名情況：

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

勝率熱圖顯示，Nemotron-4 340B對陣Llama-3-70B的勝率為53%。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

究竟Nemotron-4 340B表現(xiàn)如何？接下來一起看看。

新模型最新戰(zhàn)績

簡單回顧一下，英偉達上周五突然宣布開源Nemotron-4 340B，該系列包括基礎模型、指令模型和獎勵模型，用于生成訓練和改進LLM的合成數(shù)據(jù)。

Nemotron-4 340B一經(jīng)發(fā)布便瞬時登頂Hugging Face RewardBench?榜一！

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

緊接著，競技場新近公布了Nemotron-4 340B的一系列測評結果。

在長文本查詢（長度>=500個token）中，Nemotron-4 340B排在第5位，超過Claude 3 Sonnet及Qwen 2-72B等主流開源模型。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

在處理硬提示方面，Nemotron-4 340B超越了Claude 3 Sonnet和Llama3 70B-Instruct，顯示出其在應對復雜和高難度查詢時的卓越能力。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

在整體性能評估中，Nemotron-4 340B的評分和穩(wěn)定性均處于中上水平，超越了多款知名開源模型。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

概括一下，Nemotron-4 340B已經(jīng)取得了不錯的戰(zhàn)績，直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2，有時甚至可以和GPT-4一較高下。

其實，以前這個模型就曾登上大模型競技場LMSys Chatbot Arena，當時它的別名是june-chatbot。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

具體來說，這個模型支持4K上下文窗口、50多種自然語言和40多種編程語言，訓練數(shù)據(jù)截止到2023年6月。

訓練數(shù)據(jù)方面，英偉達采用了高達9萬億個token。其中，8萬億用于預訓練，1萬億用于繼續(xù)訓練以提高質量。

在BF16精度下，模型的推理需要8塊H200，或16塊H100/A100 80GB。如果是在FP8精度下，則只需8塊H100。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

值得一提的是，指令模型的訓練是在98%的合成數(shù)據(jù)上完成的。

而合成數(shù)據(jù)無疑是Nemotron-4 340B的最大亮點，它有可能徹底改變訓練LLM的方式。

合成數(shù)據(jù)才是未來

面對最新排名，興奮的網(wǎng)友們突然咂摸出一絲不對勁：

用340B對戰(zhàn)70B，而且還是險勝，這事兒有點說不過去吧！

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

就連機器人Kimi也對此開啟了“嘲諷”模式：

英偉達這波操作，參數(shù)大得像宇宙，性能卻跟Llama-3-70B肩并肩，科技界的”大號小能”啊!

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

對此，在英偉達負責AI模型對齊和定制的Oleksii Kuchaiev拿出了關鍵法寶：

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

是的，Nemotron-4 340B商用友好，支持生成合成數(shù)據(jù)。

高級深度學習研究工程師Somshubra Majumdar對此表示大贊：

你可以用它（免費）生成你想要的所有數(shù)據(jù)

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

這一突破性進展，標志著AI行業(yè)的一個重要里程碑——

從此，各行各業(yè)都無需依賴大量昂貴的真實世界數(shù)據(jù)集了，用合成數(shù)據(jù)，就可以創(chuàng)建性能強大的特定領域LLM！

那么，英偉達具體是如何實現(xiàn)的呢？

一句話概括，這與它開源通常不發(fā)布的獎勵模型有關。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

生成高質量合成數(shù)據(jù)不僅需要優(yōu)秀的指導模型，還需根據(jù)特定需求進行數(shù)據(jù)篩選。

通常，使用同一模型作為評分者（LLM-as-Judge）；但在特定情況下，采用專門的獎勵模型（Reward-Model-as-Judge）進行評估更為合適。

而Nemotron-4 340B指令模型可以生成高質量的數(shù)據(jù)，然后獎勵模型可以過濾掉多個屬性的數(shù)據(jù)。

它會根據(jù)有用性、正確性、一致性、復雜性和冗長性這5個屬性，對響應評分。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

另外，研究者可以使用自己的專用數(shù)據(jù)，再結合HelpSteer2數(shù)據(jù)集，定制Nemotron-4 340B基礎模型，以創(chuàng)建自己的指令或獎勵模型。

回到一開頭和Llama-3-70B的對戰(zhàn)，Nemotron-4 340B擁有更寬松的許可，或許這才是它的真正價值所在。

畢竟數(shù)據(jù)短缺早已成為業(yè)內(nèi)普遍痛點。

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

據(jù)Epoch研究所的AI研究員Pablo Villalobos預測，到2024年年中，對高質量數(shù)據(jù)的需求超過供給的可能性為50%，到2026年發(fā)生這種情況的可能性為90%。

新的預期顯示，這種短缺風險將延遲至2028年。

合成數(shù)據(jù)才是未來正逐漸成為行業(yè)共識……

模型地址：
https://huggingface.co/nvidia/Nemotron-4-340B-Instruct

競技場排名英偉達

一水

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

新模型最新戰(zhàn)績

合成數(shù)據(jù)才是未來

相關閱讀

報名 | 如何突破Decoder性能瓶頸？英偉達專家揭秘FasterTransformer2.0的原理與應用 --NLP公開課

英偉達一夜改寫自動駕駛格局！2000TOPS雷神芯片發(fā)布，黃仁勛：One chip to rule them all

RTX 3080被炒到原價7倍，最高賣5000美元，英偉達官方道歉：將打擊黃牛搶購

英偉達新卡皇3090Ti：功耗飆至450W換來性能漲11%

用GPU拯救世界：英偉達&斯坦福呼吁玩家捐獻算力，投入新冠病毒相關蛋白質分布式計算

00后老板扣員工50%工資代盡孝/ 英偉達為清顯卡送游戲/ AI可預測新冠變種...今日更多新鮮事在此

熱門文章

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

新模型最新戰(zhàn)績

合成數(shù)據(jù)才是未來

相關閱讀

報名 | 如何突破Decoder性能瓶頸？英偉達專家揭秘FasterTransformer2.0的原理與應用 --NLP公開課

英偉達一夜改寫自動駕駛格局！2000TOPS雷神芯片發(fā)布，黃仁勛：One chip to rule them all

RTX 3080被炒到原價7倍，最高賣5000美元，英偉達官方道歉：將打擊黃牛搶購

英偉達新卡皇3090Ti：功耗飆至450W換來性能漲11%

用GPU拯救世界：英偉達&斯坦福呼吁玩家捐獻算力，投入新冠病毒相關蛋白質分布式計算

00后老板扣員工50%工資代盡孝/ 英偉達為清顯卡送游戲/ AI可預測新冠變種...今日更多新鮮事在此

熱門文章

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

340B險勝70B，Kimi機器人貼臉“嘲諷”英偉達新開源模型

報名 | 如何突破Decoder性能瓶頸？英偉達專家揭秘FasterTransformer2.0的原理與應用 --NLP公開課

英偉達一夜改寫自動駕駛格局！2000TOPS雷神芯片發(fā)布，黃仁勛：One chip to rule them all

RTX 3080被炒到原價7倍，最高賣5000美元，英偉達官方道歉：將打擊黃牛搶購

用GPU拯救世界：英偉達&斯坦福呼吁玩家捐獻算力，投入新冠病毒相關蛋白質分布式計算

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度