国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

人人都能用的多語種大模型來了！支持59種語言，參數(shù)1760億，1000名科學(xué)家聯(lián)合發(fā)起

豐色 2022-07-20 16:33:54 來源：量子位

動用法國超算訓(xùn)練而成

豐色發(fā)自凹非寺

量子位 | 公眾號 QbitAI

一直以來，很多大模型都由造它們出來的大型私營科技公司壟斷著。

比如GPT-3等，對于普通人來說，再香也只能眼巴巴看著。

不過現(xiàn)在，為了給你解饞，由近1000名科學(xué)家聯(lián)合發(fā)起的一個志愿項目，耗時一年多煉出了一個號稱和GPT-3一樣強大的語言模型。

它的名字叫BLOOM，參數(shù)1760億，不光支持英文或者中文，連西班牙語、法語等59種語言都支持，是目前最大的多語言開源語言模型。

是的，從現(xiàn)在起，從代碼到數(shù)據(jù)集，BLOOM全部對外開放，所有人都可使用。

動用法國超算、花費384塊A100

BLOOM是一個BigScience項目，去年5月啟動，由Hugging Face主導(dǎo)，收到了700萬美元的公共捐款。

共有來自全球60個國家、超過250個機構(gòu)，以及超過1000名研究人員參與其中，其中包括以個人名義參加的Meta、谷歌等大廠員工。

它的訓(xùn)練在法國超級計算機Jean Zay上進行，共花費了384塊A100 GPU，其中每塊有80 GB內(nèi)存，訓(xùn)練吞吐量約150 TFLOP（該超算由低碳的核能提供動力，釋放的熱量還用來給學(xué)校供暖）。

相關(guān)推特賬號從3月14日起，每天記錄BLOOM的進度。

隨著進度條漸漸拉滿，每天去點贊的人數(shù)也越來越多。

不過，到了102%它才正式停下——

7月2號，耗時117天的BLOOM宣告完成，恰好在預(yù)期計劃時間內(nèi)。

最終，BLOOM：

擁有1760億參數(shù)，比GPT-3還多10億
包含70層，每層112個注意力頭
token序列長度為2048
采用GeLU激活函數(shù)
數(shù)據(jù)集共計3416億條token（1.5TB文本數(shù)據(jù)）
支持13種編程語言、46種語言

其中，對于很多語言來說，比如法語、西班牙語和阿拉伯語等，都是首次有了自己的開源模型（有網(wǎng)友發(fā)現(xiàn)日語目前還不支持）。

此外，為了讓BLOOM最后的生成結(jié)果盡可能地減少偏見，參與人員還費了不少功夫抓取到的數(shù)據(jù)還進行了一遍人工過濾。

目前，BLOOM的訓(xùn)練對硬件也還是有一些要求：

為了保證效果，最好是準(zhǔn)備8塊80GB或者16塊40GB的的A100。

這導(dǎo)致只有稍微大點的團隊才能用。

當(dāng)然也可以選擇在云上訓(xùn)練，最高每小時40美元。

最后，BLOOM表示還會降低使用門檻，并準(zhǔn)備開發(fā)一個分布式系統(tǒng)，允許實驗室在其服務(wù)器之間共享模型。

它聲稱自己將會成為一個模型家族，不會一勞永逸。

Hugging Face地址：
https://huggingface.co/bigscience/bloom

參考鏈接：
[1]https://twitter.com/evanmiltenburg/status/1546792818269732864
[2]https://techcrunch.com/2022/07/12/a-year-in-the-making-bigsciences-ai-language-model-is-finally-available/

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

NLP 大模型

豐色

相關(guān)閱讀

Llama2等30+模型接入千帆大模型平臺，推理成本降50%！還有超全Prompt模板開放體驗

格局打開

魚羊2023-08-07

千帆大模型平臺大模型

騰訊首次投資大模型！Minimax被曝完成2.5億美元新融資

整體估值超過12億美元。

白交2023-06-02

MiniMax 大模型騰訊

XLNet團隊：贏BERT靠的并不是數(shù)據(jù)集更大，公平對決也碾壓對手

外界曾質(zhì)疑XLNet是靠大10倍的數(shù)據(jù)集取勝

曉查2019-07-24

BERT NLP

大模型加速涌向移動端！ControlNet手機出圖只需12秒，高通AI掌門人：LLaMA也只是時間問題

終端交互方式迎來變革

蕭簫2023-07-13

大模型移動端高通

自研大模型上車雙足機器人，西湖大學(xué)系具身智能曝光

西湖大學(xué)MiLab負責(zé)人王東林牽頭

衡宇2023-12-23

具身智能雙足機器人大模型

對話螞蟻李建國：當(dāng)前AI寫代碼相當(dāng)于L2.5，實現(xiàn)L3后替代50%人類編程

超70%代碼問題，單純靠基座大模型是解決不了的。

白交2024-04-23

AI編程中國AIGC產(chǎn)業(yè)峰會代碼生成大模型李建國螞蟻

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

人人都能用的多語種大模型來了！支持59種語言，參數(shù)1760億，1000名科學(xué)家聯(lián)合發(fā)起