滴滴開源AI項目登上GitHub熱榜,人機對話模型可從論文到產(chǎn)品部署無縫銜接
乾明 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
沒想到,滴滴開源的自然語言理解(人機對話)模型訓(xùn)練平臺,就這樣登上了GitHub熱榜。
這一項目名為DELTA,是一個深度學(xué)習(xí)模型訓(xùn)練框架,基于TensorFlow構(gòu)建,滴滴自己內(nèi)部也在使用,在ACL 2019上宣布開源。
滴滴表示,它可以用于加快實驗進度,部署用于文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等任務(wù)的系統(tǒng)。
這是滴滴開源的第22個項目,也得到了谷歌AI大牛、Keras創(chuàng)始人Fran?ois Chollet轉(zhuǎn)發(fā)支持。
GitHub鏈接:
https://github.com/didi/delta
模型從論文到產(chǎn)品部署無縫銜接
滴滴介紹稱,DELTA主要基于TensorFlow構(gòu)建,能同時支持NLP(自然語言處理)和語音任務(wù)及數(shù)值型特征的訓(xùn)練。
整合了包括文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等重要算法模型,形成一致的代碼組織架構(gòu),整體包裝統(tǒng)一接口。
使用過程中,用戶要準備好模型訓(xùn)練數(shù)據(jù),并指定好配置Configuration,模型訓(xùn)練pipeline可以根據(jù)配置進行數(shù)據(jù)處理,并選擇相應(yīng)的任務(wù)和模型,進行模型訓(xùn)練。
在訓(xùn)練結(jié)束之后,可以自動生成模型文件保存,而且模型文件也能夠形成統(tǒng)一接口,可以直接上線使用,快速產(chǎn)品化。
此外,DELTA在多種常用任務(wù)上也提供了穩(wěn)定高效的Benchmark,可以簡單快速復(fù)現(xiàn)論文中的模型結(jié)果,也可以在此基礎(chǔ)上擴展新的模型。
模型構(gòu)建完成后,用戶可以使用DELTA的部署流程工具,迅速完成模型上線,實現(xiàn)從論文到產(chǎn)品部署無縫銜接。
滴滴如何用?
現(xiàn)在,滴滴已經(jīng)在產(chǎn)品中應(yīng)用了NLP和語音技術(shù)。最核心的產(chǎn)品,是滴滴自建的智能客服系統(tǒng),能輔助人工客服,提高人工客服處理問題的效率,并減少人工客服在重復(fù)、簡單問題上的處理量,就使用了包括自然語言處理、深度學(xué)習(xí)、知識圖譜、語音、推薦等在內(nèi)的技術(shù)。
此外,基于語音識別以及自然語言理解技術(shù),滴滴也構(gòu)建了駕駛員語音助手。在日本和澳洲,滴滴實際語音直接“免接觸”接單的功能即將上線。
滴滴表示,將來這一語音助手會支持全方位的語音交互服務(wù),包括影音娛樂、信息查詢、車內(nèi)環(huán)境調(diào)節(jié),到乘客通信、客服,甚至是加油、充電或維保服務(wù)。
與此同時,滴滴也宣布,將推進相關(guān)能力的開放,通過提供一站式自然語言處理工具、一站式機器人開放平臺,幫助行業(yè)合作伙伴更好地實現(xiàn)AI應(yīng)用落地。
今年5月,滴滴發(fā)布群雁智能出行開放平臺,宣布將滴滴積累的AI技術(shù)、服務(wù)、算力以及多元化的解決方案進行全面開放。
據(jù)悉,“群雁智能出行開放平臺”包括滴滴的AI基礎(chǔ)平臺、AI服務(wù)能力以及滴滴在出行領(lǐng)域積累的解決方案。
將重點為城市交通管理者、智慧交通企業(yè)、汽車產(chǎn)業(yè)鏈上下游合作伙伴、企業(yè)開發(fā)者及技術(shù)極客、高校及科研機構(gòu)、社會機構(gòu)和公益組織等提供定制化開放服務(wù)。
滴滴一下,AI去哪里
滴滴的AI歷史很早。
2015年5月,滴滴成立機器學(xué)習(xí)研究院,就開始將機器學(xué)習(xí)大規(guī)模應(yīng)用在出行領(lǐng)域,特別是數(shù)據(jù)挖掘、實時計算等,更是場景天然,應(yīng)用直接。
當時滴滴創(chuàng)始人還專門從浙江大學(xué)挖來AI大牛何曉飛。
次年4月,滴滴機器學(xué)習(xí)研究院升級為滴滴研究院, 何曉飛擔任創(chuàng)始院長,后來何曉飛離職創(chuàng)業(yè),則由副院長葉杰平和弓峰敏共同掌舵。
研究方向包括機器學(xué)習(xí)、計算機視覺、人工智能、數(shù)據(jù)挖掘、最優(yōu)化理論、分布式計算等。試圖通過機器學(xué)習(xí)理論和方法,最大化利用交通運力,緩解城市擁堵。
2017年,成立滴滴美國研究院,將以云安全、 深度學(xué)習(xí)、人機交互、計算機視覺及圖像學(xué)、智能駕駛等領(lǐng)域的技術(shù)開發(fā)及應(yīng)用為主要課題,重點發(fā)展大數(shù)據(jù)安全和智能駕駛兩大核心領(lǐng)域。
坐擁海量數(shù)據(jù),招攬眾多大牛,滴滴AI開始在行業(yè)內(nèi)展露鋒芒,屢屢在行業(yè)頂級賽事中斬獲冠軍。
比如今年4月,滴滴AI團隊聯(lián)合北京郵電大學(xué)PRIS團隊提出的人臉檢測DFS算法,在世界人臉檢測公開評測集WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結(jié)果中, 超過了國內(nèi)外眾多科技公司和高校院所,取得了五項第一、一項第二。
而且,滴滴的AI活動,不僅僅只是立足研究,也涉足AI行業(yè)頂級活動。剛剛落幕的AI頂會KDD 2019上,滴滴就是鉑金贊助商。
實際上,無論是數(shù)據(jù)挖掘、機器學(xué)習(xí)還是自動駕駛,滴滴在這些領(lǐng)域都有場景,也有技術(shù)投入。
只因為業(yè)務(wù)太“社會”,反倒是讓人談?wù)撈浼夹g(shù)實力的時候少了些。