清華姚班陳丹琦獲斯隆獎(jiǎng)!與去年得主馬騰宇是同班同學(xué),博士畢業(yè)論文是近十年最熱之一
現(xiàn)在在普林斯頓大學(xué)從頭搭建NLP小組
楊凈 豐色 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
清華姚班大神陳丹琦,剛剛有了最新榮譽(yù)。
斯隆研究獎(jiǎng)得主。
斯隆研究獎(jiǎng),素來(lái)有“諾獎(jiǎng)風(fēng)向標(biāo)”的稱(chēng)號(hào)。
獲得這個(gè)獎(jiǎng)項(xiàng)的研究者,將得到為期兩年75000美元的獎(jiǎng)金。
此前,與陳丹琦同為姚班畢業(yè)生的鬲融、馬騰宇,都曾因獲此獎(jiǎng)項(xiàng)而引發(fā)關(guān)注。
說(shuō)回到陳丹琦本人,正是計(jì)算機(jī)科學(xué)領(lǐng)域近來(lái)最受關(guān)注的華人青年學(xué)者之一。
她是08級(jí)清華姚班校友,也是信息學(xué)競(jìng)賽圈內(nèi)頗具傳奇色彩的一位女選手——CDQ分治算法就是以她的名字命名。2008年,她代表中國(guó)隊(duì)斬獲一枚IOI金牌。
而她那篇長(zhǎng)達(dá) 156 頁(yè)的博士畢業(yè)論文《Neural Reading Comprehension and Beyond》,更是一度火爆出圈。
不光獲得當(dāng)年斯坦福最佳博士論文獎(jiǎng),還成為了斯坦福大學(xué)近十年來(lái)最熱門(mén)畢業(yè)論文之一。
現(xiàn)在,她已前往普林斯頓大學(xué)從頭搭建NLP小組,成為該校計(jì)算機(jī)系的助理教授。
從零搭建NLP小組
此次獲獎(jiǎng)的原因,正是基于陳丹琦在NLP領(lǐng)域的成就與潛力。
目前研究方向主要聚焦在兩方面。
一個(gè)是開(kāi)發(fā)基本的方法來(lái)學(xué)習(xí)語(yǔ)言和知識(shí)表征,以及它們之間的相互作用。尤其是兩個(gè)問(wèn)題:對(duì)人類(lèi)知識(shí)(比如陳述性、常識(shí)性)如何從文本中獲得,以及智能系統(tǒng)如何表示、檢索、推理、使用這些知識(shí)。
另一個(gè)是建立實(shí)用的系統(tǒng),包括問(wèn)題問(wèn)答、信息提取和對(duì)話代理,尤其是如何將這些方法推廣到現(xiàn)實(shí)場(chǎng)景中去。
她的小組成員中,有一位也是清華畢業(yè)生,2019年清華特獎(jiǎng)得主高天宇。
最新一篇研究,他也參與其中。
這篇研究提出了一種全新評(píng)估機(jī)制——基于預(yù)測(cè)歷史的問(wèn)題重寫(xiě)機(jī)制,該機(jī)制可以跟人類(lèi)的判斷形成更好的關(guān)聯(lián),讓對(duì)話問(wèn)答(CQA)效果更好。
來(lái)到普林斯頓大學(xué)之前,她曾是斯坦福大學(xué)的博士研究生,師從NLP大神Christopher Manning。
這可是位泰斗級(jí)別的人物,他是斯坦福NLP小組的創(chuàng)始人。
他寫(xiě)的書(shū)籍《Foundations of Statistical Natural Language Processing》(統(tǒng)計(jì)自然語(yǔ)言處理)和《Introduction to Information Retrieval》(信息檢索導(dǎo)論),幾乎是每個(gè)NLPer的必讀入門(mén)書(shū)。
在Manning教授的指導(dǎo)和學(xué)習(xí)下,2014年她發(fā)表了一篇《A Fast and Accurate Dependency Parser using Neural Networks》,可以說(shuō)是深度學(xué)習(xí)依存分析方法的“開(kāi)山之作”。
他們的方法在保持精度的前提下,直接將解析速度提高了 60 倍。
而她在學(xué)術(shù)界的影響力還在繼續(xù),最典型的就是在博士畢業(yè)之際寫(xiě)的那篇156頁(yè)論文,上線僅四天就獲得上千訪問(wèn)量。
這篇論文主要聚焦于神經(jīng)閱讀理解,簡(jiǎn)言之,就是構(gòu)建于深度神經(jīng)網(wǎng)絡(luò)之上的閱讀理解模型。包含了闡述原理構(gòu)建模型、以及結(jié)合現(xiàn)有成果構(gòu)建實(shí)際應(yīng)用場(chǎng)景兩個(gè)部分。
去斯坦福拜入NLP泰斗門(mén)下,之后再去普林斯頓搭建NLP小組,回想這兩段經(jīng)歷,陳丹琦曾這樣解釋她做出選擇的原因。
陳丹琦告訴叉院學(xué)姐公眾號(hào):
我選斯坦福的時(shí)候其實(shí)不太知道自己要做什么,是后來(lái)選了research group才定的方向。
去普林斯頓是因?yàn)槲艺J(rèn)為對(duì)我來(lái)說(shuō)這是個(gè)機(jī)會(huì),一個(gè)成長(zhǎng)和承擔(dān)的機(jī)會(huì)。
因?yàn)槠樟种皼](méi)有NLP,能在這邊能建立一個(gè)自己的group。
算法以她的名字命名
每次提到清華姚班,一定都少不了陳丹琦的名字。
事實(shí)上回顧她的整段經(jīng)歷,如今的成就少不了她自身的努力和周遭的支持。
她出生于湖南長(zhǎng)沙,高中就讀于長(zhǎng)沙市雅禮中學(xué)。
這所學(xué)校是信息學(xué)奧林匹克競(jìng)賽強(qiáng)校,歷史上一共9名學(xué)生獲得過(guò)IOI(國(guó)際信息學(xué)奧林匹克競(jìng)賽)金牌,比以“信息學(xué)競(jìng)賽第一?!敝Q(chēng)的紹興一中還要多一名。
而陳丹琦就是在2008年——高三的時(shí)候拿下了第20屆IOI金牌,也成為了湖南省首位金牌女選手。
并以此保送到清華姚班,與馬騰宇、余佳俊等成了同學(xué)。
他在陳丹琦很小的時(shí)候就發(fā)現(xiàn)女兒對(duì)數(shù)字很敏感,且做題速度、思考問(wèn)題的全面性都比同齡孩子厲害。
于是,父親就對(duì)她進(jìn)行了有意識(shí)的培養(yǎng):她從三年級(jí)就開(kāi)始練奧數(shù),初一參加全國(guó)數(shù)學(xué)聯(lián)賽就獲得了湖南賽區(qū)二等獎(jiǎng),初三獲得了特等獎(jiǎng),并開(kāi)始接觸信息學(xué)。
奧賽圈耳熟能詳聞的“CDQ分治算法”就是這位學(xué)霸在集訓(xùn)期間提出來(lái)的,并以她的名字命名。
還有著名的插頭DP,也是她在集訓(xùn)隊(duì)時(shí)的成果。
基于這個(gè)工具,她還發(fā)表了篇論文《基于連通性狀態(tài)壓縮的動(dòng)態(tài)規(guī)劃問(wèn)題》。
據(jù)當(dāng)時(shí)報(bào)道,在學(xué)習(xí)之余,她也很會(huì)放松自己,最?lèi)?ài)看《名偵探柯南》,還練得了一手好行書(shū)。
也正是在這一段奧賽征程中,她遇到了自己未來(lái)的丈夫——俞華程。還在博士畢業(yè)論文中狠狠秀了一波恩愛(ài)。(手動(dòng)狗頭)
嗯,就是下圖最右邊這位帥小伙。
陳丹琦在致謝部分表示,她從15歲(上高一時(shí))就認(rèn)識(shí)了他,從高中的競(jìng)賽到清華的本科四年,再到一起去斯坦福讀計(jì)算機(jī)博士,最后在博士畢業(yè)前四個(gè)月結(jié)婚,俞華程一直都是他最好的朋友、最敬佩的人。
而俞華程本人,也很厲害,他在斯坦福大學(xué)讀博期間,因?yàn)榘l(fā)表多篇重要論文而提前2年畢了業(yè),隨后在哈佛大學(xué)做博士后研究,主要關(guān)于理論計(jì)算機(jī),最后也成為了普林斯頓大學(xué)的助理教授。
除了這些經(jīng)歷之外,陳丹琦還不止一次呼吁女性也要更多參與到理工、計(jì)算機(jī)學(xué)科建設(shè)當(dāng)中來(lái)。
她曾在“叉院學(xué)姐”采訪中表示:
不要刻意強(qiáng)調(diào)女生不擅長(zhǎng)學(xué)工科、計(jì)算機(jī)這個(gè)事情。
男女之間的GAP會(huì)越來(lái)越不存在。
計(jì)算機(jī)領(lǐng)域還有多位華人獲獎(jiǎng)
本次斯隆獎(jiǎng)一共有118名來(lái)自化學(xué)、數(shù)學(xué)、物理、計(jì)算機(jī)等領(lǐng)域的科學(xué)家獲得。
其中,計(jì)算機(jī)領(lǐng)域一共頒給了20名全球科學(xué)家,其中包括5位華人,而華人獲獎(jiǎng)?wù)咧校?strong>最多的是來(lái)自清華的校友,除了陳丹琦還有:
07級(jí)清華電子工程系本科、現(xiàn)CMU助理教授方飛。
她博士畢業(yè)于美國(guó)南加州大學(xué),主要研究方向?yàn)椴┺恼摵蜋C(jī)器學(xué)習(xí)。
03級(jí)清華自動(dòng)化專(zhuān)業(yè)本科、控制科學(xué)與工程專(zhuān)業(yè)碩士畢業(yè)生、現(xiàn)UCLA助理教授顧全全。
他的研究方向?yàn)榻y(tǒng)計(jì)機(jī)器學(xué)習(xí),重點(diǎn)是開(kāi)發(fā)和分析用于機(jī)器學(xué)習(xí)的非凸優(yōu)化算法,ICML 2021年他有8篇論文都被接收。
還有兩位華人獲獎(jiǎng)?wù)邽椋?/p>
港科大校友宋舒然,現(xiàn)哥倫比亞大學(xué)助理教授,主要研究計(jì)算機(jī)視覺(jué)與機(jī)器人技術(shù)。
以及現(xiàn)UIUC教授Li Bo,她的研究方向?yàn)闄C(jī)器學(xué)習(xí)及其安全、隱私和博弈論。
而在計(jì)算機(jī)科學(xué)方向之外,本次斯隆獎(jiǎng)有6名華人學(xué)者獲數(shù)學(xué)獎(jiǎng),其中2名來(lái)自北大數(shù)院,另有3名獲物理獎(jiǎng)。
參考鏈接:
[1]https://sloan.org/fellowships/2022-Fellows
[2]https://antkillerfarm.github.io/dl/2018/01/17/Deep_Learning_31.html#%E6%A6%82%E5%86%B5
[3]https://stacks.stanford.edu/file/druid:gd576xb1833/thesis-augmented.pdf
[4]https://www.emnlp2014.org/papers/pdf/EMNLP2014082.pdf
[5]https://arxiv.org/abs/2112.08812
[6]https://mp.weixin.qq.com/s/q_IkEt3NhwtJIkKDr6OhNA
- 英偉達(dá)最新芯片B30A曝光2025-08-20
- AI應(yīng)用如何落地政企?首先不要卷通用大模型2025-08-12
- 本科必學(xué)Dijkstra算法被超越!清華段然團(tuán)隊(duì)打破圖靈獎(jiǎng)得主證明的普遍最優(yōu)性2025-08-09
- 智能體邁入L4 時(shí)代!納米AI多智能體蜂群,可創(chuàng)作最長(zhǎng)10分鐘AI視頻2025-08-06