国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

MIT微軟為AI量身打造了一套leetcode編程題

白交 2021-06-26 15:45:46 來源：量子位

不用自然語言描述，也沒有輸入輸出示例

豐色發(fā)自凹非寺
量子位報道 | 公眾號 QbitAI

你見過這種編程題目描述方式嗎？

不用自然語言描述，也沒有輸入輸出示例，你所看到的就只有一個Python函數(shù)。

這是來自MIT、Allen AI和微軟的研究人員提出的一種全新的編程題目描述方法：

每個題目都由一個簡短的Python函數(shù)f定義，目標是找到一個輸入x，使f輸出true。

這樣的題目形式可以讓AI審題更容易，人類程序員的理解也不會受到影響。

AI編程，道路真是越來越平了啊。

接下來就來詳細看看這個研究吧。

沒有自然語言描述的編程題目

再來解釋一下這種描述方法：

題目采用Python函數(shù)的形式，參數(shù)為答案。

解題的目標是找到使函數(shù)輸出為真的輸入x，即滿足f（x）= true的正確答案。

現(xiàn)在請你舉一反三：求解一個有1000個不連續(xù)“o”的字符串，用這種新形式如何描述呢？

正確答案：

下面是另外兩道題目的描述示例。

動態(tài)規(guī)劃—最長單調遞增子序列問題：

經(jīng)典的漢諾塔?（Towers of Hanoi ）：

研究人員按此種出題形式囊括了各種編程題，提出來一個開源數(shù)據(jù)集：叫做P3。

該數(shù)據(jù)集題型非常全面：涉及不同難度、不同領域和不同算法工具等方面的題目。

有簡單的字符串操作問題；

有經(jīng)典如漢諾塔和國際象棋（例如，騎士游歷算法和N皇后問題變體）等難題；

也有兩人挑戰(zhàn)尋找最佳策略的題型，如井字棋（Tic-Tac-Toe）、石頭剪刀布、珠璣妙算Mastermind等；

還包括來自國際數(shù)學奧林匹克競賽（IMO）和國際大學生程序設計競賽（ICPC）的題目，如各種圖論和數(shù)論難題。

一共包含208種題型、14萬+的題目，并且還在不斷更新中。

每個題目都提供了至少一種答案。

這套新穎的編程挑戰(zhàn)題庫數(shù)據(jù)集，抓住了編程題目的本質，可用于教AI編程并評估AI的編程能力。

研究人員表示，這套題可以對AI的編程能力進行客觀評估。因為不用查看答案，就能直接驗證解答的正確性。因此，這種題目不會增加AI學習任何答案偏差的負擔。

希望這個數(shù)據(jù)集可以開發(fā)出新的AI編程解決方案

不同AI求解器根據(jù)這些題目編程的效果如何呢？

研究人員做了一些深入的實驗，開發(fā)了基于隨機森林、Transformer和不同類型GPT-3 prompts的AI求解器，它們采用不同參數(shù)枚舉、自頂向下的方法，使用這個P3數(shù)據(jù)集來評估性能。

首先，測試這些求解器在這個數(shù)據(jù)集上利用此前解決題目的方法來解決新題目的自舉效率（bootstrapping efficacy）。

結果發(fā)現(xiàn)，增加嘗試次數(shù)可以解決新題目。但它們也能通過學習過去的經(jīng)驗，更快地解決新的難題。

下圖為這些AI求解器在不同嘗試次數(shù)下的已解決題目數(shù)量：

而在一項小的用戶研究中，21名在Python編程方面有不同經(jīng)驗年限的程序員完成了不同難度的30個題目。每個題目最多分配6分鐘的時間來解決。

用這個數(shù)據(jù)集評估AI與人類程序員對編程題難度的感知發(fā)現(xiàn)：

人類覺得難的題對AI來說也更難，現(xiàn)階段情況下，AI求解器能解決的大多數(shù)題都是對人類來說比較簡單的。

上圖表示人類和AI對各種題目的難度打分，按人類分數(shù)排序。人類的難度分數(shù)通過超出允許的最大解題時間的平均分數(shù)來衡量，AI的則是根據(jù)解題所需的嘗試次數(shù)。

另外，AI用這種形式的題目可以解決了60% 的難題，初學者和有經(jīng)驗的程序員平均分別解決了 76% 和 87% 的難題。

總的來說，利用這個新穎的數(shù)據(jù)集，通過精心設計的AI求解器，可以大大減少AI編程求解所需的嘗試次數(shù)、并解出更多的題目。

因此，研究人員希望，這個新的編程題庫數(shù)據(jù)集能支持大家研究和開發(fā)新的AI編程解決方案，提高AI編程的效率和性能。

此前，UC伯克利曾訓練AI刷LeetCode，總共5000道題的測試中，AI能做出15%。

不知道使用這個數(shù)據(jù)集訓練，AI編程的能力又會達到什么水平呢？

論文地址：https://arxiv.org/abs/2106.05784

開源數(shù)據(jù)集鏈接：https://github.com/microsoft/PythonProgrammingPuzzles

— 完 —

白交

英偉達最新芯片B30A曝光2025-08-20
AI應用如何落地政企？首先不要卷通用大模型2025-08-12
本科必學Dijkstra算法被超越！清華段然團隊打破圖靈獎得主證明的普遍最優(yōu)性2025-08-09
智能體邁入L4 時代！納米AI多智能體蜂群，可創(chuàng)作最長10分鐘AI視頻2025-08-06

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

MIT微軟為AI量身打造了一套leetcode編程題

沒有自然語言描述的編程題目

希望這個數(shù)據(jù)集可以開發(fā)出新的AI編程解決方案

相關閱讀

微軟1bit LLM新研究：原生4bit激活值量化，可充分利用新一代GPU對4bit計算的原生支持

微軟清華改進Transformer：用降噪耳機原理升級注意力，一作在線答疑

MIT人造肌肉登上Science，能提起自重650倍的物體，伸縮萬次不壞

1.3>7？微軟新模型“以小博大”戰(zhàn)勝Llama2，網(wǎng)友：用Benchmark訓練的吧？

數(shù)學好＝編程能力強？MIT新發(fā)現(xiàn)：二者激活大腦區(qū)域并不同

MIT造了個“小盒子”，可以無線監(jiān)測新冠患者癥狀，斯隆獎獲得者班底打造

熱門文章

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

国产冒白浆视频,抱着cao才爽免费视频,胸大美女又大又黄的网站,中文国产日韩欧美二视频,亚洲日本国产综合高清,又大又粗又硬又硬免费日批视频 ,国产二区不卡自拍,777免费人成影院,亚洲成AⅤ人网站,香蕉网站永久在线视频

MIT微軟為AI量身打造了一套leetcode編程題

沒有自然語言描述的編程題目

希望這個數(shù)據(jù)集可以開發(fā)出新的AI編程解決方案

相關閱讀

微軟1bit LLM新研究：原生4bit激活值量化，可充分利用新一代GPU對4bit計算的原生支持

微軟清華改進Transformer：用降噪耳機原理升級注意力，一作在線答疑

MIT人造肌肉登上Science，能提起自重650倍的物體，伸縮萬次不壞

1.3>7？微軟新模型“以小博大”戰(zhàn)勝Llama2，網(wǎng)友：用Benchmark訓練的吧？

數(shù)學好＝編程能力強？MIT新發(fā)現(xiàn)：二者激活大腦區(qū)域并不同

MIT造了個“小盒子”，可以無線監(jiān)測新冠患者癥狀，斯隆獎獲得者班底打造

熱門文章

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度

微軟1bit LLM新研究：原生4bit激活值量化，可充分利用新一代GPU對4bit計算的原生支持

微軟清華改進Transformer：用降噪耳機原理升級注意力，一作在線答疑

MIT人造肌肉登上Science，能提起自重650倍的物體，伸縮萬次不壞

1.3>7？微軟新模型“以小博大”戰(zhàn)勝Llama2，網(wǎng)友：用Benchmark訓練的吧？

數(shù)學好＝編程能力強？MIT新發(fā)現(xiàn)：二者激活大腦區(qū)域并不同

MIT造了個“小盒子”，可以無線監(jiān)測新冠患者癥狀，斯隆獎獲得者班底打造

標準化3D生成質量榜單來了！首創(chuàng)層次化評價體系，告別“誰的demo更吸睛”主觀評估

宇樹機器人“撞人逃逸”火到國外，王興興回應：下次不遙控了

一周六連發(fā)！昆侖萬維將多模態(tài)AI卷到了新高度

讓AI創(chuàng)作不千篇一律，提示詞隨機插詞匯就行

賣酒的茅臺要學AI了！和奔馳麥當勞一起拜師百度