「表面光鮮,實(shí)則搬磚」,機(jī)器學(xué)習(xí)社區(qū)自嘲不為人知的AI工程師真相
機(jī)器學(xué)習(xí)工程師崗位,還香嗎?
賈浩楠 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
機(jī)器學(xué)習(xí)工程師崗位,還香嗎?
在培訓(xùn)機(jī)構(gòu)或求職網(wǎng)站隨便一搜,機(jī)器學(xué)習(xí)簡直不要更熱。
但是,國外的同行們卻在一則Reddit熱帖上,吐槽揭露ML工程師“表面光鮮,實(shí)際搬磚”的一面。
說出了培訓(xùn)機(jī)構(gòu)不會(huì)告訴你的機(jī)器學(xué)習(xí)業(yè)內(nèi)真相。
那這些“過來人”怎么掉進(jìn)一個(gè)個(gè)暗坑的?他們的經(jīng)歷對(duì)你有什么警醒借鑒的意義呢?
機(jī)器學(xué)習(xí)崗,怎樣避免淪為數(shù)據(jù)標(biāo)注師
Reddit熱帖下,網(wǎng)友們吐槽最多的,就是學(xué)習(xí)和工作的巨大差距產(chǎn)生的幻滅感。
學(xué)了一大堆牛X高大上的理論知識(shí),以為自己能上手酷炫的神經(jīng)網(wǎng)絡(luò),調(diào)參、訓(xùn)練、部署一條龍,但實(shí)際上,這些內(nèi)容大概只占全部工作的10%-20%。
而且在一些團(tuán)隊(duì)中,會(huì)有專門的崗位來負(fù)責(zé)這些工作。
其余大部分人的職責(zé)是收集數(shù)據(jù)、給數(shù)據(jù)打標(biāo)簽、處理數(shù)據(jù)質(zhì)量,或者用Python寫基礎(chǔ)架構(gòu)。
當(dāng)年夢中的那個(gè)引領(lǐng)AI潮流的少年,就這樣成了數(shù)據(jù)標(biāo)注師。
但是,網(wǎng)友也承認(rèn)這一點(diǎn)確實(shí)是業(yè)內(nèi)的普遍現(xiàn)象。而且,剛剛工作的新手,從低層技術(shù)開始做起,也是符合常理的。
大家的建議是:面對(duì)這種大量重復(fù)勞動(dòng),先別急著上手,去查一查資料,很多類似工作已經(jīng)有成熟快速的方法。
當(dāng)你跨過了基礎(chǔ)工作這一關(guān),要面對(duì)的,是ML項(xiàng)目中可能出現(xiàn)的各種令人頭疼的問題,而這,是考驗(yàn)?zāi)隳芊癯蔀閮?yōu)秀機(jī)器學(xué)習(xí)工程師的重要挑戰(zhàn)。
機(jī)器學(xué)習(xí)之路布滿荊棘
哪些在工作崗位上很重要的東西,是機(jī)器學(xué)習(xí)教程不會(huì)教你的?
網(wǎng)友們總結(jié)了最重要的4條:
正確認(rèn)識(shí)業(yè)務(wù)
處理凌亂的現(xiàn)實(shí)世界數(shù)據(jù)集
工程導(dǎo)向,而不是在Jupyter Notebooks中編寫研究代碼
可視化
這些都是網(wǎng)友們在工作經(jīng)歷中吃了很多虧后,總結(jié)出的經(jīng)驗(yàn)。
比如,很多ML工程師只有給定一個(gè)抽象化的問題才能上手,缺乏應(yīng)對(duì)實(shí)際工程問題的能力。
而一個(gè)合格的、被業(yè)內(nèi)廣范認(rèn)可的機(jī)器學(xué)習(xí)工程師,他可能并不精通算法的數(shù)學(xué)原理,而是能夠在約束條件眾多的實(shí)際情況下應(yīng)用算法解決問題。
比如,在很多情況下,普通的舊算法(例如K-Means,高斯混合的EM等)非常有用。燒GPU并不是唯一辦法。
避免紙上談兵,這是機(jī)器學(xué)習(xí)算法工程師正確認(rèn)識(shí)業(yè)務(wù)的一部分,除此之外,重要的點(diǎn)還有合理的工期規(guī)劃,和良好的溝通能力。
規(guī)劃傳統(tǒng)工程項(xiàng)目時(shí),設(shè)定里程碑、期望值、是(相對(duì))簡單的。
但對(duì)于機(jī)器學(xué)習(xí)項(xiàng)目來說,在最初目標(biāo)和前期階段之后,很難給出具體的計(jì)劃,因?yàn)樽償?shù)實(shí)在太多了。
這就需要在項(xiàng)目初期階段就保持頭腦清醒,不要給自己挖坑,同時(shí)也要和boss以及同事說明溝通。
一位網(wǎng)友談到了切身體會(huì)。他放棄了機(jī)器學(xué)習(xí)算法崗位,原因是老板根本不關(guān)心他為了完善算法細(xì)節(jié)付出了多少艱苦的勞動(dòng),只看最后的可視化效果。
當(dāng)boss發(fā)現(xiàn)可視化效果并不高級(jí)時(shí),認(rèn)為他一直在浪費(fèi)時(shí)間沒好好工作。
所以,比其他軟件工程師更強(qiáng)的抗錯(cuò)能力,也是你必備的。
如果你能抗過以上所有挫折和困難,還有艱難的一關(guān)要過。
機(jī)器學(xué)習(xí)業(yè)內(nèi)的謊言
任何人都可以輕松成為數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)工程師
軟件工程師可以輕松成為數(shù)據(jù)科學(xué)家。
學(xué)習(xí)應(yīng)用“現(xiàn)成庫”就可以輕松上手搞AI。
搞AI無需學(xué)習(xí)高等數(shù)學(xué)/統(tǒng)計(jì)學(xué)
一種特定算法可以應(yīng)用于任何領(lǐng)域并獲得成功
這些,就是Reddit網(wǎng)友當(dāng)年少不更事是信過“鬼話”、踩過的坑。
那么,真下決心走機(jī)器學(xué)習(xí)這條路,應(yīng)該相信什么呢?
首先是要對(duì)行業(yè)現(xiàn)狀有大致了解。
對(duì)于普通開發(fā)來說,機(jī)器學(xué)習(xí)崗位數(shù)量要比其他開發(fā)崗少很多。網(wǎng)友反映,在北美地區(qū),100-150個(gè)后端開發(fā)的公司可能只有有2-5個(gè)搞AI的人。
其次,是很多有AI需求的公司沒有必要的GPU等基礎(chǔ)設(shè)施,你去了才發(fā)現(xiàn)只能使用免費(fèi)的Collab。
從個(gè)人求職角度講,ML項(xiàng)目大多很比較專,比較小眾。你之前的項(xiàng)目經(jīng)驗(yàn),全國可能只有不多的幾家公司感興趣。
明白了這些,你還要清楚怎樣正確地踏入機(jī)器學(xué)習(xí)的門。
多數(shù)有AI需求的公司,要求的是后端+DevOps+AI+前端這樣的一體化崗位。這就需要你的全棧能力。
編寫,測試,部署,在生產(chǎn)中跟蹤模型、構(gòu)建大規(guī)模數(shù)據(jù)是一個(gè)競爭力出眾的機(jī)器學(xué)習(xí)工程師必備的。
而這些能力的基礎(chǔ)要求,就是數(shù)學(xué)。
你當(dāng)然不需要像搞科研那樣精通數(shù)學(xué)。但扎實(shí)的高數(shù)、概率論、統(tǒng)計(jì)學(xué)基礎(chǔ)必不可少。
對(duì)于有些培訓(xùn)課程打出的所謂不要求任何基礎(chǔ)就上手AI的,Reddit網(wǎng)友直接說:“沒有數(shù)學(xué)基礎(chǔ)和過往編程經(jīng)驗(yàn)的人,寫出的代碼是十分可怕的?!?/p>
大牛不僅僅止步于機(jī)器學(xué)習(xí)
當(dāng)然,數(shù)學(xué)基礎(chǔ)再好,代碼寫得再漂亮,也只是一個(gè)優(yōu)秀的機(jī)器學(xué)習(xí)工程師。
真正的大佬,是不會(huì)止步于此的。
一位現(xiàn)在在搞神經(jīng)科學(xué)的網(wǎng)友給出了獨(dú)到的建議:
如果想做真正創(chuàng)新,有趣的工作,那么僅憑機(jī)器學(xué)習(xí)知識(shí)是不夠的。還需要其他專業(yè)知識(shí)。
在特定環(huán)境中,清楚需要用那種ML算法來結(jié)解決問題,并且能高效處理數(shù)據(jù),這樣才能讓你做出行業(yè)內(nèi)獨(dú)樹一幟的先進(jìn)成果。
以上就是Reddit機(jī)器學(xué)習(xí)社區(qū)的“過來人”給大家的忠告。
— 完 —
量子位 QbitAI · 頭條號(hào)簽約
關(guān)注我們,第一時(shí)間獲知前沿科技動(dòng)態(tài)
- 具身智能洶涌,激光雷達(dá)爆單:頭部玩家600%年增長,出貨超20萬臺(tái)2025-08-08
- 智能座艙率先L3!AI Agent上車顛覆體驗(yàn),千里科技WAIC交卷2025-07-28
- 千里科技聯(lián)手階躍星辰、吉利發(fā)布下一代智能座艙Agent OS2025-07-26
- 老黃剛走,全球最強(qiáng)算力Robotaxi方案落地中國2025-07-24