「表面光鮮,實則搬磚」,機器學(xué)習(xí)社區(qū)自嘲不為人知的AI工程師真相
機器學(xué)習(xí)工程師崗位,還香嗎?
賈浩楠 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
機器學(xué)習(xí)工程師崗位,還香嗎?
在培訓(xùn)機構(gòu)或求職網(wǎng)站隨便一搜,機器學(xué)習(xí)簡直不要更熱。
但是,國外的同行們卻在一則Reddit熱帖上,吐槽揭露ML工程師“表面光鮮,實際搬磚”的一面。
說出了培訓(xùn)機構(gòu)不會告訴你的機器學(xué)習(xí)業(yè)內(nèi)真相。
那這些“過來人”怎么掉進一個個暗坑的?他們的經(jīng)歷對你有什么警醒借鑒的意義呢?
機器學(xué)習(xí)崗,怎樣避免淪為數(shù)據(jù)標注師
Reddit熱帖下,網(wǎng)友們吐槽最多的,就是學(xué)習(xí)和工作的巨大差距產(chǎn)生的幻滅感。
學(xué)了一大堆牛X高大上的理論知識,以為自己能上手酷炫的神經(jīng)網(wǎng)絡(luò),調(diào)參、訓(xùn)練、部署一條龍,但實際上,這些內(nèi)容大概只占全部工作的10%-20%。
而且在一些團隊中,會有專門的崗位來負責這些工作。
其余大部分人的職責是收集數(shù)據(jù)、給數(shù)據(jù)打標簽、處理數(shù)據(jù)質(zhì)量,或者用Python寫基礎(chǔ)架構(gòu)。
當年夢中的那個引領(lǐng)AI潮流的少年,就這樣成了數(shù)據(jù)標注師。
但是,網(wǎng)友也承認這一點確實是業(yè)內(nèi)的普遍現(xiàn)象。而且,剛剛工作的新手,從低層技術(shù)開始做起,也是符合常理的。
大家的建議是:面對這種大量重復(fù)勞動,先別急著上手,去查一查資料,很多類似工作已經(jīng)有成熟快速的方法。
當你跨過了基礎(chǔ)工作這一關(guān),要面對的,是ML項目中可能出現(xiàn)的各種令人頭疼的問題,而這,是考驗?zāi)隳芊癯蔀閮?yōu)秀機器學(xué)習(xí)工程師的重要挑戰(zhàn)。
機器學(xué)習(xí)之路布滿荊棘
哪些在工作崗位上很重要的東西,是機器學(xué)習(xí)教程不會教你的?
網(wǎng)友們總結(jié)了最重要的4條:
正確認識業(yè)務(wù)
處理凌亂的現(xiàn)實世界數(shù)據(jù)集
工程導(dǎo)向,而不是在Jupyter Notebooks中編寫研究代碼
可視化
這些都是網(wǎng)友們在工作經(jīng)歷中吃了很多虧后,總結(jié)出的經(jīng)驗。
比如,很多ML工程師只有給定一個抽象化的問題才能上手,缺乏應(yīng)對實際工程問題的能力。
而一個合格的、被業(yè)內(nèi)廣范認可的機器學(xué)習(xí)工程師,他可能并不精通算法的數(shù)學(xué)原理,而是能夠在約束條件眾多的實際情況下應(yīng)用算法解決問題。
比如,在很多情況下,普通的舊算法(例如K-Means,高斯混合的EM等)非常有用。燒GPU并不是唯一辦法。
避免紙上談兵,這是機器學(xué)習(xí)算法工程師正確認識業(yè)務(wù)的一部分,除此之外,重要的點還有合理的工期規(guī)劃,和良好的溝通能力。
規(guī)劃傳統(tǒng)工程項目時,設(shè)定里程碑、期望值、是(相對)簡單的。
但對于機器學(xué)習(xí)項目來說,在最初目標和前期階段之后,很難給出具體的計劃,因為變數(shù)實在太多了。
這就需要在項目初期階段就保持頭腦清醒,不要給自己挖坑,同時也要和boss以及同事說明溝通。
一位網(wǎng)友談到了切身體會。他放棄了機器學(xué)習(xí)算法崗位,原因是老板根本不關(guān)心他為了完善算法細節(jié)付出了多少艱苦的勞動,只看最后的可視化效果。
當boss發(fā)現(xiàn)可視化效果并不高級時,認為他一直在浪費時間沒好好工作。
所以,比其他軟件工程師更強的抗錯能力,也是你必備的。
如果你能抗過以上所有挫折和困難,還有艱難的一關(guān)要過。
機器學(xué)習(xí)業(yè)內(nèi)的謊言
任何人都可以輕松成為數(shù)據(jù)科學(xué)家/機器學(xué)習(xí)工程師
軟件工程師可以輕松成為數(shù)據(jù)科學(xué)家。
學(xué)習(xí)應(yīng)用“現(xiàn)成庫”就可以輕松上手搞AI。
搞AI無需學(xué)習(xí)高等數(shù)學(xué)/統(tǒng)計學(xué)
一種特定算法可以應(yīng)用于任何領(lǐng)域并獲得成功
這些,就是Reddit網(wǎng)友當年少不更事是信過“鬼話”、踩過的坑。
那么,真下決心走機器學(xué)習(xí)這條路,應(yīng)該相信什么呢?
首先是要對行業(yè)現(xiàn)狀有大致了解。
對于普通開發(fā)來說,機器學(xué)習(xí)崗位數(shù)量要比其他開發(fā)崗少很多。網(wǎng)友反映,在北美地區(qū),100-150個后端開發(fā)的公司可能只有有2-5個搞AI的人。
其次,是很多有AI需求的公司沒有必要的GPU等基礎(chǔ)設(shè)施,你去了才發(fā)現(xiàn)只能使用免費的Collab。
從個人求職角度講,ML項目大多很比較專,比較小眾。你之前的項目經(jīng)驗,全國可能只有不多的幾家公司感興趣。
明白了這些,你還要清楚怎樣正確地踏入機器學(xué)習(xí)的門。
多數(shù)有AI需求的公司,要求的是后端+DevOps+AI+前端這樣的一體化崗位。這就需要你的全棧能力。
編寫,測試,部署,在生產(chǎn)中跟蹤模型、構(gòu)建大規(guī)模數(shù)據(jù)是一個競爭力出眾的機器學(xué)習(xí)工程師必備的。
而這些能力的基礎(chǔ)要求,就是數(shù)學(xué)。
你當然不需要像搞科研那樣精通數(shù)學(xué)。但扎實的高數(shù)、概率論、統(tǒng)計學(xué)基礎(chǔ)必不可少。
對于有些培訓(xùn)課程打出的所謂不要求任何基礎(chǔ)就上手AI的,Reddit網(wǎng)友直接說:“沒有數(shù)學(xué)基礎(chǔ)和過往編程經(jīng)驗的人,寫出的代碼是十分可怕的?!?/p>
大牛不僅僅止步于機器學(xué)習(xí)
當然,數(shù)學(xué)基礎(chǔ)再好,代碼寫得再漂亮,也只是一個優(yōu)秀的機器學(xué)習(xí)工程師。
真正的大佬,是不會止步于此的。
一位現(xiàn)在在搞神經(jīng)科學(xué)的網(wǎng)友給出了獨到的建議:
如果想做真正創(chuàng)新,有趣的工作,那么僅憑機器學(xué)習(xí)知識是不夠的。還需要其他專業(yè)知識。
在特定環(huán)境中,清楚需要用那種ML算法來結(jié)解決問題,并且能高效處理數(shù)據(jù),這樣才能讓你做出行業(yè)內(nèi)獨樹一幟的先進成果。
以上就是Reddit機器學(xué)習(xí)社區(qū)的“過來人”給大家的忠告。
— 完 —
量子位 QbitAI · 頭條號簽約
關(guān)注我們,第一時間獲知前沿科技動態(tài)
- 具身智能洶涌,激光雷達爆單:頭部玩家600%年增長,出貨超20萬臺2025-08-08
- 智能座艙率先L3!AI Agent上車顛覆體驗,千里科技WAIC交卷2025-07-28
- 千里科技聯(lián)手階躍星辰、吉利發(fā)布下一代智能座艙Agent OS2025-07-26
- 老黃剛走,全球最強算力Robotaxi方案落地中國2025-07-24