網上的假貨太多,你把握不住的,讓AI來
阿里AI“打假師”,讓假貨商家少掙W
蕭簫 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
還在發(fā)愁網購的東西可能是假貨?
現在,阿里自己搞了個AI打假師,讓算法來協(xié)助打假了!
只要讓它看一眼想辨認的商品照片,它就能在幾十毫秒的時間里,判斷出商品的真假。
相當于你一眨眼(約0.5秒),它就已經識別了10個假貨。
不僅如此,阿里安全團隊還公開了一個包含100萬張正版商標照片的數據集Open Brand,讓更多的人能參與到“AI打假”行動中來。
那么,AI究竟如何打假呢?
對高仿和山寨同時出擊
首先,需要了解假貨的售賣套路。
由于沒有售賣正品的資質,假貨店鋪需要采用各種手段,逃過追查:
其一,“高仿”類商品。這種假貨會對logo進行模糊處理、部分遮擋,甚至用上對抗樣本攻擊(沒錯,就是這么高科技)。
在網購平臺上,我們看到的假貨圖片往往是這樣的:
這些商品的外觀,往往與品牌商品非常接近,然而并沒有產品保障。
其二,“山寨”類商品。這種假貨會對logo進行PS、并在注冊時使用仿冒名稱,以躲過算法的識別。
可別說,這些山寨貨,玩起“仿妝”來很有一套:
用戶一不留神,就容易中圈套,然而平臺人工審查的速度,又實在有限。
為此,阿里安全團隊決定,搞個AI“打假師”,更快地進行打假。
AI打假模型,最需要解決的,是這3個問題:
- 如何解決小目標識別的問題?(圖片中的商標logo往往非常?。?/li>
- 如何解決logo模糊變形打碼、甚至引入攻擊樣本的問題?
- 如何準確識別“山寨”版logo?
為了解決這些問題,阿里安全團隊設計了一個名為Brand Net的模型。
據阿里安全圖靈實驗室資深算法專家華棠介紹,模型主要分成三部分:
Cascade-RPN,這部分重點解決了商品圖片中檢測的logo“時大時小”的問題,提升了目標檢測準確率、小目標召回率。
Soft Mask Attention,這部分采用遷移學習,構造了一個檢測框(bounding box)特征到分割(segmentation)特征的映射空間,有效提升logo較小、或發(fā)生形變時的檢測準確率。
Feature Representation and Instance Retrieval,這部分使得模型能在新logo加入時進行彈性擴展,不需要再對模型進行重復訓練。
當然,Brand Net作為AI“打假師”的招數之一,主要還是用于比較有名(商品照片非常多)的品牌,因為它們的商品圖片更多,訓練出來的模型效果就會更好。
△數據量不均衡的長尾問題
對于一些商品照片不多的新品牌,AI“打假師”就會通過另一種方式,來提升自己的鑒別能力:
以半監(jiān)督的方式,包括3D數據增強,領域遷移(HDA),自蒸餾等,來進行訓練。
測試表明,這個AI“打假師”,在NVIDIA的多種顯卡(T4、P100、V100)上都已經取得了非??焖俚臋z測效果,平均在30~50ms內就能識別一件假貨。
而且,識別的效果還非常好,線上圖片的識別準確率,達到了95%。
當然,網購平臺不會完全根據AI“打假師”的判斷結果,直接對商家進行處罰。
在AI“打假師”找出疑似售賣假貨的商家后,平臺還會從商品內容、售賣信息、資質、消費者反饋等多個維度進行調查,以判斷商家是否存在賣假貨的情況。
目前,阿里安全團隊已經利用技術打假,協(xié)助警方偵破了好幾起案件,光是奢侈品包包假貨特大案就有6起,并搗毀了生產窩點10余個、抓獲犯罪嫌疑人150余名。
其中,就包括2020年8月,上海警方公開過的“上海青浦生產銷售假冒LV注冊商標商品案”,這起案件的涉案金額超億元。
聽起來確實很coooool。
更酷的是,阿里已經把用于訓練的logo數據集給公開了。
訓練的logo數據集已公開
據阿里安全團隊介紹,這個公開的數據集名為Open Brand。
Open Brand是全球最大的奢侈品logo數據集,包含500多個奢侈品大類、1000多個子類商標,累計超過100萬張商標logo圖片。
每張圖片,都按COCO結構進行了詳細標記:
logo圖片的數量也是吊打其他數據集……
據阿里安全團隊介紹,數據集中的照片數據,均來源于淘寶、天貓、1688、Aliexpress,以及谷歌和百度搜索引擎。
根據公開數據協(xié)議,這些數據集中的照片,僅用于學術研究,不能進行商業(yè)化使用。
AI打假行動,你也可以參與
為了找出更好的AI打假模型,阿里安全團隊搞了個「魯棒性標識檢測挑戰(zhàn)賽」,獎金30萬。
簡單來說,身經百戰(zhàn)的阿里安全團隊,將會化身“假貨商家”,對參賽者提交的AI打假模型做出各種考驗。
例如,故意對logo圖片進行各種處理(模糊、加水印、生成對抗樣本),看看AI打假模型能否準確識別。
而參賽者們用來訓練的數據集,就是這次公開的大型logo數據集Open Brand,報名后就能獲取。
只要參加比賽,你就能獲得與高校團隊、安全大牛一較高下的機會。
目前,排行榜還在不斷刷新中。
你心動了嗎?
阿里AI打假比賽(可獲取公開數據集):
https://tianchi.aliyun.com/competition/entrance/531888/information
Brand Net論文地址:
https://arxiv.org/abs/2012.07350
- 首個GPT-4驅動的人形機器人!無需編程+零樣本學習,還可根據口頭反饋調整行為2023-12-13
- IDC霍錦潔:AI PC將顛覆性變革PC產業(yè)2023-12-08
- AI視覺字謎爆火!夢露轉180°秒變愛因斯坦,英偉達高級AI科學家:近期最酷的擴散模型2023-12-03
- 蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型2023-12-07