階躍星辰推出開源 SOTA 圖像編輯模型,一個月連發(fā)三款多模態(tài)模型
已經(jīng)可以在 GitHub、HuggingFace、ModelScope 等技術(shù)社區(qū)調(diào)用。
今日,階躍星辰發(fā)布通用圖像編輯模型 Step1X-Edit ,提供人人可用的多模態(tài)改圖能力,可以幫用戶完成日常工作和生活中最高頻的 11 類圖像編輯任務(wù):包括替換圖片中的文字、為人物做美化修圖、對畫面進行風格遷移和材質(zhì)變換等。用戶在階躍 AI App 和網(wǎng)頁端(stepfun.com)可以免費使用。網(wǎng)友評價,這款改圖工具能夠“聽得懂、改得準、保得住”。
Step1X-Edit 模型的總參數(shù)量為 19B ,具備語義精準解析、身份一致性保持、高精度區(qū)域級控制三項關(guān)鍵能力。為了讓模型測試最大程度貼近市場產(chǎn)品需求,階躍星辰自研了基準測試集 GEdit-Bench,評測數(shù)據(jù)來源于社區(qū)真實編輯請求。根據(jù) GEdit-Bench 的評測結(jié)果,Step1X-Edit 在三項核心指標中均大幅領(lǐng)先現(xiàn)有開源模型,達到開源 SOTA(State of the Art,即“當前最佳技術(shù)”)水平,在語言理解與圖像重構(gòu)之間實現(xiàn)理想平衡。
△GEdit-Bench 量化評測結(jié)果對比
值得一提的是,Step1X-Edit 上線即開源,目前開發(fā)者已經(jīng)可以在 GitHub、HuggingFace、ModelScope 等技術(shù)社區(qū)調(diào)用。
根據(jù)統(tǒng)計,這是最近一個月階躍星辰上新的第三款多模態(tài)模型,此前還陸續(xù)推出了圖生視頻開源模型和多模態(tài)推理模型。據(jù)統(tǒng)計發(fā)現(xiàn),目前階躍星辰 Step 系列基座模型矩陣中,多模態(tài)模型的占比已經(jīng)達 7 成。
*本文系量子位獲授權(quán)刊載,觀點僅為作者所有
- 超詳細!2025科技創(chuàng)變者大會最新議程公布!2025-08-21
- 中科慧遠發(fā)布CASIVIBOT,以九年積累開啟AOI與機器人協(xié)同的品質(zhì)檢測新時代2025-08-20
- 嚯!剛剛,張麻子陪我玩黑猴了2025-08-19
- 機器人全產(chǎn)業(yè)鏈接會 FAIR plus 2026媒體見面會在京召開2025-08-16