0
| 本文作者: 徐咪 | 2025-12-31 17:45 |
12月31日,阿里正式開源新一代圖像生成模型Qwen-Image-2512,實現人物肌膚質感、自然紋理還原與復雜文字渲染的大幅提升。僅需輸入文字指令,新模型即可生成“零AI味”的高質量圖片,人物發絲都清晰可見,堪比專業攝影師拍的真實照片。同時,千問新模型支持流暢生成漫畫風格PPT、數據信息圖等復雜圖像,可滿足專業設計場景下的多樣化需求。
Qwen-Image-2512是8月發布的Qwen-Image圖像生成基座模型的迭代版本,實現了性能的大幅提升。在聚焦文生圖的AI Arena評測中,開發者對模型進行了超萬輪盲測,Qwen-Image-2512位居開源模型榜首。具體測試結果顯示,該模型在圖像生成的真實度,語義遵循的準確度上表現卓越,不僅大幅領先其他開源模型,更在與多個閉源商用模型的對比中展現出強勁競爭力。
圖說:Qwen-Image-2512在AI Arena上的模型盲測結果
從模型效果上看,全新的Qwen-Image-2512大幅降低了大模型生成圖像的“AI感”。在人物面部細節、皮膚紋理、發絲刻畫上,新模型效果顯著,無論是人物眼角的細紋、風吹起發絲的方向,還是寵物柔軟蓬松的毛發、湖面折射的環境倒影,千問新模型都能精準還原,效果接近相機實拍。不僅如此,新模型還能輕松駕馭復雜的視覺創作需求,一鍵生成媲美專業設計師水準的四格漫畫風PPT、高質量信息圖等。
圖說:Qwen-Image新舊兩版生成圖像對比(左為上一代,右為新版本)
據了解,目前千問圖像模型已形成多款多功能的完整矩陣,包含基座模型Qwen-Image、圖像編輯模型Qwen-Image-Edit、圖層編輯模型Qwen-Image-Layered等,涵蓋不同場景與精度需求。三大模型系列均已在魔搭社區和HuggingFace開源,開發者和企業可免費下載商用,也可通過阿里云百煉調用模型API服務,普通用戶可以在千問APP直接體驗新模型,感受“零AI感”的高保真圖像生成體驗。
圖說:用Qwen-Image-2512一鍵生成的PPT(文字、排版、風格為直出)
截至2025年底,阿里總共開源近400個千問Qwen模型,全球下載量超7億,衍生模型數量突破18萬,是全球第一開源大模型。阿里千問大模型服務超100萬家客戶,在中國企業級大模型調用市場中位居第一,是中國企業選擇最多的大模型。