^{<blockquote id="ykvkd"></blockquote>}

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

本文作者：小七

2026-06-25 17:40

導語：商湯新一代旗艦多模態模型即將發布，8K 原生能力突圍 AI 設計賽道。

在日前舉辦的股東大會上，商湯科技首次對外預告了其下一代旗艦多模態基座模型——商湯日日新 SenseNova-U1 Pro。它定位為業界首個以“理解·生成·行動”原生統一為內核的多模態智能體基座，預計將于2026年7月正式啟動邀請測試。值得注意的是，此次商湯明確將全球頂尖模型 GPT-Image-2 作為對標對象，并把“交付級”設計作為模型應用的重要賽道。現場共展示五組預覽圖，覆蓋從傳統文化圖鑒到專業影視創作的多類高難度場景。

此次股東大會使用的全套 20 余頁演示 PPT，也是由 SenseNova-U1 Pro 一次性生成，在這個過程中模型自主進行了規劃、思考、制作、評估的全過程，「保證信息傳達的邏輯、每個數字的準確，每個頁面的美觀，所有東西都渾然一體，是一個非常復雜的工程」。商湯方面還表示，這是其首次在正式對外公告中全程采用日日新大模型完成制作。

在技術層面，SenseNova-U1 Pro 主打的核心能力包括：在同一內核內打通多模態理解與生成。同時基于內在的圖文交錯思維能力，它面對復雜需求，像一個“會思考的設計師”一樣，實現設計、生成、評審的長程循環。以生成城市規劃圖為例，模型會先對整個城市布局進行智能評估，嘗試部署不同的規劃與生成策略，在內部評估生成效果并不斷自主調整，最終輸出可以直接交付的“成品級”結果。

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

SenseNova-U1 Pro將規劃構生成為設計工程草圖

此外，SenseNova-U1 Pro 還率先支持了原生 8K 分辨率輸出。據介紹，GPT-Image-2 等當前全球最強的生成模型，原生直出分辨率上限僅為 4K。

知識信息圖（豎版），

PK 對標 GPT-Image-2

同一國畫風「二十四節氣」提示詞下，SenseNova-U1 Pro 完整呈現全部 24 個節氣、逐一標注日期與序號、四季分區清晰；GPT-Image-2 生成內容相對缺失。

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

GPT-Image-2生成

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

SenseNova-U1 Pro生成

國畫長卷（橫版）

同一主題切換為橫版長卷形式，SenseNova U1-Pro 一句提示詞直出，24 個節氣完整有序，每格配以獨立國畫插圖與氣候描述，順時而生、四季有序。

SenseNova-U1 Pro生成（點擊查看大圖）

雜志跨頁

SenseNova-U1 Pro 以一句提示詞生成 GQ 風格「007 · 阿斯頓·馬丁 DB5 座駕檔案」橫版跨頁，涵蓋車輛詳細規格參數表、多角度實拍圖集、車主歷史時間軸、電影片場注記等，版式還原度達到商業出版可用水準。如此包含了復雜多欄混排與長文本段落控制的出版與品牌設計場景，也是目前圖像生成模型最難實現的能力維度之一。

SenseNova-U1 Pro生成（點擊查看大圖）

學術海報，PK 對標 GPT-Image-2

SenseNova-U1 Pro 一鍵輸出 SenseNova U1 的論文海報，信息密度極高，包含架構圖、基準表格與可識別二維碼；GPT-Image-2 版本留白偏多、密度偏低。

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

GPT-Image-2生成

商湯新模型 SenseNova-U1 Pro 曝光，對標 GPT-Image-2，瞄準「設計」賽道

SenseNova-U1 Pro生成

電影分鏡，PK 對標 GPT-Image-2

基于同一段深夜暗巷追逐戲的提示詞，SenseNova-U1 Pro 可以輸出 16000×24000+ 像素、含 40-60 格的導演級分鏡稿，每格附景別、機位與情緒標注；GPT-Image-2 僅輸出 1024×1536，放大后存在細節失真，分鏡形式簡單，情緒表現力也偏弱。分辨率上百倍的差距，對專業創作場景有著極大影響。