0
| 本文作者: 小七 | 2026-06-25 17:40 |
此次股東大會使用的全套 20 余頁演示 PPT,也是由 SenseNova-U1 Pro 一次性生成,在這個過程中模型自主進行了規劃、思考、制作、評估的全過程,「保證信息傳達的邏輯、每個數字的準確,每個頁面的美觀,所有東西都渾然一體,是一個非常復雜的工程」。商湯方面還表示,這是其首次在正式對外公告中全程采用日日新大模型完成制作。
在技術層面,SenseNova-U1 Pro 主打的核心能力包括:在同一內核內打通多模態理解與生成。同時基于內在的圖文交錯思維能力,它面對復雜需求,像一個“會思考的設計師”一樣,實現設計、生成、評審的長程循環。以生成城市規劃圖為例,模型會先對整個城市布局進行智能評估,嘗試部署不同的規劃與生成策略,在內部評估生成效果并不斷自主調整,最終輸出可以直接交付的“成品級”結果。

SenseNova-U1 Pro將規劃構生成為設計工程草圖
此外,SenseNova-U1 Pro 還率先支持了原生 8K 分辨率輸出。據介紹,GPT-Image-2 等當前全球最強的生成模型,原生直出分辨率上限僅為 4K。

01
同一國畫風「二十四節氣」提示詞下,SenseNova-U1 Pro 完整呈現全部 24 個節氣、逐一標注日期與序號、四季分區清晰;GPT-Image-2 生成內容相對缺失。
GPT-Image-2生成 |
SenseNova-U1 Pro生成 |

02
國畫長卷(橫版)
同一主題切換為橫版長卷形式,SenseNova U1-Pro 一句提示詞直出,24 個節氣完整有序,每格配以獨立國畫插圖與氣候描述,順時而生、四季有序。

SenseNova-U1 Pro生成 (點擊查看大圖)

03
雜志跨頁
SenseNova-U1 Pro 以一句提示詞生成 GQ 風格「007 · 阿斯頓·馬丁 DB5 座駕檔案」橫版跨頁,涵蓋車輛詳細規格參數表、多角度實拍圖集、車主歷史時間軸、電影片場注記等,版式還原度達到商業出版可用水準。如此包含了復雜多欄混排與長文本段落控制的出版與品牌設計場景,也是目前圖像生成模型最難實現的能力維度之一。

SenseNova-U1 Pro生成 (點擊查看大圖)

04
SenseNova-U1 Pro 一鍵輸出 SenseNova U1 的論文海報,信息密度極高,包含架構圖、基準表格與可識別二維碼;GPT-Image-2 版本留白偏多、密度偏低。
GPT-Image-2生成 |
SenseNova-U1 Pro生成 |

05
基于同一段深夜暗巷追逐戲的提示詞,SenseNova-U1 Pro 可以輸出 16000×24000+ 像素、含 40-60 格的導演級分鏡稿,每格附景別、機位與情緒標注;GPT-Image-2 僅輸出 1024×1536,放大后存在細節失真,分鏡形式簡單,情緒表現力也偏弱。分辨率上百倍的差距,對專業創作場景有著極大影響。
針對這一場景林達華表示:“思考、理解和創作在一個大腦里面統一,就像編劇和導演融為一體。” SenseNova-U1 Pro 的這一突出能力,也將為商湯短片智能體 Seko 進行復雜的劇集創作提供強大支持。
GPT-Image-2生成 |
SenseNova-U1 Pro生成 |
行業普遍預測,OpenAI 即將在近期發布國際前沿模型,并同樣將“設計”錨定為重點發力方向。商湯在此預告 SenseNova-U1 Pro 全新旗艦模型,不但是與頂尖 AI 巨頭的正面對壘,也向外界釋放了一個信號,表明在編程以外,“設計”正在成為頂級多模態模型的下一個主要賽場。
當模型能力突破工業紅線,其產業空間極為廣闊,將給產品開發、平面設計、工業設計、視頻制作、城市和園區規劃等行業帶來變革性升級。
對于商湯而言,SenseNova-U1 Pro 所承載的遠不止于此,它還將成為數字智能與物理智能融合的技術基座,驅動 AI 走向更廣闊的物理空間。