• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給虞超
    發(fā)送

    0

    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    本文作者: 虞超   2026-01-28 12:19
    導(dǎo)語:2026 年 1 月,在操作智能領(lǐng)域權(quán)威評測體系 OSWorld 發(fā)布的最新榜單中,九章云極 DART-GUI-7B 模型,奪得 OSWorld 7B 賽道冠軍

    2026 年 1 月,在操作智能領(lǐng)域權(quán)威評測體系 OSWorld 發(fā)布的最新榜單中,九章云極 DataCanvas 憑借在 Alaya NeW Cloud 強(qiáng)化學(xué)習(xí)平臺(tái)上訓(xùn)練的 DART-GUI-7B 模型,以卓越的智能操控表現(xiàn),一舉奪得 OSWorld 7B 賽道冠軍!

    九章云極:Alaya NeW Cloud 強(qiáng)化學(xué)習(xí)平臺(tái)

    Alaya NeW Cloud 是由九章云極打造的以強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)為核心能力的智算云平臺(tái),該平臺(tái)通過將強(qiáng)化學(xué)習(xí)能力深度融入底層基礎(chǔ)設(shè)施,重構(gòu)了智能計(jì)算的架構(gòu)與邏輯,旨在為企業(yè)和開發(fā)者提供“可用、好用、經(jīng)濟(jì)”的算力資源。

    Alaya NeW Cloud打造前沿強(qiáng)化學(xué)習(xí)云平臺(tái),平臺(tái)原生支持一鍵式Agentic RL 開發(fā)環(huán)境啟動(dòng) 、分布式極核Agentic RL訓(xùn)練,性能上實(shí)現(xiàn)訓(xùn)推分離與全流程加速,生態(tài)上預(yù)置多種主流Agent仿真環(huán)境,高效支撐強(qiáng)化學(xué)習(xí)技術(shù)的快速落地與創(chuàng)新突破,精準(zhǔn)解決 AI 技術(shù)應(yīng)用中的效率和成本等核心問題。目前,九章云極已在全球布局多個(gè)聚焦于加速計(jì)算優(yōu)化的 AIDC 智算中心,持續(xù)賦能 AI 技術(shù)的高效應(yīng)用與行業(yè)規(guī)?;涞亍?span style="text-align: center;"> 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    DataCanvas Alaya NeW Cloud

    核心技術(shù)解讀:輕量化模型的GUI智能體突破

    什么是OSWorld?

    OSWorld 是目前 AI 領(lǐng)域衡量 “智能體(Agent)跨軟件操作電腦” 能力最頂尖的基準(zhǔn)測試,它模擬真實(shí)的操作系統(tǒng)環(huán)境,要求 AI 像人類一樣通過視覺觀察屏幕,并精準(zhǔn)操控瀏覽器、Excel、VS Code 等各類桌面應(yīng)用來完成跨平臺(tái)的復(fù)雜任務(wù),被OpenAI、Anthropic、字節(jié)跳動(dòng)Seed、月之暗面、智譜等頂尖AI團(tuán)隊(duì)廣泛采用,更是檢驗(yàn)AI能否從“只會(huì)聊天”進(jìn)化為“高效數(shù)字員工”的硬核試金石。

    為什么 OSWorld 對 7B 模型幾乎是“地獄難度”?

    ? 真實(shí)生態(tài):任務(wù)在 VS Code、LibreOffice 等真實(shí)軟件中運(yùn)行,環(huán)境信息密度遠(yuǎn)超結(jié)構(gòu)化數(shù)據(jù)

    ? 閉環(huán)操控:需要連續(xù)理解截圖、規(guī)劃路徑和進(jìn)行鍵鼠操作,考驗(yàn)長程推理能力

    ? 零容錯(cuò)率:限時(shí)30步,操作需步步為營,失敗不可逆轉(zhuǎn)

    ? 數(shù)據(jù)稀疏:基礎(chǔ)成功率不足1/4,即使是大模型也面臨嚴(yán)峻挑戰(zhàn)

    復(fù)雜的跨軟件協(xié)作與精細(xì)的坐標(biāo)控制,使得參數(shù)規(guī)模有限的7B模型在“理解”與“執(zhí)行”之間難以調(diào)和,長期處于“不可用”狀態(tài)。

    核心技術(shù)路徑:九章云極 三大創(chuàng)新賦能輕量化突破

    1. 核心方法:解耦式 GUI 智能體強(qiáng)化學(xué)習(xí)框架

    九章云極并未通過簡單擴(kuò)大模型規(guī)模取勝,而是選擇了系統(tǒng)級的算法創(chuàng)新。提出了 DART(Decoupled Agentic Reinforcement Training),首次將 GUI 智能體的強(qiáng)化學(xué)習(xí)訓(xùn)練流程徹底解耦為四個(gè)異步模塊: 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    三項(xiàng)關(guān)鍵突破

    ? 推演級軌跡調(diào)度(Rollout-Level Scheduling)

    ? 以“單條軌跡”作為調(diào)度最小單位

    ? 每個(gè) rollout 完成后立即釋放環(huán)境并啟動(dòng)下一個(gè)任務(wù)

    ? 環(huán)境利用率提升從 12.2% 達(dá)到 67.7%,提升幅度高達(dá) 5.5 倍

    ? 動(dòng)態(tài)模型服務(wù)池(Dynamic Model Serving Pool)

    ? 采用 GPU 推演的集中化管理,支持多模型版本的熱加載

    ? 避免了傳統(tǒng)“一卡一環(huán)境”的資源浪費(fèi)

    ? GPU 推演利用率提升 1.6 倍

    ? GPU 資源的并發(fā)彈性擴(kuò)展能力

    ? 訓(xùn)練與推理異步執(zhí)行(Asynchronous Execution of Training and Inference)

    ? 訓(xùn)練與推演實(shí)現(xiàn)異步解耦

    ? 避免模型更新導(dǎo)致服務(wù)阻塞

    2. 數(shù)據(jù)策略:四層自適應(yīng)篩選,放大稀疏成功信號

    針對 GUI 強(qiáng)化學(xué)習(xí)中的“成功少、噪聲多”核心難題,DART 設(shè)計(jì)了覆蓋任務(wù)、軌跡、步驟和 Token 的四層篩選機(jī)制:

    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    這一機(jī)制使得 7B 模型,在最大30步內(nèi),即可穩(wěn)定的實(shí)現(xiàn)OSWorld中的任務(wù)要求。

    3. 多維優(yōu)化:以輕量化參數(shù)對沖復(fù)雜場景,重塑性能邊界

    九章云極經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的7B 模型之所以能實(shí)現(xiàn)突破,關(guān)鍵在于采用了“場景適配、精度優(yōu)化、算力協(xié)同”的三維技術(shù)方案,在控制參數(shù)量的同時(shí),最大化提升操作智能性能。

    ? 場景化指令對齊技術(shù):基于百萬級真實(shí)操作場景數(shù)據(jù)訓(xùn)練,構(gòu)建細(xì)分領(lǐng)域的指令庫,優(yōu)化模型對辦公自動(dòng)化、數(shù)據(jù)處理等高頻場景的語義理解能力,精準(zhǔn)捕捉模糊指令背后的核心需求,使指令理解準(zhǔn)確率較通用模型提升23%,并減少無效操作。

    ? 混合精度推理優(yōu)化:借鑒智算硬件優(yōu)化經(jīng)驗(yàn),對模型不同模塊進(jìn)行精度分層處理。核心推理模塊保留 FP16 精度以確保準(zhǔn)確性,非核心模塊量化至 INT8 精度。這一調(diào)度方式實(shí)現(xiàn)推理效率提升 1.8 倍,資源占用率降低 40%。

    ? 軟硬件協(xié)同調(diào)度機(jī)制:依托自研的智算技術(shù)棧優(yōu)勢,深度協(xié)同模型推理與算力資源,動(dòng)態(tài)調(diào)整算力分配策略以應(yīng)對負(fù)載波動(dòng),避免資源閑置。同時(shí)使用專用推理加速引擎優(yōu)化 GUI 元素識(shí)別與動(dòng)作規(guī)劃的計(jì)算鏈路,進(jìn)一步降低輕量化模型的推理延遲。

    實(shí)驗(yàn)結(jié)果:全類型任務(wù)下性能優(yōu)勢顯著 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    在最大步長僅有 30 步的情況下,DART-GUI-7B 在多種任務(wù)類型上表現(xiàn)出顯著優(yōu)勢,包括:

    ? 瀏覽器類(Chrome)

    ? 圖像/設(shè)計(jì)類(GIMP)

    ? 郵件客戶端類(Thunderbird)

    ? 代碼/IDE 類(VS Code)

    ? 操作系統(tǒng)交互類(OS)

    亮點(diǎn):GIMP 類任務(wù)的正確率高達(dá) 80.77%,且在辦公套件(Impress、Writer、Calc)、媒體播放類(VLC)以及多應(yīng)用協(xié)同等任務(wù)中,其能力也有顯著提升。

    九章云極還進(jìn)行了真實(shí)場景的驗(yàn)證。在 DataCanvas Alaya NeW 平臺(tái)上,DART-GUI-7B 成功地通過鍵鼠操作完成文檔查找、導(dǎo)航到指定頁面及查找官網(wǎng)聯(lián)系方式等場景任務(wù),其成功率超過 90%。

    產(chǎn)業(yè)價(jià)值與未來展望

    目前,AI 大模型正加速從“技術(shù)驗(yàn)證”向“產(chǎn)業(yè)落地”轉(zhuǎn)變。通用人工智能作為連接數(shù)字世界與物理操作的重要工具,在辦公自動(dòng)化、智能運(yùn)維和工業(yè)控制等領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。然而,模型部署成本高、輕量化模型性能不足及數(shù)據(jù)出域安全等問題,仍然是產(chǎn)業(yè)規(guī)?;年P(guān)鍵瓶頸。

    九章云極的 7B GUI 模型突破為行業(yè)提供了“低成本、高性能”的通用人工智能解決方案,有望推動(dòng)通用人工智能在中小企業(yè)及長尾場景的普及。


    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個(gè)人簡介
    為了您的賬戶安全,請驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 亚洲AV涩涩涩成人网站在线播放 | 亚洲老熟女一区二区三区| 欧洲成人精品| 国产成人亚洲精品青草| 成人影音先锋| 国产农村老熟女乱子综合| av美女网站| 无码高潮爽到爆的喷水视频app| 亚洲精品字幕| 小Ⅹ福利姬蓝导航| 亚洲一区二区精品极品| 亚洲高清最新AV网站| 国产午夜福利视频一区二区| 1024你懂的日韩人妻学生| 国产女人18毛片水真多1| 国产成人AVXXXXX在线观看| 亚洲欧美日韩在线资源观看| 制服丝袜在线云霸| 一区二区福利在线视频| 大屁股国产白浆一二区| 久久这里只有精品8| 色色97| 白白色发布在线播放国产| 夜色福利站WWW国产在线视频| 少妇无码一区二区三区免费| 国产视频深夜在线观看| 99久久婷婷国产综合精品青草漫画| A级毛片无码兔费真人久久| t=&tags=%E5%90%8E%E5%85%A5%E9%AA | 玖草在线视频| 无码人妻精品一区二区蜜桃网站| 精品久久久久久无码专区不卡| 日韩av一区二区三区在线| xxxx丰满少妇高潮| 免费看污视频的网站 | 婷婷综合久久一区二区三区| 色午夜久久男人操女人| 国产婷婷精品av在线| 精品熟女视频专区| 性一交一乱一乱一视频 | 国偷自产视频一区二区久|