• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    業(yè)界 正文
    發(fā)私信給我在思考中
    發(fā)送

    0

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平

    本文作者: 我在思考中 2024-01-22 16:20
    導(dǎo)語(yǔ):中英文兩大權(quán)威榜單領(lǐng)先,更懂中國(guó)用戶

    1月22日,零一萬(wàn)物Yi系列模型家族迎來(lái)新成員,Yi Vision Language(Yi-VL)多模態(tài)語(yǔ)言大模型正式面向全球開(kāi)源。憑借卓越的圖文理解和對(duì)話生成能力,Yi-VL模型在英文數(shù)據(jù)集MMMU和中文數(shù)據(jù)集CMMMU上取得了領(lǐng)先成績(jī),展示了在復(fù)雜跨學(xué)科任務(wù)上的強(qiáng)大實(shí)力。

    據(jù)悉,Yi-VL模型基于Yi 語(yǔ)言模型開(kāi)發(fā),包括Yi-VL-34B和Yi-VL-6B兩個(gè)版本。在全新多模態(tài)基準(zhǔn)測(cè)試MMMU中,兩個(gè)版本均有不俗表現(xiàn)。

    MMMU(全名Massive Multi-discipline Multi-modal Understanding & Reasoning 大規(guī)模多學(xué)科多模態(tài)理解和推理)數(shù)據(jù)集包含了11500個(gè)來(lái)自六大核心學(xué)科(藝術(shù)與設(shè)計(jì)、商業(yè)、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)以及技術(shù)與工程)的問(wèn)題,涉及高度異構(gòu)圖像類型和交織文本圖像信息,對(duì)模型的高級(jí)知覺(jué)和推理能力提出了極高要求。令人矚目的是,Yi-VL-34B在該測(cè)試集上以41.6%的準(zhǔn)確率,成功超越了一系列多模態(tài)大模型,僅次于GPT-4V(55.7%),展現(xiàn)出強(qiáng)大的跨學(xué)科知識(shí)理解和應(yīng)用能力。

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 來(lái)源:https://mmmu-benchmark.github.io

    同樣,在針對(duì)中文場(chǎng)景打造的CMMMU數(shù)據(jù)集上,Yi-VL模型再次展現(xiàn)“更懂中國(guó)人”的獨(dú)特優(yōu)勢(shì)。CMMMU包含了約12000道源自大學(xué)考試、測(cè)驗(yàn)和教科書(shū)的中文多模態(tài)問(wèn)題。其中,GPT-4V在該測(cè)試集上的準(zhǔn)確率為43.7%, Yi-VL-34B以36.5%的準(zhǔn)確率緊隨其后,領(lǐng)先于當(dāng)前最前沿的開(kāi)源多模態(tài)模型。

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 來(lái)源:https://cmmmu-benchmark.github.io/

    Yi-VL模型在圖文對(duì)話等多元場(chǎng)景中的表現(xiàn)如何?我們先看兩個(gè)范例:

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 

    可以看到,基于Yi語(yǔ)言模型的強(qiáng)大文本理解能力,只需對(duì)圖片進(jìn)行對(duì)齊,就可以得到不錯(cuò)的多模態(tài)視覺(jué)語(yǔ)言模型——這也是Yi-VL模型的核心亮點(diǎn)之一。

    零一萬(wàn)物Yi-VL多模態(tài)語(yǔ)言模型上線,躋身全球開(kāi)源頂尖水平 圖說(shuō):Yi-VL模型架構(gòu)設(shè)計(jì)和訓(xùn)練方法流程一覽。


    在架構(gòu)設(shè)計(jì)上,Yi-VL模型基于開(kāi)源 LLaVA架構(gòu),包含三個(gè)主要模塊:

    ? Vision Transformer(簡(jiǎn)稱ViT)用于圖像編碼,使用開(kāi)源的OpenClip ViT-H/14模型初始化可訓(xùn)練參數(shù),通過(guò)學(xué)習(xí)從大規(guī)模"圖像-文本"對(duì)中提取特征,使模型具備處理和理解圖像的能力。

    ? Projection模塊為模型帶來(lái)了圖像特征與文本特征空間對(duì)齊的能力。該模塊由一個(gè)包含層歸一化(layer normalizations)的多層感知機(jī)(Multilayer Perceptron,簡(jiǎn)稱MLP)構(gòu)成。這一設(shè)計(jì)使得模型可以更有效地融合和處理視覺(jué)和文本信息,提高了多模態(tài)理解和生成的準(zhǔn)確度。

    ? Yi-34B-Chat和Yi-6B-Chat 大規(guī)模語(yǔ)言模型的引入為 Yi-VL 提供了強(qiáng)大的語(yǔ)言理解和生成能力。該部分模型借助先進(jìn)的自然語(yǔ)言處理技術(shù),能夠幫助 Yi-VL 深入理解復(fù)雜的語(yǔ)言結(jié)構(gòu),并生成連貫、相關(guān)的文本輸出。

    在訓(xùn)練方法上,Yi-VL模型的訓(xùn)練過(guò)程分為三個(gè)精心設(shè)計(jì)的階段,旨在全面提升模型的視覺(jué)和語(yǔ)言處理能力。

    ? 第一階段:零一萬(wàn)物使用1億張的“圖像-文本”配對(duì)數(shù)據(jù)集訓(xùn)練 ViT 和 Projection 模塊。在這一階段,圖像分辨率被設(shè)定為224x224,以增強(qiáng) ViT 在特定架構(gòu)中的知識(shí)獲取能力,同時(shí)實(shí)現(xiàn)與大型語(yǔ)言模型的高效對(duì)齊。

    ? 第二階段:零一萬(wàn)物將 ViT 的圖像分辨率提升至448x448,這一提升讓模型更加擅長(zhǎng)識(shí)別復(fù)雜的視覺(jué)細(xì)節(jié)。此階段使用了約2500萬(wàn)“圖像-文本”對(duì)。

    ? 第三階段:零一萬(wàn)物開(kāi)放整個(gè)模型的參數(shù)進(jìn)行訓(xùn)練,目標(biāo)是提高模型在多模態(tài)聊天互動(dòng)中的表現(xiàn)。訓(xùn)練數(shù)據(jù)涵蓋了多樣化的數(shù)據(jù)源,共約100萬(wàn)“圖像-文本”對(duì),確保了數(shù)據(jù)的廣泛性和平衡性。

    零一萬(wàn)物技術(shù)團(tuán)隊(duì)同時(shí)也驗(yàn)證了可以基于Yi 語(yǔ)言模型強(qiáng)大的語(yǔ)言理解和生成能力,用其他多模態(tài)訓(xùn)練方法比如BLIP、Flamingo、EVA等快速訓(xùn)練出能夠進(jìn)行高效圖像理解和流暢圖文對(duì)話的多模態(tài)圖文模型。Yi系列模型可以作為多模態(tài)模型的基座語(yǔ)言模型,給開(kāi)源社區(qū)提供一個(gè)新的選項(xiàng)。同時(shí),零一萬(wàn)物多模態(tài)團(tuán)隊(duì)正在探索從頭開(kāi)始進(jìn)行多模態(tài)預(yù)訓(xùn)練,更快接近、超過(guò)GPT-4V,達(dá)到世界第一梯隊(duì)水平。

    目前,Yi-VL 模型已在Hugging Face、ModelScope等平臺(tái)上向公眾開(kāi)放,用戶可通過(guò)以下鏈接親身體驗(yàn)這款模型在圖文對(duì)話等多元場(chǎng)景中的優(yōu)異表現(xiàn)。歡迎探索Yi-VL多模態(tài)語(yǔ)言模型的強(qiáng)大功能,體驗(yàn)前沿的AI技術(shù)成果! 

    Yi-VL 模型地址:

    https://huggingface.co/01-ai

    https://www.modelscope.cn/organization/01ai

     雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

    分享:
    相關(guān)文章

    運(yùn)營(yíng)

    當(dāng)月熱門文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 国产免费高清69式视频在线观看| 免费a级毛片高清在钱| 亚洲AV一二三区| 日本猛少妇色XXXXX猛交| 欧美午夜精品久久久久久浪潮| 蜜臀一区二区三区精品免费| 青青AV| 97热| 国产欧美日韩亚洲更新| 国产精品99中文字幕| 婷婷综合在线| 91精品亚洲熟妇少妇任你躁| 亚洲精品成人网站在线播放| 国产一区二区波多野结衣| 91视频在线看| 亚洲天堂一区二区| 中文字幕AV伊人AV无码AV| 亚洲欧美精品综合在线观看| 一区二区三区四区高清自拍| 国产av无码专区亚洲av软件| 日韩有码中文在线观看| 齐河县| 亚洲人成网站色7799| 在线亚洲午夜理论AV大片| 五月婷婷激情视频俺也去淫| 亚洲第一香蕉视频啪啪爽| 91网站免费在线观看| 亚洲经典三级| 欧美人性交| 手机看片日本在线观看视频| 秘?亚洲国产精品成人网站| 中文字幕国产精品资源| 少妇av一区二区三区无码| 香蕉亚洲欧洲在线一区| 宜宾县| 亚洲日韩精品无码专区网址| 老鸭窝在钱视频| 中文精品无码中文字幕无码专区 | 9.1原创大神| 午夜三级成人在线观看| 午夜福利视频合集1000|