• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能學術 正文
    發私信給陳彩嫻
    發送

    0

    格式機器可讀、Kaggle 上免費使用,arXiv 發布集成170萬篇論文數據庫

    本文作者: 陳彩嫻 2020-09-01 16:51
    導語:170萬篇arXiv論文集成為一個格式機器可讀的數據庫,并將該數據庫托管到了Kaggle上供用戶免費使用。數據庫包括論文標題、作者、類別、摘要、全文pdf

    格式機器可讀、Kaggle 上免費使用,arXiv 發布集成170萬篇論文數據庫

    茫茫滄海尋一粟——想必這是許多學者在使用arXiv網站搜索論文時的痛苦心聲。
    不過現在arXiv給大家帶來了一個好消息:他們將 170萬篇arXiv論文集成為一個格式機器可讀的數據庫,并將該數據庫托管到了Kaggle上供用戶免費使用。數據庫包括論文標題、作者、類別、摘要、全文pdf等論文相關信息。

           格式機器可讀、Kaggle 上免費使用,arXiv 發布集成170萬篇論文數據庫

    arXiv 論文數據庫Kaggle地址:https://www.kaggle.com/Cornell-University/arxiv

    1


    arXiv:從一個論文存儲庫轉變為一個知識共享平臺
    近30年來,arXiv網站為公眾和研究人員提供了獲取學術論文的可靠途徑。論文類型多樣,從物理學到計算機科學、再到介于兩者之間的各類學術內容,涵蓋數學、統計學、電氣工程、定量生物學和經濟學等熱門學科。無論是鉆研單一領域的學生、尋求跨學科研究的教授還是服務公共事業的社會研究者,都能在arXiv上搜集到有利的信息。
    然而,arXiv網站所收錄的論文數量十分龐大,為用戶的閱讀帶來明顯的壓力。另一方面,arXiv 本身也由于過分依賴 LaTex 而出現一系列缺陷,包括:1)使用 LaTeX 進行排版的方式局限于單個社區,其界面、語言、使用方式對不會編程或者只用過 WYSIWYG 編輯器的人來說比較陌生;2)網站上的論文一直以pdf格式交換、閱讀,但大多數pdf文檔不支持在線編輯,以致許多論文無論在網頁上閱讀、討論與共享;3)論文所承載的信息可發現率低;4)arXiv的論文與數據獨立存在,論文數據無法共享。雷鋒網
    其中第三點缺陷所造成的不利影響,正如arXiv 科技總監Steinn Sigurdsson所指出的,由于數據集的龐大,讀者很可能會忽略一些重要的發現、關聯知識、創新工具或視角。這些被忽略的信息也許能幫助研究人員產生一些關于原有研究主題與跨學科領域的新的見解,有更多新發現與創造力。雷鋒網
    而 Kaggle 作為數據科學家和機器學習工程師搜集數據集、閱讀公開筆記和進行競賽的平臺,可以讓研究人員利用該平臺上豐富的數據探索工具,輕松地與他人共享相關論文文本和輸出。雷鋒網
    arXiv的執行董事 Presani 指出,將arXiv 論文數據庫托管到Kaggle上供用戶自由訪問,將放大這些論文本身的價值,因為這不僅僅給讀者提供了一個通過閱讀論文學習的平臺,更是讓論文本身承載的數據和信息以機器可讀的方式在研究者之間共享、傳播和交流。
    他進一步表示,arXiv 要想從一個論文存儲庫轉變為一個知識共享平臺,就要求他們不斷創新展示知識與解釋知識的方式。而Kaggle的用戶可以幫助突破創新的局限性,為科研界相互協作提出一種新途徑。

    2


    arXiv 發布 Kaggle 論文數據庫的初衷
    arXiv 方面表示,此舉的初衷是希望能推動新用例的產生,幫助研究人員探索更多結合面向應用的多模態特征的機器學習技術,包括趨勢分析法、論文推薦引擎、類別預測、同被引網絡、知識圖譜構建和語義搜索接口等。
    Google 的COVID-19 Research Explorer就是這樣一個基于特定語料庫進行語義搜索的用例。這個工具可幫助研究人員精讀擁有190,000+篇關于COVID-19的研究論文的資料庫——COVID-19數據集。基于此類數據集的接口使用了先進的自然語言理解(NLU)技術來了解用戶查詢的目的。這個數據集能為復雜的科學問題提供更多相關數據和證據,大大提高了研究效率。
    而他們發布這個機器可讀的arXiv數據集,就是希望其能推動該領域的研究者開發出能夠處理此類新的語料庫的相似的自然語言理解工具。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    格式機器可讀、Kaggle 上免費使用,arXiv 發布集成170萬篇論文數據庫

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 国内精品伊人久久久久777| AV天堂中文字幕| 一区二区三区蜜桃91| 成人精品区| av影音先锋av| 熟女一区二区三区| 97人人模人人爽人人喊网| 一区二区三区在线 | 欧洲 | 日本高清视频色wwwwww色| 人妻无码熟妇乱又伦精品视频| 亚洲午夜精品一区二区蜜桃| 国产成人a在线观看视频免费| 欧美精品自拍| 苍井空一区二区波多野结衣AV| 国产综合久久99久久| 一本加勒比HEZYO黑人| 91福利姬| 操操操综合网| 日韩中文字幕av有码| 色狠狠色噜噜av天堂一区| 日韩激情无码av一区二区| 亚洲熟女视讯2| 少妇av一区二区三区无码| 亚洲二级片| 狼友麻豆| 精品国产一区二区三区av性色| jizzjizzjizzjizz| 日本国产精品一区久久久| 国产亚洲av嫩草久久| 中文字幕av日韩有码| 亚洲一本99道| 国产高清在线精品一区不卡| 国产v综合v亚洲欧美大天堂| 日韩av一二区| 人妻?综合?无码?另类| 亚洲AV综合一区二区在线观看| 国产午夜福利小视频在线| 日韩一区二区三区在线观院| 国产产在线精品亚洲aavv| 亚洲精品久久久无码aⅴ片恋情| 亚洲精品久久无码av片软件|