• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
    人工智能 正文
    發(fā)私信給奕欣
    發(fā)送

    0

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    本文作者: 奕欣 2017-04-14 11:51
    導(dǎo)語:雷鋒網(wǎng)AI科技評論認(rèn)為,神經(jīng)網(wǎng)絡(luò)的畫作可以與五歲小孩媲美,不僅掌握了關(guān)鍵特征,而且在魔性中透著率真。

    雷鋒網(wǎng)AI科技評論按:雖然簡筆畫與實物的逼真程度相去甚遠,但即便是一個小孩也能輕易理解圖案中的內(nèi)容。原因其實很簡單,因為人類懂得通過判斷圖案中的關(guān)鍵特征,與現(xiàn)實物體進行匹配。那么,如果是用 RNN 教機器學(xué)會畫畫,它是否能抽象出畫中的概念,并用同樣的方式作畫呢?谷歌大腦的 David Ha 近日撰文指出了他與 Douglas Eck 在研究 sketch-rnn 時的一些想法和觀點。

    人們在傳遞思想、進行交流時有一個非常關(guān)鍵的要素,那就是懂得如何用抽象的視覺內(nèi)容進行溝通。我們從小就培養(yǎng)孩子用畫筆描述事物的能力,畫出一個物體甚至表達自己的情緒。這些簡筆畫并不一定像照片一樣逼真,但誠然,它們傳遞出了人們?nèi)绾沃噩F(xiàn)與重構(gòu)身邊事物的方法。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    一些 sketch-rnn 創(chuàng)作的畫

    在 David Ha 與 Douglas Eck 合作的論文《A Neural Representation of Sketch Drawings》中,研究者設(shè)計了一個名為「sketch-rnn」的生成式 RNN,它能夠用簡單的筆觸描繪出日常物體,系統(tǒng)旨在訓(xùn)練機器如何像人類一樣提煉事物的抽象概念。

    研究者在一個手繪 sketches 數(shù)據(jù)集中進行訓(xùn)練,控制提筆落筆的時間及方向,進而創(chuàng)造一個具有可觀前景的應(yīng)用:不僅能幫助藝術(shù)家迸發(fā)藝術(shù)靈感,還能教授學(xué)生繪畫的基本技巧。

    鑒于采用神經(jīng)網(wǎng)絡(luò)之時,生成模型用于訓(xùn)練的圖像過多,圖像以 2D 像素的點陣圖來構(gòu)建。而由于它所具有的高解析度,這些模型很容易會生成一些連續(xù)的圖像結(jié)構(gòu),比如會畫出三只眼睛的貓,或是幾個頭的狗。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?


    采用 128*128 ImageNet 數(shù)據(jù)集訓(xùn)練的 GANs 模型,可能會產(chǎn)生像上圖這樣的詭異情況。

    上圖為 Ian Goodfellow 在 NIPS 2016 Tutorial 展示 GANs 時所采用的圖片

    而在谷歌大腦研究者的工作中,他們受人類繪畫的啟發(fā),采用了更低維的、基于向量的方式。Sketch-rnn 基于 seq2seq(雷鋒網(wǎng)注:前段時間雷鋒網(wǎng)做過覆蓋和報道)的自動編碼框架,結(jié)合變分推斷并采用了超網(wǎng)絡(luò)作為 RNN 的核心。

    seq2seq 的作用在于訓(xùn)練隱向量(latent vector),即一個能夠?qū)⑤斎胄蛄芯幋a為浮點數(shù)向量的網(wǎng)絡(luò),以此在盡可能逼真地模擬輸入序列的情況下,利用解碼器重構(gòu)輸出序列。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    實驗過程

    在模型中,研究者故意往 latent vector 中加入了一些噪聲,而實驗結(jié)果呈現(xiàn),模型在噪聲的干擾下不能非常準(zhǔn)確地重現(xiàn)輸入的內(nèi)容,但依然捕捉到了連同噪聲在內(nèi)的關(guān)鍵信息。解碼器將隱向量進行處理,并產(chǎn)生了一個能構(gòu)建簡筆畫的動態(tài)序列。研究者們輸入了幾個小貓的簡筆畫內(nèi)容,而機器進行后重構(gòu)產(chǎn)生的圖畫又是怎樣的呢?答案就是像下面這樣:

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    模型通過訓(xùn)練人類所畫的小貓簡筆畫而重構(gòu)的圖畫

    值得強調(diào)的是,模型并不是簡單地照貓畫虎,面是學(xué)習(xí)了輸入特征后,重新按照理解再畫圖的。也就是說,模型是學(xué)會了「畫貓的方式」后,根據(jù)自己的理解再作圖的。

    比如,當(dāng)研究者故意畫了一個三只眼睛的貓作為輸入,模型基于對常識的認(rèn)知,生成的依然是兩只眼的貓。而為了拓寬系統(tǒng)認(rèn)識物體的多樣性,研究者加入了迥然不同的內(nèi)容,比如一把牙刷。從圖中可以發(fā)現(xiàn),系統(tǒng)依然將牙刷抽象成了一只貓的樣子(比如尖耳朵和觸須)。這一結(jié)果表明,神經(jīng)網(wǎng)絡(luò)已經(jīng)學(xué)會了從輸入中抽象出貓的概念,也能根據(jù)隱向量重構(gòu)新的簡筆畫。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    如果你還是將信將疑的話,下面這個小豬的例子或許可以說服你。八條腿的小豬和卡車「亂入」了訓(xùn)練數(shù)據(jù)中,但在神經(jīng)網(wǎng)絡(luò)的理解中,小豬只有四條腿,而卡車看起來也具有小豬的樣子(比如有條小尾巴)。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    為了了解為何隱向量是如何抽象出動物的體征概念,研究者首先采用了兩幅不同的小豬畫(一幅只有頭,一幅是全身)獲得不同的隱向量,并在這兩個隱向量計算差值,并在生成簡筆畫后進行可視化。可以看到,隱向量掌握了鼻子與頭的相對位置,并且在逐步的嘗試后形成了身體和腿的概念。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    那么,如果是不同的動物進行融合,如何整合它們的特征?研究者分別輸入了一個貓頭和一個全身小豬的圖像,從左往右看可以發(fā)現(xiàn),小貓開始長出尾巴和身子,最后貓的頭逐步被抽象化,最后變成一只小豬。當(dāng)然,反過來試驗的結(jié)果也是一樣的。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    這個實驗意味著隱向量確實對抽象的概念特征進行了解碼,但我們是否能采用這些特征擴大繪畫的靈活性,比如給小貓的頭加上身子?

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    在學(xué)習(xí)中,系統(tǒng)懂得了一些「公式」

    研究者發(fā)現(xiàn)可將身體的部分進行分類,采用一些公式性的編碼讓系統(tǒng)理解內(nèi)容,比如將不同的隱向量加在「貓頭」上,就能得到想要的結(jié)果(貓頭+身子=全身貓)。這一舉措得以讓研究者更好地探究模型是如何組織它的隱空間(latent space),以表達不同的概念。

    創(chuàng)造性應(yīng)用

    研究者不僅為實驗結(jié)果而振奮,也同時為 sketch-rnn 未來可能的應(yīng)用方向而高興。比如圖案設(shè)計者們能夠用該網(wǎng)絡(luò)生成非常多看起來相似,但實際上又有各自特色、能用于不同場景的設(shè)計圖案。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    從框內(nèi)圖案生成的相似但各具風(fēng)格的小貓

    而就像我們先前看到的一樣,畫小豬的模型如果加入了卡車的圖畫,也能夠畫出有著小豬特征的卡車。研究者將這一結(jié)果拓展開來,認(rèn)為這能夠給設(shè)計者提供抽象設(shè)計的靈感。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    在向小貓模型中輸入了四把姿態(tài)各異的椅子圖案之后,模型學(xué)習(xí)了椅子的特征,進而生成了各種具有椅子特征的小貓,并產(chǎn)生了多種設(shè)計方案。研究者相信,將不同種類的事物交給神經(jīng)網(wǎng)絡(luò),可能產(chǎn)生意想不到的交互和想象。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    此外,研究者們還將 sketch-rnn 的模塊解碼成單獨模型,讓系統(tǒng)嘗試在不完整圖畫的基礎(chǔ)上「腦補」內(nèi)容。下圖是系統(tǒng)產(chǎn)生出的一些靈感閃現(xiàn)的圖案。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    甚至,同一個模型也能充分發(fā)揮機器的想象力。研究者用圓形和正方形的圖案讓系統(tǒng)自由作畫,進而有了火烈鳥、螞蟻、貓頭鷹、直升機等等結(jié)果。設(shè)計者在研究這些機器產(chǎn)生的圖案時在,也能夠設(shè)計出富有創(chuàng)造力的作品。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    Sketch-rnn 能夠讓機器作為人類靈感的來源,也可以有非常多的應(yīng)用。而機器與人類的交互與溝通,在未來的想象空間是無窮的。

    谷歌大腦教機器畫簡筆畫,神經(jīng)網(wǎng)絡(luò)的大作都長啥樣?

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 亚洲精品aⅴ| 秋霞鲁丝片av无码少妇| 久久99精品国产免费观观| 欧美拍拍视频免费大全| 国内精品久久久久影院网站| 亚洲精品夜夜| 色综合久久本道鬼色| 四虎国产精品免费久久| 凹凸在线无码免费视频| 不卡国产精品爽黄69天堂a| 精精国产xxxx视频在线| 久久天天躁狠狠躁夜夜躁| wwww黄色| 综合久久9| 人妻无码一区二区19P| 九九久久亚洲精品美国国内| 人妻狠狠操| 熟女一区二区中文字幕| 91极品美女高潮叫床在线观看 | 最新亚洲人成无码网站欣赏网| 同性男男黄gay片免费| 国产999久久高清免费观看| 亚洲精品中文字幕二区| 日韩 欧美 中文 亚洲 高清 在线| 妺妺窝人体色www看美女| 亚洲卡1卡2卡3精品| 一个色综合色综合色综合| 亚洲国产一区二区三区视频在线 | 国产专区一va亚洲v天堂| 一个色综合国产色综合| 在线视频?日韩一区| 色爱无码AV综合区老司机非洲| 亚洲天堂av日韩精品| 日韩精品一日韩激情内射高潮,97无…| 国产白浆一区二区三区四区| 久久精品国产久精国产爱| 久久91精品牛牛| 国产熟睡乱子伦视频在线播放| 欧美中日韩免费观看网站| 宅男撸| 国精品无码一区二区三区在线|