1
| 本文作者: 亞萌 | 2016-08-19 18:55 |
整個(gè)人類(lèi)似乎發(fā)展地很好:互聯(lián)網(wǎng)經(jīng)濟(jì)、奧林匹克運(yùn)動(dòng)會(huì)、火箭發(fā)射、太空漫游......
然而這樣繁榮的圖景并不是人類(lèi)的全部,世界上還依然充滿(mǎn)了貧困和戰(zhàn)亂。就像這個(gè)在敘利亞戰(zhàn)亂剛剛遭遇空襲的5歲小男孩Omran Daqneesh,出人意料地安靜、麻木和茫然,不哭不鬧地擦掉自己臉上的血,而誰(shuí)又知道他經(jīng)歷了怎樣的殘酷!

人們樂(lè)于分享幸福與富裕,而戰(zhàn)亂和貧困地區(qū)人的日常和生活水平,我們很難得知。盡管有那么多國(guó)際機(jī)構(gòu)聲稱(chēng)要去要去幫助,去改變,然而由于無(wú)法了解基本信息,很難對(duì)癥下藥。
長(zhǎng)久以來(lái),研究人員會(huì)有一個(gè)評(píng)估某一地區(qū)的發(fā)展程度的指標(biāo):夜晚燈光的亮度和密度。但是這個(gè)方法有個(gè)局限,那就是它只能看到亮著的地區(qū),而對(duì)于那些夜晚的黑暗之地,我們只能判斷它們大致是貧困的,而究竟貧困到什么程度,就不得而知。
“非洲最窮的地方,是我們最關(guān)心的。但在晚上,那里幾乎全部都是黑暗之地。”斯坦福大學(xué)的電子工程與計(jì)算機(jī)科學(xué)博士Neal Jean說(shuō)道。

兩個(gè)村莊,一個(gè)靠近湖邊,一個(gè)靠近森林,在燈光分布圖里都可能是全暗的,但是它們臨近不同的自然資源,富裕程度不一樣。
而且,一般來(lái)說(shuō),了解一個(gè)地區(qū)的經(jīng)濟(jì)水平,需要進(jìn)行調(diào)研,而這一方法在戰(zhàn)亂和沖突地區(qū)是無(wú)法展開(kāi)的,而恰巧這些地區(qū)就是世上最窮之地。
國(guó)際組織和當(dāng)?shù)卣疀Q策者最在乎這些數(shù)據(jù)。比如,一個(gè)公益性國(guó)際組織要對(duì)不發(fā)達(dá)地區(qū)進(jìn)行資金援助,資金是有限的,他們就需要確切知道哪些地區(qū)的需求最懇切,所謂“把錢(qián)花在刀刃上”。
對(duì)于政策制定者而言,了解本國(guó)個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r是一項(xiàng)必須進(jìn)行的工作,因?yàn)檫@樣才能制定出針對(duì)性的發(fā)展方案。但事實(shí)是什么呢?世界銀行數(shù)據(jù)顯示,在2000-20010年的十年時(shí)間里,59個(gè)非洲國(guó)家中,有39個(gè)國(guó)家只進(jìn)行了不到2次的貧困水平調(diào)查。
斯坦福大學(xué)的這撥以Jean為領(lǐng)導(dǎo)的研究人員,他們采取的是現(xiàn)在很流行的卷積神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,所用的數(shù)據(jù)分白天的和晚上的,白天的數(shù)據(jù)來(lái)自衛(wèi)星拍攝的地球高清圖像,夜晚的數(shù)據(jù)就是燈光分布圖。
整個(gè)的算法分兩步。第一步叫做“遷移學(xué)習(xí)”(Transfer Learning),研究人員把五個(gè)國(guó)家的白天和夜晚的數(shù)據(jù)“喂給"系統(tǒng),包括尼日利亞、坦桑尼亞、烏干達(dá)、馬拉維、盧旺達(dá)這五個(gè)非洲國(guó)家。計(jì)算機(jī)需要學(xué)習(xí)衛(wèi)星照片上的物體與夜晚燈光亮度的關(guān)系。
比如系統(tǒng)可以學(xué)習(xí)到:一片湖區(qū)和一片森林,他們?cè)谕砩蠎?yīng)當(dāng)是黑暗的,這與該地區(qū)是否貧困并無(wú)關(guān)聯(lián);但是,一個(gè)房屋聚集的村莊,理應(yīng)夜晚亮度比較高,如果這片區(qū)域是黑暗的,那么極有可能就是貧困地區(qū)。
通過(guò)這樣的學(xué)習(xí),系統(tǒng)將貧困地區(qū)的數(shù)據(jù)都提取出來(lái)。接下來(lái),就進(jìn)行第二步,叫做“嶺回歸模型”(Ridge Regression Model)。研究人員將經(jīng)過(guò)真實(shí)調(diào)查的數(shù)據(jù)指標(biāo)再次“喂給”系統(tǒng),比如世界銀行生活水平測(cè)量研究等。
這次,系統(tǒng)會(huì)把未經(jīng)過(guò)調(diào)查統(tǒng)計(jì)的地區(qū)的大致貧困程度預(yù)測(cè)出來(lái)。比如,系統(tǒng)已經(jīng)知道一個(gè)10戶(hù)房屋的村莊A的夜晚大致燈光亮度,而調(diào)查報(bào)告里有一個(gè)與A村地理位置相近,而且燈光亮度相似的10戶(hù)村莊B的信息,報(bào)告顯示B村的家庭收入水平是1.9美元/天。那么系統(tǒng)通過(guò)交叉對(duì)比,就可以判斷出A村與B村有著相似的經(jīng)濟(jì)水平。
這個(gè)分兩步走的算法系統(tǒng)比單一的依靠燈光預(yù)測(cè)的方法更為準(zhǔn)確,在具體的實(shí)驗(yàn)里,其準(zhǔn)確率達(dá)到81%-99%。
另外,由于該系統(tǒng)使用的數(shù)據(jù)都是來(lái)自公共機(jī)構(gòu),比如衛(wèi)星圖像和燈光分布圖就是來(lái)自NASA,而調(diào)查報(bào)告來(lái)自于美國(guó)政府和國(guó)際組織,所以整個(gè)系統(tǒng)的花費(fèi)并不昂貴,可供有需要的公眾和機(jī)構(gòu)免費(fèi)使用。
Jean表示,系統(tǒng)目前數(shù)據(jù)只是來(lái)自非洲的五個(gè)國(guó)家,下一步的工作就是用其他國(guó)家的數(shù)據(jù)來(lái)訓(xùn)練,以繪制出全球貧困地圖,幫助政府和機(jī)構(gòu)更好地減輕世界貧困。
Via Spectrum
延伸閱讀:
你所使用的手機(jī),可能沾滿(mǎn)了來(lái)自非洲勞工的鮮血
計(jì)算機(jī)系統(tǒng)里的偏見(jiàn)和歧視:除了殺死,還有其他方法
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。