KDD 2017在即，Keynote內容搶先看｜KDD 2017

本文作者：奕欣

2017-08-13 10:29

專題：KDD 2017

導語：ACM SIGKDD 2017（知識發現與數據挖掘會議）于 8 月 13 日至 17 日在加拿大哈利法克斯正式召開。

ACM SIGKDD 2017（知識發現與數據挖掘會議）于 8 月 13 日至 17 日在加拿大哈利法克斯正式召開。雷鋒網AI科技評論將從一線帶來精彩報道及內容。

會議前一天下午，雷鋒網AI科技評論來到現場簽到時，發現主要的指示標志和前臺接待設施已經布展完畢，也有不少與會人士陸續到現場簽到。

KDD 2017在即，Keynote內容搶先看｜KDD 2017

大會主席 Stan Matwin 、Yu Shipeng 及副主席 Faisal Farooq 分享了本次大會的一些感想：

「我們希望 KDD 2017 能夠讓您了解新的技術趨勢，從論文（包括 poster 及口頭展示）中得到啟示并在專業領域有所助益，發現新的工具、研究流程及實踐工作；確定新的工作機會或是招聘到心儀的人選。」

「數據科學」、「數據挖掘」和「大數據」，在過去幾年中已經從研究實驗室走出，并出現于你我的日常生活中，甚至也出現在媒體領域和各級政府和企業的決策中。這些技術的影響涉及到每一個人。更重要的是，目前數據科學的快速發展得到了極大的推動——包括工業界人士及學術界人士。在過去，這些人一直是 KDD 會議的一道風景線，他們是理論與實踐的橋梁，是雙界交流的促進者和催化劑。在會議上，包括研究、應用數據科學及應用演講嘉賓等三個平行議程將會同期展開，將工業界與學術界人士緊密聯結在一起。

而這也正是 KDD 2017 的議程所具備的。雷鋒網了解議程后發現，延續往年的慣例，KDD 2017 將非常大的比重留給了 tutorial 和 workshop 環節（第一天和第二天）。22 個各具特色的 tutorial 將從深度學習、數據挖掘、IOT 實戰應用等不同方面提供前沿觀點，此外還將穿插 8 個半天的 hands－on tutorial；而 22 個 workshop 則將在第二天進行；正會則要等到第三天才開始。

Keynote內容及講者介紹

每年會議的Keynote自然是最重要的一個部分，KDD邀請了三個 Keynote 嘉賓，分別從數據挖掘的不同角度分享了工業界和學術界的前沿和未來：

Cynthia Dwork，微軟研究院杰出科學家／哈佛大學：《何謂公平？》

KDD 2017在即，Keynote內容搶先看｜KDD 2017

數據，算法和系統中都嵌入了偏見，它反映了設計師的明顯和隱藏的選擇，歷史偏見和社會的優先等級。它們在字面上就不可避免地形成了價值觀。算法的“不公平”，例如從廣告到再犯預測的不同任務，已經在大眾媒體中引起了相當的關注。這次演講將討論針對初期的數學嚴謹的分類和評分的公平性研究。

微軟研究的杰出科學家Cynthia Dwork以嚴謹的數學基礎為隱私保護數據分析而聞名。這項工作的基石是差異隱私，強大的隱私保證通常可以獲得高度準確的數據分析。 Dwork還在加密和分布式計算方面做出了突出貢獻。她是美國國家科學院和美國國家工程學院的成員，也是美國藝術與科學學院院士，美國哲學社會學者。從2017年1月開始，Dwork將是哈佛保爾森工程學院計算機科學系的Gordon McKay教授，拉德克利夫高級研究所的Radcliffe Alumnae教授，以及哈佛法學院的教授。

Bin Yu，UC 伯克利大學教授：《數據科學的三原則：可預測性、穩定性與計算性》

KDD 2017在即，Keynote內容搶先看｜KDD 2017

在這個演講中，我將討論數據科學的三個原則在數據驅動決策中的重要性和聯系。預測的最終重要性在于，未來是所有人類在商業，教育，研究和政府方面任何活動的獨特而且可能是唯一的目的。機器學習以預測為中心，以計算為核心，已經實現了廣泛的數據驅動方面的成功。預測是檢查現實的有用途徑，良好的預測暗示著過去和未來之間的穩定發展。穩定性（相對于數據和模型擾動）也是數據驅動結果的可解釋性和可重復性的最低要求。它與不確定性評估密切相關。顯然，如果在沒有可行的計算算法的條件下，是不能采用預測和穩定性的原理，因此可見可計算性的重要性。這三個原則將由分析聯系來表明，同時兩個正在進行的項目中證明，“數據智慧”也是不可或缺的。具體來說，第一個項目采用深度學習網絡（CNN）來了解難辨視覺皮層V4中神經元的模式選擇性;第二個項目通過采用和比較不同潛變量模型和基于拉索的模型來預測政治電視廣告的黨派和語氣。

Bin Yu是加州大學伯克利分校統計學和電氣工程與計算機科學系的教授，也是伯克利統計局前任主席。她是北大統計與信息技術大學微軟聯合實驗室的創始人之一。她與基因組學，神經科學和醫學科學家進行跨學科研究。為了解決這些領域的數據問題，她開發了統計學和機器學習方法/算法和理論，并結合領域知識和定量批判性思維進行整合。Bin Yu是美國國家科學院院士，美國藝術與科學學院成員。她是2006年的古根海姆 Fellow，2011年ICIAM的邀請演講人，2012年伯努利社會的圖基紀念講師，以及2016年立陶宛數學統計研究所講師。她在2013 - 2014年擔任IMS總裁，并且是IMS、ASA、AAAS、IEEE Fellow。

Renee J Miller，多倫多大學教授：《數據集成的未來》

數據集成時的形成的數據爆炸的價值。在這次演講中，我提出過去二十年來數據整合方面的一些重要創新。這其中包括數據交換，其為推理轉換數據的正確性以及在集成中使用聲明映射提供了基礎。我還討論了數據挖掘如何用于促進數據集成，并呈現數據科學中出現的一些重要的新數據集成方面的挑戰。

RenéeJ. Miller是多倫多大學計算機科學系教授，加拿大貝爾信息系統主席。她是加拿大皇家學會、加拿大國家學院院士，ACM Fellow。她獲得了美國科學家和工程師的總統早期職業獎（PECASE），這是美國政府頒發的優秀科學家和工程師從事職業生涯的最高榮譽。她獲得NSF職業榮譽獎，總理研究優秀獎和IBM教授獎。她的研究主要在數據集成和數據管理領域。她和共同作者因為2003年頗有影響力的建立了數據交換的基礎的文章而獲得了ICDT測試時間獎。她曾擔任VLDB基金會董事會成員，并擔任捐贈基金會主席。她的研究由NSERC，NSF，IBM，SAP和Bell Canada等資助。她從威斯康星大學麥迪遜分校獲得計算機科學博士學位，并獲得麻省理工學院數學和認知科學學士學位。

此外，有 11 位專家及教授將從應用數據科學的角度闡述他們在數據科學領域的研究心得，名單如下：

KDD 2017在即，Keynote內容搶先看｜KDD 2017