第三屆世界互聯(lián)網(wǎng)大會大數(shù)據(jù)論壇內(nèi)容記錄
主持人:尊敬的各位專家、各位來賓、各位朋友,女士們、先生們,大家下午好!歡迎大家來到美麗的烏鎮(zhèn),參加第三屆世界互聯(lián)網(wǎng)大會大數(shù)據(jù)論壇。我是中國科學院辦公廳副主任高春東,很榮幸由我擔任本次論壇的主持人。
2016-11-17 14:49
主持人:大數(shù)據(jù)論壇是第三屆世界互聯(lián)網(wǎng)大會“互聯(lián)網(wǎng)創(chuàng)新”專題的重要組成部分,也是首次由中國科學院主辦的世界互聯(lián)網(wǎng)大會專題活動。本次論壇由中國國家互聯(lián)網(wǎng)信息辦公室和浙江省人民政府指導支持,中國科學院主辦,中科學院信息工程研究所承辦,數(shù)據(jù)中心聯(lián)盟協(xié)辦。
2016-11-17 14:50
主持人:本次論壇邀請了國內(nèi)外著名專家、學者和企業(yè)家,圍繞“大數(shù)據(jù)的發(fā)展與安全”這一主題,從大數(shù)據(jù)技術發(fā)展展望、大數(shù)據(jù)安全風險及防控、大數(shù)據(jù)產(chǎn)業(yè)發(fā)展與行業(yè)應用三個角度,進行廣泛和深入的研討。相信本次論壇對大數(shù)據(jù)技術和產(chǎn)業(yè)發(fā)展將有一定的促進作用。
2016-11-17 14:51
主持人:出席本次論壇的嘉賓有:圖靈獎得主、卡內(nèi)基梅隆大學雷伊·雷蒂教授;澳大利亞科學院院士、工程院院士、墨爾本大學饒·寇他科里教授;中國工程院院士、中國科學院計算技術研究所倪光南研究員;中國科學院院士、中國科學技術大學常務副校長潘建偉教授;中國工程院院士、中國銀聯(lián)股份有限公司執(zhí)行副總裁柴洪峰研究員;中國通用技術研究院學術委員會主任黃殿中先生;浙江省委常委王新海先生;中國科學院秘書長鄧麥村研究員;另外,還有來自國內(nèi)外學術界和企業(yè)界的嘉賓朋友們。首先,請中國科學院秘書長鄧麥村先生致辭。大家歡迎!
2016-11-17 14:52
鄧麥村:尊敬的各位專家、各位來賓、各位朋友,女士們、先生們,大家下午好!歡迎大家來到歷史悠久、粉墻黛瓦的浙江烏鎮(zhèn),參加第三屆世界互聯(lián)網(wǎng)大會大數(shù)據(jù)論壇。在這里,請允許我代表本次論壇的主辦單位中國科學院,向遠道而來的各位嘉賓、各位朋友表示熱烈的歡迎!向論壇的指導支持單位中國國家互聯(lián)網(wǎng)信息辦公室以及浙江省人民政府表示衷心的感謝!
2016-11-17 14:53
鄧麥村:當前,以信息技術為代表的新一輪科技革命方興未艾,信息技術與經(jīng)濟社會發(fā)展深度交匯融合,數(shù)據(jù)迅猛增長成為重要的基礎性戰(zhàn)略資源。大數(shù)據(jù)正日益對全球生產(chǎn)、流通、分配、消費活動以及經(jīng)濟運行機制、社會生活方式和國家治理能力產(chǎn)生重要而深遠的影響。如何突破大數(shù)據(jù)關鍵技術,如何運用大數(shù)據(jù)推動經(jīng)濟發(fā)展、完善社會治理,如何在推動大數(shù)據(jù)發(fā)展的同時確保信息安全,已成為世界各國和各行各業(yè)普遍關注的熱點問題。本次論壇以“大數(shù)據(jù)的發(fā)展與安全”為主題開展研討,就是希望能對相關領域的技術和產(chǎn)業(yè)發(fā)展有所促進。
2016-11-17 14:54
鄧麥村:中國科學院作為中國自然科學最高學術機構、科學技術最高咨詢機構和自然科學與高技術綜合研究發(fā)展中心,按照國家經(jīng)濟社會發(fā)展和科技創(chuàng)新總體部署要求,秉承“三個面向、四個率先”的辦院方針,一直重視大數(shù)據(jù)基礎研究和技術攻關,以及科學大數(shù)據(jù)的開發(fā)利用。鄧麥村:在大數(shù)據(jù)前沿技術研發(fā)與應用方面,為應對終端接入規(guī)模、海量數(shù)據(jù)處理性能、能耗和安全等四大挑戰(zhàn),中國科學院于2012年啟動了“面向感知中國的新一代信息技術研究”戰(zhàn)略性先導科技專項,組織二十多個研究所的科研力量協(xié)同攻關,現(xiàn)已形成以人工智能芯片“寒武紀”、代數(shù)處理器芯片、深度可編程網(wǎng)絡、三元融合安全技術、海云大數(shù)據(jù)系統(tǒng)等為代表的一系列原創(chuàng)性成果,在智慧城市、社會治理等領域得到了成功應用。
2016-11-17 14:56
鄧麥村:在可信大數(shù)據(jù)技術、大數(shù)據(jù)安全通信、大數(shù)據(jù)訪問控制、身份認證授權等大數(shù)據(jù)關鍵技術上,以及量子通信技術上已取得重要突破,成為國家大數(shù)據(jù)安全領域的中堅力量。同時,在數(shù)字地球、全球變化、高能物理、基因組計劃、深空探測等領域,利用大數(shù)據(jù)技術驅動科技創(chuàng)新,也取得了一些重要成果。
2016-11-17 14:56
鄧麥村:在科學大數(shù)據(jù)積累與應用方面,上世紀70年代,中國科學院就開始建設專業(yè)數(shù)據(jù)庫。經(jīng)過幾十年的持續(xù)部署和推動,中國科學院現(xiàn)已建成服務全國科技界的“中國科學院數(shù)據(jù)云”,整合了各學科領域的1340個數(shù)據(jù)庫資源,共享數(shù)據(jù)達655TB,年均在線訪問超過千萬人次。此外,中國科學院的網(wǎng)絡安全工作也得到了行業(yè)主管部門和業(yè)界同仁的肯定。
2016-11-17 14:57
鄧麥村:按照《中國科學院率先行動計劃》和《“十三五”發(fā)展規(guī)劃綱要》,未來一段時間,中國科學院將在大數(shù)據(jù)領域加強相關基礎科學問題研究和軟硬件關鍵技術開發(fā),繼續(xù)引領國家科學大數(shù)據(jù)建設,為國家大數(shù)據(jù)發(fā)展和大數(shù)據(jù)安全保障體系建設作出應有貢獻。
2016-11-17 14:58
鄧麥村:借此機會,我愿向大家提三點倡議:第一,推進大數(shù)據(jù)基礎研究和技術攻關。大數(shù)據(jù)的快速發(fā)展提出了許多新的科學問題,仍有很多關鍵技術亟待突破。我們應深入開展數(shù)據(jù)科學研究,在大數(shù)據(jù)理論、方法及關鍵應用技術等方面進行探索,不斷提升數(shù)據(jù)分析處理能力、知識發(fā)現(xiàn)能力和輔助決策能力,形成安全可靠的大數(shù)據(jù)體系。
2016-11-17 14:59
鄧麥村:第二,加強大數(shù)據(jù)專業(yè)人才培養(yǎng)。發(fā)展大數(shù)據(jù),人才是關鍵。大數(shù)據(jù)的快速發(fā)展對專業(yè)人才提出了非常急迫的需求。我們應創(chuàng)新人才培養(yǎng)模式,建立健全多層次、多類型的大數(shù)據(jù)人才培養(yǎng)體系,重點培養(yǎng)專業(yè)化數(shù)據(jù)工程師等大數(shù)據(jù)專業(yè)人才,大力培養(yǎng)具有統(tǒng)計分析、計算機技術、經(jīng)濟管理等多學科知識的跨接復合型人才,積極培育大數(shù)據(jù)技術和應用創(chuàng)新型人才,注重培養(yǎng)網(wǎng)絡信息安全專業(yè)人才。
2016-11-17 14:59
鄧麥村:同時,還應依托社會化教育資源,廣泛開展大數(shù)據(jù)知識普及和教育培訓,不斷提高社會整體的認知和應用水平。
2016-11-17 15:01
鄧麥村:第三,深化大數(shù)據(jù)國際合作交流。大數(shù)據(jù)的快速發(fā)展給世界各國都帶來了共同的機遇和挑戰(zhàn)。我們應堅持平等合作、互利共贏的原則,建立完善國際合作機制,積極推進大數(shù)據(jù)技術的交流與合作,充分利用國際創(chuàng)新資源,共同促進大數(shù)據(jù)相關技術和產(chǎn)業(yè)發(fā)展。
2016-11-17 15:01
鄧麥村:中國科學院愿意同國內(nèi)外同行和社會各界朋友一起,在新一代信息技術和服務業(yè)態(tài)蓬勃發(fā)展的浪潮下,共同為大數(shù)據(jù)發(fā)展與安全貢獻力量!最后,再一次對國內(nèi)外同行和社會各界對中國科學院科技創(chuàng)新工作的支持表示衷心的感謝!
2016-11-17 15:02
主持人:感謝鄧麥村秘書長的致辭,接下來請圖靈獎得主、卡耐基梅壟大學機器人研究院創(chuàng)始院長雷伊·雷蒂教授,以“人工智能和大數(shù)據(jù)服務社會”發(fā)表主旨演講,大家歡迎。
2016-11-17 15:20
雷伊·雷蒂:
雷伊·雷蒂:大家下午好!我今天下午發(fā)言的題目是“社會服務中網(wǎng)絡驅動的人工智能和大數(shù)據(jù)應用”,這一屆的世界互聯(lián)網(wǎng)大會的主題考慮進去之后,我其實把我的題目已經(jīng)變長了,原來沒有那么長,就變成了“社會服務中的網(wǎng)絡驅動的人工智能和大數(shù)據(jù)應用”。
2016-11-17 15:21
雷伊·雷蒂:也就是說未來社會的發(fā)展,會有更多的大數(shù)據(jù)、AI方面的應用。但是如果我們沒有高速的網(wǎng)絡,所有的一切都是白搭。而高速的網(wǎng)絡,如果我們沒有計算機能力的指數(shù)級的增長,又是不可能實現(xiàn)的。每十年我們就會有100倍的增長,在過去的50年當中,我們應該是100的五次方,以這樣的數(shù)級每年在增長,所以你想100的五次方,是怎樣一種指數(shù)級的增長?
2016-11-17 15:21
雷伊·雷蒂:不是說我兩倍三倍還是百分之多少,而是指數(shù)級的增長。所以我今天想跟大家說,如果沒有這樣的增長,我們就不可能實現(xiàn)所有互聯(lián)網(wǎng)的一切。
2016-11-17 15:21
雷伊·雷蒂:我要跟大家分享的不光是說企業(yè)的精英、社會的精英,而是世界上的每一個人給我們帶來互聯(lián)網(wǎng)領域的機會。我會給大家講一些大概的主題,首先很大的一個主題就是互聯(lián)網(wǎng),互聯(lián)網(wǎng)已經(jīng)有50歲了。阿帕網(wǎng)絡誕生于1968年左右,1977年的虛擬網(wǎng)絡,互聯(lián)網(wǎng)誕生于1977年左右,互聯(lián)網(wǎng)50年來飛速的發(fā)展,主要歸功于什么呢?
2016-11-17 15:22
雷伊·雷蒂:就是它的指數(shù)級的增長數(shù)據(jù)處理效率內(nèi)存帶寬都指數(shù)級的增長,高速的互聯(lián)網(wǎng)推動了人工智能、機器學習、大數(shù)據(jù)分析的發(fā)展,催生了各種各樣的服務。而所有的技術和大數(shù)據(jù)的發(fā)展,讓我們可能去做金字塔底端的低層人群都能使用的全社會性的數(shù)字應用。
2016-11-17 15:22
雷伊·雷蒂:接下來跟大家講一下30年來計算效率、計算能力增長了數(shù)以百萬倍,就是指數(shù)級的增長。在過去的30年當中,計算效率增長了數(shù)以百萬倍,這些增長源于每一個個人電腦,每一個工作站,微型計算機。我們期盼未來30年有新的重大的突破,讓每一個人都擁有帶寬、內(nèi)存、計算效率的變化,而且花費比一杯咖啡還低的費用。
2016-11-17 15:23
雷伊·雷蒂:這張圖給大家看一下計算機的增長,從1900尤其到四十年代之后,到現(xiàn)在的2011年,其實是我們?nèi)祟愵I域計算能力增長的一個急劇上升的階段,我們看百萬級的增長是什么意思呢?計算效率也以百萬級別的增長,另外要給大家看一下硬盤的容量的變化,比如說我1972年我可能要花一百美元才能買到40G的儲存容量,現(xiàn)在你買一個40G的容量,是不是100美金都不需要?
2016-11-17 15:23
雷伊·雷蒂:就是百萬美金到一百美金這樣的變化,每15個月硬盤的容量就會翻倍,光纖革命甚至每天都在發(fā)生。也就是說每一個人,比如說每一個手機以后有1T的容量很快我覺得是沒有問題的。我們每光纖以后可以達到怎樣的數(shù)量呢?
2016-11-17 15:24
雷伊·雷蒂:100、200、250的帶寬已經(jīng)非常的讓人驚訝了,而且在接下來的五年、十年、二十年當中,增加的速度會更加的快,更加的驚人。大家要做好準備,所有的公司所有的企業(yè)都要準備好這一切,我給你100G的速度,你做什么?
2016-11-17 15:32
雷伊·雷蒂:給大家看看我們有了大數(shù)據(jù),有了人工智能深度學習的突破,可以做什么?它可以催生金字塔底層人群使用的新的應用程序,這個非常非常重要。我們看一下金字塔,在過去的30年當中計算的效率增長那么快,讓底層的人群有可能使用新的應用程序。世界上大家都沒有意識到有這么多的人,其實是屬于底層。有30億的日收入低于2.5美金金字塔底端的人群,他們幾乎是半文盲,不能閱讀寫作,也不能讀寫任何的語言,不會使用鍵盤,不會使用觸屏計算機,如果是半文盲,溝通的唯一途徑如果是講話的話,你沒有鍵盤,沒有觸屏,什么東西都沒有。
2016-11-17 15:32
雷伊·雷蒂:你想象一下,溝通通過什么途徑呢?你跟同事怎么溝通?當然是說話、講話。我們未來跟計算機也要進行這樣子的互動,非常直接的你就像對待一個人一樣,對待你的電腦,你不需要去觸屏,不需要打鍵盤跟它互動,你的電腦就像一個人一樣,就是一個人,你跟它進行類似于對人一樣的互動,這是一個電子人。你想,電子人它不是人,如果你要能夠讀懂一個電腦的話,你現(xiàn)在需要一個很受教育的人,而未來如果它是一個電子人一樣,就像一個真正的人,有一樣功能的話,世界上所有的人民都可以使用計算機了,這就是人類巨大的一個進步,可能在中國網(wǎng)絡的普及率還是非常高的,但是大家要記住,世界上還有很多很多人,是沒有使用電腦,是買不起日常生活用品的。他們還在貧困線下掙扎,你想每天生活的水平低于1美金的話,這樣的人怎么可能去買電腦呢?
2016-11-17 15:32
雷伊·雷蒂:30億人是什么樣一個概念?他們每一個人只要花一美金的話,那就是30億的容量。所以我今天的話題就是語音處理?;ヂ?lián)網(wǎng)通過人工智能和大數(shù)據(jù)應用能夠幫助30億金字塔底端的人民。云處理到底可以做什么呢?我們連接之后,有了互聯(lián)網(wǎng)可以做什么?可以娛樂,可以網(wǎng)上購物,網(wǎng)上購物是文盲的人很好的一個計算機應用,他們用的東西,如果他們想要,但價格很高,那就買不到。但是如果網(wǎng)絡購物對他們來說變成現(xiàn)實的話,那你就有了一個萬億的新市場。但是他們沒法讀寫。你要記住,他們怎么上亞馬遜、上淘寶去買東西或看所有的信息呢?這里就是我們可以進行革命的地方了。我不用去亞馬遜,比如說我有錢,我看不懂字,沒關系,我讓我的助理去買一樣東西,去任何地方買一個東西,但是如果我們的計算機可以實現(xiàn)這一點的話,我不需要我的助理一個人去做這樣的事情,我可以讓我的計算機作為一個電子人去幫我變現(xiàn)這樣的事情,甚至可以在全球的范圍內(nèi)進行購物。
2016-11-17 15:32
雷伊·雷蒂:如果技術可以在他們平民身上進行應用的話,甚至說英語這件事情,比如我在這兒說英語,機器可以幫你翻譯成中文,而且用非常簡潔的英語告訴你是什么意思,在2012年的時候已經(jīng)實現(xiàn)了英漢互譯技術,但是實時進行筆譯,已經(jīng)實現(xiàn)了。但是還有沒實現(xiàn)的是什么呢?就是我們有很多很多的孤語,非常小的語種,可能一百萬人講這個語言的人口都不到,所以說是非常小眾的人。這個事情現(xiàn)在還沒有做,這個市場現(xiàn)在還是空白的,如果我們可以實現(xiàn)語音到語音的翻譯,比如說從定語的語言翻譯成本地的語言,這會給你提供很大的市場。
2016-11-17 15:33
雷伊·雷蒂:沒有一個公司能為研發(fā)小語種應用投入大量的資金,我們需要做什么呢?我們不可能比如說很小很小的語言,比如說廣東話、上海話,本地的方言,你要去識別,是非常重要的,現(xiàn)在還沒有人做。這一點完全是可以實現(xiàn)的,如果我們有了這樣一個技術,我們要做語言的研發(fā)和翻譯,那么可以一起來做,我們最重要實現(xiàn)的是不需要觸摸鍵盤,不需要電腦觸屏就可以實現(xiàn),我們就要考慮到政府的合作,很多底層人民的需求。下一個案例跟大家講的信息是叫認知增強器和安全護衛(wèi)天使,因為因特網(wǎng)帶來人工智能和大數(shù)據(jù)的應用,這里面比如說可以非常的智能,并且保護你。這個就是我們說過的數(shù)據(jù),現(xiàn)在慢慢的收集起來就應該利用起來造福社會。比如說你可以根據(jù)天氣的原因,或者你睡眠的原因,睡眠的深度來決定你的手機要不要叫醒你等等,我們希望這些應用可以深入到我們的日常生活。
2016-11-17 15:33
雷伊·雷蒂:這里我舉兩個例子,一個叫認知增強器,什么意思呢?比如說我們到銀行說我要付賬單,那你去銀行付了賬單,這是你必須要做的這件事情。但是我的意思是說,如果你在家里,網(wǎng)上做這件事情,你想我沒有時間去銀行,你就叫你的助理去做這件事情,那么如果以后的認知增強器就像這么一個小助理的話,你必須要做這件事情,在一定的時間內(nèi)。你必須要完成,你就可以讓你的電腦去完成你本來可以做但沒有時間去做的事情。
2016-11-17 15:33
雷伊·雷蒂:我本來想給大家講一下架構的問題,很多程序是具有學習能力的,學習能力哪里來呢?來自大數(shù)據(jù),手機的大數(shù)據(jù),這些大數(shù)據(jù)不是給我用,而是給每一個人所有的大眾都可以用。比如說亞馬遜,你要去買一個電腦來看。那么有一些比如說底層人民我還不知道怎么樣在網(wǎng)上付這個賬單,如果你不需要這么一個交易的過程就可以完成賬單的支付,你需要叫一個人支付,這是一個未來的增長潛能。如果機器有學習能力,你就不需要讓程序員再去寫一個新的程序,而是機器可以跟你直接進行互動。因為它有學習的能力,這個就叫深度學習,這個是我們未來發(fā)展的方向。
2016-11-17 15:34
雷伊·雷蒂:未來幾十年我們相信會有新的重大的要素突破,帶來計算效率的有幾萬倍的增長,從而使相同成本情況下效率達到更高,相同成本情況下成本變得更低。個人的數(shù)據(jù)已經(jīng)被政府和企業(yè)收集在安全的范圍內(nèi)將數(shù)據(jù)進行分析即刻義得到合理的分析,尋找他們的規(guī)律通過糾錯進行學習,通過闡述來學習。每個人都能獲益于語音人工智能的助手深度學習機器學習是我們未來的趨勢。就像你的助理在你身邊學習你做的事情,并且?guī)湍愦硪粯?,機器未來就可以通過計算大數(shù)據(jù)來做這些事情。謝謝。
2016-11-17 15:34
主持人:謝謝雷伊·雷蒂教授,讓我們再一次用熱烈地掌聲對雷伊·雷蒂教授精彩演講表示感謝。接下來有請中國工程院院士、中國科學院計算技術研究所研究員倪光南先生,以“大數(shù)據(jù)在電子政務中的應用實踐”為主題演講。大家歡迎!
2016-11-17 15:35
中國工程院院士、中國科學院計算技術研究所研究員倪光南
倪光南:大數(shù)據(jù)很多人說大數(shù)據(jù)是財富,這里我們說把它作為生產(chǎn)力,生產(chǎn)力肯定能夠產(chǎn)生財富,但是生產(chǎn)力是不是比財富更合適?因為一些經(jīng)濟學家告訴我們,生產(chǎn)力是最基本的,生產(chǎn)力決定生產(chǎn)關系,至少有一些經(jīng)濟學家是這么說的,今天的理論是這么說的。所以我們把大數(shù)據(jù)作為生產(chǎn)力,可能比大數(shù)據(jù)作為一種財富更好、更全面一點。我們強調(diào)大數(shù)據(jù)生產(chǎn)力,會推動生產(chǎn)關系的發(fā)展,推動社會的發(fā)展,當然會創(chuàng)造無窮無盡的財富,供大家參考,我們喜歡說把大數(shù)據(jù)作為生產(chǎn)力,進入大數(shù)據(jù)時代意味著進入了一個新的生產(chǎn)驅動時代,所以將來對于我們整個思維的發(fā)展將會造成很大的變革。
2016-11-17 15:35
倪光南:大數(shù)據(jù)的四種能力,或者說大數(shù)據(jù)的四個價值。第一個是融合Fusion。當然包含了集成,集成意味著數(shù)據(jù)的物理上的聚集,量的聚集。這里更加強調(diào)的質的變化,當而數(shù)據(jù)匯聚起來融合以后,它的價值會更加提升,遠遠比原始數(shù)據(jù)簡單的算術相加要多。所以我們用了融合的意思,在中文上融合可能把它理解成匯聚加融合,就是數(shù)量和質量的提升,是大數(shù)據(jù)給我們提供的能力或者提供的價值。
2016-11-17 15:35
倪光南:第二,云計算Cloud。當大數(shù)據(jù)達到這樣大的量的時候,你要迅速的利用它,在我們需要的時候隨時能夠利用,傳統(tǒng)計算架構已經(jīng)不適用了。這時候應用的是Cloud而云計算,云計算提供這種能力,對于大數(shù)據(jù)相適應的,云計算是為大數(shù)據(jù)而生的,或者說大數(shù)據(jù)和云計算相輔相成,兩者之間互相推動,應該說互相促進,是一個非常典型的例子。
2016-11-17 15:35
倪光南:第三,Insight,意思是我們可以說明察秋毫,當你有了大數(shù)據(jù),世界萬物的關系你可以分析出來,很多人說我們不在意什么因果關系,我們在意的是關系。誰和誰能夠夠相關性,不管怎么樣,我們有了大數(shù)據(jù),直到世界萬物之間可以發(fā)生過去沒有想象到的,過去我們在商業(yè)上面啤酒和藥物之間發(fā)生關系了,現(xiàn)在我們大數(shù)據(jù)會結合一些新的規(guī)律,人類可以發(fā)現(xiàn)一些新的規(guī)律、新的原理或者新的科學的創(chuàng)造。毫無疑問,通過理論分析,通過計算機到大數(shù)據(jù),這是萬物之間關系的方式。
倪光南:第四,預見性。Foresight大數(shù)據(jù)給我們一種預示性,可以更進一步。我們預測到將來什么時候會發(fā)生什么事情,非常有可能發(fā)生一些什么事件的預測,可以通過語境分析可以預測時間上的推進。這四個要求、四個價值、四個能力是大數(shù)據(jù)給我們的,以前是沒有的,對我們非常有意義,對政府做科學治理體系的建設非常有價值。
2016-11-17 15:42
倪光南:政府利用大數(shù)據(jù)來做信息建設,這里是用一個部委,某一個部委,可能有相當類似,從頂層到中央政府到地方一直到基層,一個部委的信息化的建設,作為一個中央的部委,他將會命令一個什么要求,達到什么目的,大致上有相當?shù)钠毡樾浴5讓游覀円獙Υ氖鞘裁茨?四大塊。第一塊毫無疑問,大量的數(shù)據(jù),你將要面臨的一個部委的數(shù)據(jù),我們知道比如說中國從地方來講,應該有200多個地級市,2800個縣鎮(zhèn)鄉(xiāng),我們相信中國部委的信息化大數(shù)據(jù)系統(tǒng)難度要比目前世界上任何國家的信息系統(tǒng)或者電子政務系統(tǒng)更難。
2016-11-17 15:42
倪光南:第二,我們是一個異構,因為與歷史的關系,我們不可能在現(xiàn)在作為一個新的系統(tǒng),我們是要集成歷史上的信息系統(tǒng)。這些數(shù)據(jù),這些信息系統(tǒng)可能是不同時期做的,不同公司的,很多公司的,所以你發(fā)現(xiàn)異構是相當清楚的,是完全不同的異構系統(tǒng),你要把它融合起來,是一個很大的挑戰(zhàn)。
2016-11-17 15:42
倪光南:第三,應該是部門上的保護,各個部門之間很難融合。此外還有地級,毫無疑問,東南西北不同的地區(qū)差別都很大,而且地理位置的差異,這是我們面臨的挑戰(zhàn)。我們要做一個電子政務大數(shù)據(jù),我們未來要達到什么目的呢?根據(jù)三個需求,我們要把它匯聚起來、集成起來、融合起來,就是剛才說的意思,我們要把這些信息大數(shù)據(jù)資源融合起來;日常工作。審計、監(jiān)管,政府部門要做這些事情,我們大數(shù)據(jù)是用來支撐當前工作,使它更有效地完成得更好;這可能以前做不到,現(xiàn)在可以做到,如果大數(shù)據(jù)我們可以有科學決策。一個政策將會產(chǎn)生什么效果?應該可以預測,可以看到這是可行還是不可行,包括怎么改進。這是對于政府的科學決策,給予科學的工具來支持。所以我想大概無非是這幾個地方比較重要,我們分別來講這三塊。
2016-11-17 15:47
倪光南:第一塊融合是很難的地方,當你要建造一個信息系統(tǒng),你不能把政府工作停下來,因為信息化你能說我這個部門關掉,等我兩年以后做好了再開嗎?不可能。每天還要繼續(xù)工作,不可停頓。第一業(yè)務是不可以停頓的,信息系統(tǒng)必須在保證正常工作情況下進行,所以這是采用什么對策呢?其實我們要把數(shù)據(jù)的獲取的手段用一種很巧妙的方式,在它運作的時候,我能抓取它,不是停下來我把它拷貝下,把政府的數(shù)據(jù)庫清理出來把數(shù)據(jù)拿過來不行。政府照常工作,在政府運營的工作中誰去抓取數(shù)據(jù),這套辦法就是這個例子,具體操作上大家知道怎么做數(shù)據(jù)庫,不斷地提取,不影響你正常工作,這是第一個挑戰(zhàn)。
2016-11-17 15:47
倪光南:第二塊,所有的政府部門是遍布全國的,這個比較簡單,實際上采用的在中國的網(wǎng)絡,也是有幾家運營商,我們要談合作一起做,并行的做。這個基本上可以想像代價多一點,此外比較難的,我們知道數(shù)據(jù)結構,就是因為歷史上這些數(shù)據(jù)都不是一次建的,不同廠家,不同規(guī)格這個是很難的。比如說面臨的數(shù)據(jù),我們知道你可能是不同的結構,你的數(shù)據(jù)庫不同廠商,你的資源定義是不一樣的,你的數(shù)據(jù)模型是不一樣的。所以當你要用一個數(shù)據(jù)的時候,你會發(fā)現(xiàn)在這個數(shù)據(jù)庫要用,用這些方法收集組合,但另外一個又是完全不同的。這里提出了智能的數(shù)據(jù)切片,實際上用一種相當于影射,沒有一個地方我投影投到一個地方,不同的數(shù)據(jù)庫投到另外的投影,最終效果一樣,最終是新的辦法解決。最后我們的數(shù)據(jù)我們知道并不是很好的,有的數(shù)據(jù)很多垃圾,不是很合理的,你需要用一些很靈活的模型,各種演化的方法不斷的改進。
2016-11-17 15:47
倪光南:我們看到最后的效果,用這樣的方式我們支撐了1700個服務器,遍于全國的1700個服務器支撐這個系統(tǒng)。大量的數(shù)據(jù)在200個城市里能夠有3個PB的數(shù)據(jù),但是我覺得大概一年無非增加1是個PB,不斷增加,而且大概覆蓋到98%,還是相當大的覆蓋。應該說是一個足夠大的規(guī)模,這是目前的效果。
2016-11-17 15:47
倪光南:剛才講未來滿足監(jiān)管審計的要求,相對來說比那個簡單一點,我們知道原來上報數(shù)據(jù),就是給領導上報,比如一星期我們知道每個部門不一樣,一周也有,半個月也有,一個月也有?,F(xiàn)在來講就可以自動實時上報,不需要報表,實時的可以從系統(tǒng)里抓取你的數(shù)據(jù)。過去政策性很難保證,現(xiàn)在沒有問題。以前你很難知道它變化,現(xiàn)在是實時數(shù)據(jù),這點沒有問題,現(xiàn)在可以有權限地分配,更加合理的應用,這個大家可以想象,有這樣的數(shù)據(jù)信息系統(tǒng)以后對于信息監(jiān)管毫無疑問有很大的影響。
2016-11-17 15:48
倪光南:達到的效果這里講的10秒,可以在10秒鐘把任何的數(shù)據(jù)提取出來,這對于管理來講有很大的效果。此外我們知道所有的歷史變化你也可以得到。而且我們知道權限可以明確地分配,就是誰可以獲取哪些數(shù)據(jù),這個是很重要的,不同的權限可以看到不同的結果。包括系統(tǒng)管理應該是看不到重要的數(shù)據(jù),這個是需要有很好的權限分配,這是效果,這是當前管理效果。最后是我們對預測的效果。過去這種信息系統(tǒng)是大數(shù)據(jù)系統(tǒng)所做不到的,我們希望未來要實現(xiàn)過去信息孤島的問題,現(xiàn)在我們已經(jīng)通過融合的手段可以把數(shù)據(jù)統(tǒng)一起來,使整個的權限數(shù)據(jù)可以互聯(lián)互通,另外我們過去來講歷史數(shù)據(jù)不一定有,今后的歷史數(shù)據(jù)應該永遠發(fā)展下去,永遠保留下去。過去有一些東西會刪掉,現(xiàn)在這些會不斷地積累下來。此外,過去的數(shù)據(jù)會滯后,現(xiàn)在可以動態(tài)的實時分享,業(yè)務也可以聯(lián)系起來,綜合業(yè)務決策不是單路的決策。謝謝大家。
2016-11-17 15:48
主持人:謝謝倪光南院士,我們再一次用掌聲對倪光南院士精彩的演講表示感謝。接下來有請澳大利亞科學院院士、工程院院士,墨爾本大學終身教授饒·寇他科里先生,以“大數(shù)據(jù)分析的前沿技術”為主題進行演講,大家歡迎!
饒·寇他科里: 數(shù)據(jù)分析的前沿技術
2016-11-17 15:56
饒·寇他科里:首先我來講一下籠統(tǒng)的概念就是深度學習以及它的應用,什么是最先進的深度學習,那就是用最先進水平的技術可以非常穩(wěn)定的來采取數(shù)據(jù)來實現(xiàn)人工智能來解決一些人工智能的問題。比如說進行自然語言的加工,李世石已經(jīng)被谷歌的AlphaGo打敗了,它就成為世界上最厲害的圍棋手,這個是非常典型的深度學習的典型象征。我相信在未來的幾年過程當中,我們就可以用系統(tǒng)來進一步的開發(fā),我們都知道谷歌的Alphago它是怎么樣的一個神經(jīng)網(wǎng)絡呢?
2016-11-17 15:57
饒·寇他科里:這個是他們背后的邏輯,也就是說我們理解背后的邏輯以及語言的網(wǎng)絡,最后可以用在我們的其他的成功案例過程當中。這個就是我們所使用的最典型的一個架構,這個架構看到了一些圖片的處理,語言的處理、語音的處理等等,還要基于問題處理其他的東西,不光是圖片、語音,我們需要有識別,我還是給大家看一些挑戰(zhàn),我們有什么樣的挑戰(zhàn)呢?我們叫把它叫做ILSVRC,就是說一個圖片,它在大規(guī)模大范圍視覺認知的時候,會遇到各種各樣的挑戰(zhàn),比如說你看到這個圖片,你去攝影它的時候需要對象識別,這個圖片到底是告訴你這是一只鳥還是一只青蛙,這個地方就會有難度,所以你需要有對象的定位,所以這就涉及到對象的識別和定位,這個圖片也是。到底是一個人一條狗還是一個椅子?這個就是計算機識別的基準,我們遇到大規(guī)模視覺識別的挑戰(zhàn)。大規(guī)模視覺識別挑戰(zhàn),還有這樣一個統(tǒng)計的數(shù)據(jù),就是最難的五個圖象處理,ImageNet方面的五大錯誤,這個錯誤率當然是一年比一年降低,而且降低的速度也是非常非??臁?/p>
2016-11-17 15:57
饒·寇他科里:到2014年,我們基本上已經(jīng)把錯誤率降到很低很低的,到了2015年,現(xiàn)在計算機已經(jīng)跟人眼所識別到的東西水平是完全一樣的,這就是我們神經(jīng)語言網(wǎng)絡可以幫我們做到的水平。當然人類還需要更多的東西,比如說圖象字幕的抓取,這也是我們想做的一件事情。
2016-11-17 15:57
饒·寇他科里:另外一個案例很有意思,兩個圖片,比如說下面一個,你給他下面一個圖片,然后機器會給你一張很漂亮的圖片,就是右邊的這個。另外一個機器學習的案例呢,就是你給它兩張,一張照片,一個花圖,最后出來一個非常漂亮的圖片。其他的也一樣,這也是我喜歡的圖片,馬和面條結合出來這么有藝術感的圖象。這個就是我們了解的神經(jīng)語言網(wǎng)絡,最后出來了這么一個特征圖,也就是說它會把這些圖片的特征都有機的,或者用藝術的感覺把它連接在一起。
2016-11-17 15:58
饒·寇他科里:這個就是深度學習的應用,包括計算機的視覺,包括標注、計算機、無人駕駛汽車這里面都是需要用到計算機視覺,比如說你把我的名字輸進去以后,給你各種各樣我的圖片以及我這個人涉及在一起的各種各樣的圖片。自然語音加工是深度學習應用的另外一個案例,然后是現(xiàn)場翻譯,我覺得現(xiàn)場翻譯亞馬遜翻譯等等,以后都是可以實現(xiàn)的,包括大城市的數(shù)據(jù),車輛的數(shù)據(jù)等等。
2016-11-17 15:58
饒·寇他科里:接下來,給大家講一下對抗性樣本和無法識別的樣本。神經(jīng)網(wǎng)絡易受的干擾就是對抗性的噪音干擾。比如說這里面有123456789,如果你加進去一些肉眼看不到的聲音進去以后,最后一模一樣的圖片出來的數(shù)據(jù),就變成了6332931這樣的,完全不一樣的數(shù)據(jù)。其實這個數(shù)據(jù)還是123456789,也就是說有一些聲音,雖然我們?nèi)耸峭耆兄坏降穆曇簦@些聲音輸入到機器當中,計算機會非常非常的敏感,會干擾它對圖象的識別。這個就是機器所敏感的噪音,另外我們還做了一個隨機大容量噪音,隨機大容量噪音不是非常細微,而且大家都一樣,在每一個數(shù)據(jù)上面都加入了大容量的隨機噪音,出來的結果影響并不是很大,只有一個數(shù)據(jù)錯了。
2016-11-17 15:59
饒·寇他科里:再比如說,我們看所有的圖片,大家看這個圖片,它會識別出來的時候都是蘑菇,如果加了噪音以后,識別出來的結果會不一樣,所以聲音對圖形的識別是很有意思。我們加入過程當中,我們怎么樣去做對抗性的干擾,對抗性的聲音?對抗性的聲音我們用的是分類器,我們用不同的每一次識別的時候,我們都輸入X,它的矢量也會不一樣,對抗性和概率也是不一樣的。
2016-11-17 15:59
饒·寇他科里:最后這個問題,是通過梯度下降實現(xiàn)噪音的對抗性干擾。對抗性干擾,樣本的屬性應該是非常特別的,剛才我說到的普遍性,就是需要用這樣的分類器和基本的線性模型和良好的訓練。它的概括性和普遍性是可以通過我們的干擾來實現(xiàn)的。不管你做什么,他們都必須要非常得小心,我們要有很多很多的技術,這個比較專業(yè)。比如說基本信息模型,良好的訓練分類器等等,抵抗力方面,我們需要正規(guī)化,需要降噪建筑,需要對抗性的訓練,還有同時發(fā)聲、共振等等。還要進行一定的預處理,比如說低通濾波器,有源探測等等,普遍性的應用是剛才汽車的例子,這個概化屬性的案例比如說語意解釋,是像這樣的圖片過程當中,我們在這個圖片的輸入過程當中加入噪音,讓機器變得疑惑,這個到底怎么樣,它會退出來。對抗性的樣本是數(shù)據(jù)部分固有的,是固定任何模型的。說到無法識別的樣本,機器跟人最大的區(qū)別,就是我們覺得沒有問題的東西它會覺得無法識別。這些東西到底是什么呢,需要輸入一定的干擾才能夠識別。
2016-11-17 15:59
饒·寇他科里:最后這個問題,是通過梯度下降實現(xiàn)噪音的對抗性干擾。對抗性干擾,樣本的屬性應該是非常特別的,剛才我說到的普遍性,就是需要用這樣的分類器和基本的線性模型和良好的訓練。它的概括性和普遍性是可以通過我們的干擾來實現(xiàn)的。不管你做什么,他們都必須要非常得小心,我們要有很多很多的技術,這個比較專業(yè)。比如說基本信息模型,良好的訓練分類器等等,抵抗力方面,我們需要正規(guī)化,需要降噪建筑,需要對抗性的訓練,還有同時發(fā)聲、共振等等。還要進行一定的預處理,比如說低通濾波器,有源探測等等,普遍性的應用是剛才汽車的例子,這個概化屬性的案例比如說語意解釋,是像這樣的圖片過程當中,我們在這個圖片的輸入過程當中加入噪音,讓機器變得疑惑,這個到底怎么樣,它會退出來。對抗性的樣本是數(shù)據(jù)部分固有的,是固定任何模型的。說到無法識別的樣本,機器跟人最大的區(qū)別,就是我們覺得沒有問題的東西它會覺得無法識別。這些東西到底是什么呢,需要輸入一定的干擾才能夠識別。
2016-11-17 16:00
饒·寇他科里:我們的結果是藍色的這一部分,大家看Epochs,數(shù)據(jù)可以學習的周期,,可以學習的數(shù)量越來越大,學習成本會越來越低,錯誤率會越來越高,藍色的就是錯誤率的降低。當然我們會有一些比較危險的,你輸入太多噪音干擾的話,會有一定的風險。我們看到Net1和Net2,Net1是生成噪音的地方,Net2是我們的目標系統(tǒng)。我們看一下穩(wěn)定性、穩(wěn)健性,以及怎么樣對抗這些樣本的穩(wěn)定性,我們也可以看到輸入一定的噪音干擾之后可以降低三分之一的錯誤率,這個就是神經(jīng)語言網(wǎng)絡學習,當然大家需要去理解這些理論,我們?nèi)绻辣澈蟮睦碚摬拍軌蜻M一步的利用它,減低錯誤的機率。我們在實驗的過程當中,也發(fā)現(xiàn)了隨機系統(tǒng)是非常穩(wěn)健的,可以做到非常高度的隨機性,99%的隨機性,可以看到神經(jīng)系統(tǒng)隨機語言可以達到百分之百的隨機性。在整個系統(tǒng)的穩(wěn)定性方面,基本上可以達到90%的提升。接下來會做什么呢?我們用隨機投射,進一步利用到回界回腦的架構當中,我們會繼續(xù)利用這一點,然后是對抗性的擾亂或是干擾。謝謝大家。
2016-11-17 16:00
主持人:謝謝饒·寇他科里教授。接下來有請中國科學院院士,中國科學技術大學常務副校長潘建偉教授,以“新量子革命:用于更安全和高效的大數(shù)據(jù)分析”為主題的演講,大家歡迎!
2016-11-17 16:44
潘建偉教授,新量子革命:用于更安全和高效的大數(shù)據(jù)分析
潘建偉:很高興能夠參加今天的論壇,我的話題是新量子革命或者量子飛躍,為了能夠更加安全和有效地進行大數(shù)據(jù)分析,我們?yōu)槭裁葱枰髷?shù)據(jù)分析,剛才幾位非常杰出的學者都做了比較好的闡述。一方面從各式各樣的資源進行數(shù)據(jù)收集的時候,我們是需要有互聯(lián)網(wǎng)的安全性,希望數(shù)據(jù)能夠被安全的收集。同時我們采集到數(shù)據(jù)之后,希望也能夠對數(shù)據(jù)進行有效的挖掘,我們需要很強的計算能力。
2016-11-17 16:44
潘建偉:但是在這些事情當中,我們有幾個挑戰(zhàn)。第一個就是互聯(lián)網(wǎng)的安全性,其實我們在服務器的終端,在我們的信息的傳輸?shù)倪^程當中,和服務器當中都存在著各種各樣的漏洞,所以都有一種潛在的威脅,覺得我們的信息有可能被泄露。但是為了解決這個問題,我們可以用加密的算法,比如說通過身份認證來確保用戶的合法性。同時在傳輸?shù)倪^程當中,通過對數(shù)據(jù)的加密來保證信息不會被竊取。與此同時也通過數(shù)字簽名,可以比較好的保證我們的數(shù)據(jù)在傳輸?shù)倪^程當中不會被篡改。但是在所有的傳統(tǒng)做法當中,都是依賴于加密算法,通常加密算法是依賴于計算的復雜度算法。我們把全世界的計算能力收集起來看一下,要對某個數(shù)據(jù)庫進行搜索的話,它只能對一個2的80次方數(shù)據(jù)庫進行搜索,密碼破解的時候,我們在收集的過程當中,破解的能力是非常有限的。
2016-11-17 16:45
潘建偉:非常有意思的是,量子力學從前是為經(jīng)典技術提供非常好的方案,我們芯片各種各樣的期間有賴于量子力學的發(fā)展,量子力學研究的本身,也為了解決剛才所講到的這些問題提供了可能性的解決途徑。
2016-11-17 16:45
潘建偉:具體的來說,運用了量子力學的基本原理。我們都知道,在量子力學里面,我們說比特可以用一只貓的死和活兩個狀態(tài)來看,比特在微觀世界里面,在物理上怎么來實現(xiàn)呢?我們可以用光子的極化,比如說電磁波在真空當中傳播的時候,沿著水平的偏正,未知的量子態(tài)是不能被精確復制的,這是這個定理告訴我們的。
2016-11-17 16:45
潘建偉:比如說利用所謂的當光子不可分析性,單光子一顆一顆的,對于量子不可克隆的定理,如果存在竊聽者,這個方法是不能做的,只能進行復制或者測量。測量完之后就會引入噪聲,就會覺察。用這樣的方法,在兩個之間建立安全的密鑰,這樣的安全的通信方式是依賴于物理學的基本原理,而不是依賴于計算的復雜度。這樣的話,我們就能夠保證由物理學基本原理所保證的互聯(lián)網(wǎng)的安全性。與此同時,當我們利用量子糾纏的概念,拓展到很多粒子的時候,我們就可以涉及一些特殊的量子算法,利用量子疊加原理,我可以分解一個300位大數(shù),目前的ClassicalTHz15萬年,用量子的1秒鐘就可以了,從這樣的角度講,量子的計算功能是比較強大的。
2016-11-17 16:46
潘建偉:還可以舉另外一個例子,在求解方面,利用目前最廣的太湖之光,相當于100個24個方的線性方程組100年左右,用量子計算機需要0.01秒完成了。但是真正的把這樣的機器研制出來,我們還是需要比較長的時間,所以目前對我們物理學家來說,我們主要的精力是集中在量子模擬上面。利用這樣可控的量子系統(tǒng),我們可以來計算一些目前的每天的計算機所算不了的事情。比如說可以來求解一些方程,專門求解高溫超導里面的機制或者霍爾方面相關的研究,這是我們這個領域里面的一些基本原理。
2016-11-17 16:46
潘建偉:總體上來講,目前我們估計上正在做這么一件事情,就是說為了實現(xiàn)這么一個大尺度的LargeScale,首先用光纖構建各種各樣的網(wǎng),這個技術是比較成熟的。同時利用所謂的Scale將各個城市之間連起來,兩個連接起來會比較有效,到了更廣的時候來實現(xiàn)廣域的LargeScale。有了這些事情以后,我們可以比較好的來做未來的一些發(fā)展。目前在我們中國,比如說我們已經(jīng)在2012年的時候,已經(jīng)能夠相關的技術覆蓋到6000平方公里的來支持千節(jié)點、萬用戶的相關需求了。這么一來,這樣的系統(tǒng)目前比如在北京,已經(jīng)投入永久使用了,來進行一些相關的安全的使用。除此之外我們目前也在構建所謂的北京到上海之間的量子通訊網(wǎng)絡,就是骨干網(wǎng)絡,骨干網(wǎng)絡昨天正好是上海到合肥之間所有的設備開通了,昨天正好在國際會議上給國外學者做相關的展示,這是700公里光纖,這個到今年年底也會完全開通,開通之后可以用于一些銀行的轉賬等等。
2016-11-17 16:47
潘建偉:另外我們也在開展一個相關的工作,是跟量子衛(wèi)星緊密結合的,我們其中的主要任務,希望能夠實現(xiàn)一個高速率的,衛(wèi)星和地面之間的密鑰的分發(fā)。我們在今年的8月份,量子衛(wèi)星正式發(fā)射之后,已經(jīng)開展了相關的實驗。相關的實驗,我們在星龍地面站,這是我們衛(wèi)星的軌跡,這是我們地面對天上進行跟蹤,我們曝光是5到10秒鐘,天上的信號是完全可以看到的,點就變成一條線了,到目前為止非常好的建立了天地之間的鏈路,目前的速率大概每妙鐘傳輸?shù)拿荑€是在20000個左右,所以基本上可以滿足一些安全信息傳輸相關的需要。
2016-11-17 16:49
潘建偉:在量子計算方面,因為我們目前很難想象計算機到底是一種固態(tài)的?還是業(yè)態(tài)的?還是氣態(tài)的?大家都不清楚,相當于從前我們討論說我告訴你有一臺有非常好的算法能夠算的很快,大家會問你你這個計算機到底是用珠子玻璃做的?還是竹子做的?還是木頭做的?經(jīng)常會問我們將來的計算機到底是用原子做的還是什么做的?目前回答這個問題還太早了。目前我們這個領域有用離子的、光子的、Cavity-QED等各種各樣的系統(tǒng),我們來進行相關的研究,希望能夠找到一種適合于進行量子計算的體系,在這個過程當中,我們有幾個任務是需要完成的。
2016-11-17 16:49
潘建偉:第一個需要能夠對量子的狀態(tài)進行高精度的支配和操縱,能夠讓它有很長的存儲和相關時間。如果計算都還沒計算完,如果就死掉了,那你就很難獲得正確的結果了。為了讓計算能力越來越強大,所以需要把好多粒子糾纏起來。只有這樣我們才能夠進行有效的量子計算。
2016-11-17 16:50
潘建偉:目前比如說在我們的體系里面,我們已經(jīng)做了一些相關的演示,比如說做各種各樣的量子算法的演示。我們可以用我們的量子算法來有效地求解線性方程組,我們知道方程組的求解在信號處理,在經(jīng)濟學的分析,在計算科學和物理學方面是廣泛應用的,求解這么一個方程組的話,相當于做這么一個反向的求解,找到一個A負的矩陣,把X等于多少求解出來。找到這么一個矩陣,首先找到A的本正值engenvalues,大概需要這么多步。有了這個方案之后,就可以構造所謂的矩陣。
2016-11-17 16:50
潘建偉:假定我們有這么一個方程組,這是一個非常簡單的游戲機一樣的,我們構建這么一個比較小的所謂的Serqute,之后我們就可以在實驗上來驗證我們確實有這么一種計算可以在小的步驟里面完全量子計算。但是這個過程的話,我們也可以把它用到所謂的機器學習里面。在這個地方對一個數(shù)據(jù)進行分類,我們這里有很多Samplevector,有好的Vector,還有壞的Vector。
2016-11-17 16:50
主持人:謝謝潘建偉院士,讓我們再一次用掌聲對潘建偉院士的精彩演講表示感謝。
2016-11-17 16:51
主持人:尊敬的各位來賓,女士們,先生們,接下來請電器和電子工程師協(xié)會可拓展計算委員會主席陳金俊先生,以“大數(shù)據(jù)—大應用”為主題進行演講,大家歡迎!
陳金俊
2016-11-17 16:54
陳金俊:各位領導,各位嘉賓,大家下午好!現(xiàn)在很多人都在談大數(shù)據(jù),各個國家、各個企業(yè)、各個地方。有的人會說數(shù)據(jù)和石油一樣,是重要的資源,也有的人會說數(shù)據(jù)加人才是現(xiàn)代企業(yè)很重要的決定性的力量,有很多包括Bigdata等不同的,關鍵的核心點都是類似的,就是從大數(shù)據(jù)當中找到有用的信息,對于企業(yè)來講新的產(chǎn)品、新的機會,對政府來講新的管理模式等。
2016-11-17 16:55
陳金俊:對大數(shù)據(jù)的看法有很多種,不同的人有不同的看法,還有人從投資的角度,不管你怎么看大數(shù)據(jù),最基本的概念是要有價值要有Value,沒有價值,不管數(shù)據(jù)多么大,其實沒有太多的意義。從Value的角度講,關心的是能不能從大數(shù)據(jù)分析出更多有用的信心,比如說新的產(chǎn)品,相比較傳統(tǒng)的企業(yè)單個分析數(shù)據(jù),跨行業(yè),不同種類的數(shù)據(jù)分析,可能會令人更加的激動。過去幾年云計算的普及以及深度合作,擁有很多不同種類的數(shù)據(jù)成為可能。不像以前我們只能設想我們有很多種數(shù)據(jù),現(xiàn)在因為云計算很普及,大家把數(shù)據(jù)放在云上,擁有不同種類的數(shù)據(jù)成為現(xiàn)實。
2016-11-17 16:55
陳金俊:當然單個領域數(shù)據(jù)的分析缺失是很重要的,比如說一個超市的零售業(yè),你對用戶購買興趣消費的分析很有用,不同種類的數(shù)據(jù)分析,不同種類的數(shù)據(jù)因為云計算的普及,因為大數(shù)據(jù)成為可能。我們的觀點,對企業(yè)家來講分析不同種類的數(shù)據(jù)。
2016-11-17 16:55
陳金俊:一個真實的例子,在澳大利亞跟我合作的企業(yè),有訂飛機票的企業(yè),還有超市的企業(yè),原來他們是兩個不同的企業(yè),他們各自管理各自的數(shù)據(jù),現(xiàn)在因為云計算的原因,他們把數(shù)據(jù)放在云上,比如說有人經(jīng)常晚上買東西,這樣的人你就應該推薦晚上的飛機票。把不同種類的數(shù)據(jù)之間微弱的關系找出來,這種微弱的關系往往意味著新的市場、新的產(chǎn)品,這個在以前大數(shù)據(jù)之前,在云計算之前不是很容易想象的。因為那個時候你并沒有把不同種類的數(shù)據(jù)放在一起。
2016-11-17 16:55
陳金?。簩τ谧鲅芯康膩碇v,我們知道要做大數(shù)據(jù),首先得有大數(shù)據(jù),因為要但量多,數(shù)據(jù)更新特別的快我們知道對大多數(shù)研究者來說我們沒有真實的數(shù)據(jù),企業(yè)不太愿意跟我們分享他們真實的數(shù)據(jù),可能基于各種各樣的原因。所以我們只能用一些官方的數(shù)據(jù),對于研究者來講,如果要更有效,我們要接觸真實的數(shù)據(jù)。如何接觸真實的數(shù)據(jù)?要更多的要跟企業(yè)合作,解決他們的問題,可以訪問他們的數(shù)據(jù)。否則的話,我們訪問的網(wǎng)上公開的數(shù)據(jù)往往并不是實的。
2016-11-17 16:56
陳金?。涸谶@個階段上,無論從企業(yè)來說,分析不同種類的數(shù)據(jù),對科研人員來講的話,要接受真實的數(shù)據(jù)進行分析,在目前的階段大數(shù)據(jù)更多的是應用。你現(xiàn)在去定義大數(shù)據(jù)科學,其實并不是一件很清楚的事情,什么是大數(shù)據(jù)科學?更多的是應用。從應用當中產(chǎn)生一些數(shù)據(jù)的科學,然后解決問題。基于這個出發(fā)點,我們跟很強的跟企業(yè)合作,現(xiàn)在最典型的兩類行業(yè),零售業(yè)和航空訂票的行業(yè),就是因為把不同種類的數(shù)據(jù)放在一起,找到他們微弱的關聯(lián)性。
2016-11-17 16:57
陳金?。哼@種微弱的關聯(lián)性剛才說了,比如很多人晚上出去買東西,你就給他推薦晚上的飛機票,還有把醫(yī)院的數(shù)據(jù)和保險公司的數(shù)據(jù)放在一起分析,分析過去兩年醫(yī)院的健康的情況,然后可以幫助保險公司設計出更好的保險產(chǎn)品,這是兩個真實的例子??偟膩碇v,就是把不同種類數(shù)據(jù)放在一起找出不同的關聯(lián)性,產(chǎn)生新的商機,是企業(yè)關心的,這是大數(shù)據(jù)帶來新的機會,在云計算普及之前只能設想不同的數(shù)據(jù)放在一起,現(xiàn)在因為云計算數(shù)據(jù)放在一起產(chǎn)生大數(shù)據(jù),擁有不同種類的數(shù)據(jù)成為現(xiàn)實。
2016-11-17 16:57
陳金?。焊髽I(yè)合作的時候,企業(yè)常常問我們的問題非常簡單,尤其是一些傳統(tǒng)企業(yè),他們并不關心你跟我講的大數(shù)據(jù),就告訴我能得到什么。另外一個問題是你說把我這些數(shù)據(jù)不同種類的放在一起,醫(yī)院的數(shù)據(jù),保險公司的數(shù)據(jù)。比如說訂票的會員數(shù)據(jù),還有超市的數(shù)據(jù)放在一起進行分析,你怎么保證他們的隱私?這是他們直接問我的。
2016-11-17 16:57
陳金?。鹤銎髽I(yè)大家知道,并不關心三年、五年,我要的就是現(xiàn)在。所以他一定要很快速的,相應的就在這三方面做分析,不同種類的數(shù)據(jù)之間把關聯(lián)性找到非常微弱的關聯(lián)性往往意味著新的商機,如果關聯(lián)性非常強并沒有太大的意義,你能看到的機會別人也可以看到。大數(shù)據(jù)不同種類的數(shù)據(jù)分析出來找到微弱的關聯(lián)性,就像剛才醫(yī)院和保險公司一樣即刻幫助保險公司提供更好的產(chǎn)品。就像剛才說的超市和訂票公司一樣,可以告訴訂票公司更好的推進產(chǎn)品,不同種類的數(shù)據(jù)覺得因為云計算過去的普及產(chǎn)生的,因為大數(shù)據(jù)產(chǎn)生的新的比較集中的點,這并不意味著單純的一個點不重要,是重要的。
2016-11-17 16:57
陳金?。毫硗怅P于隱私安全,做隱私知道的,隱私的問題是非常主觀的問題,什么隱私?什么不隱私?如何基于應用設計出考慮到設計、空間,主要是隱私,昨天我生病了,昨天是隱私,今天我好了就不是隱私。最后的結論點就是說大數(shù)據(jù)不管怎么看它,最終還是回歸到價值,一定要有價值,從價值的角度看它。如果沒有價值,這個數(shù)據(jù)再大也沒有意義。
2016-11-17 16:57
陳金俊:從應用的驅動產(chǎn)生價值,在這個階段應用驅動會更恰當一些,考慮什么是數(shù)據(jù)科學。更加令人激動的是不同種類的數(shù)據(jù)找到它的關聯(lián)性意味著新的商機對企業(yè)來講及因為云計算的普及,大數(shù)據(jù)不同種類的數(shù)據(jù)成為現(xiàn)實,是一個新的點,是一個比較激動的點。這是我們一個觀點,也是我們正在做的,謝謝大家。
2016-11-17 16:58
主持人:謝謝陳金俊先生,讓我們再次用掌聲對陳先生的精彩演講表示感謝。接下來有請中國信息通信研究院總工程師余曉暉先生,以行業(yè)自律推動建立大數(shù)據(jù)流通信任體系為主題進行演講。大家歡迎。
via:網(wǎng)絡大數(shù)據(jù)
慧都控件網(wǎng)超級促銷月,全場6折起,豪禮搶不停>>>
截止時間:2016年11月30日
更多大數(shù)據(jù)與分析相關行業(yè)資訊、解決方案、案例、教程等請點擊查看>>>
詳情請咨詢在線客服!
客服熱線:023-66090381