2017大數(shù)據(jù)領(lǐng)域十大必讀書籍
歷史大浪淘沙經(jīng)過5次信息革命,終于迎來大數(shù)據(jù)時(shí)代,給信息領(lǐng)域灌入了強(qiáng)勁的血液,催生了很多新生力量,而各行各業(yè)誰也無法離開數(shù)據(jù)存活。尤其近幾年來,全球范圍內(nèi)掀起了一股“大數(shù)據(jù)”熱,各地政府、大小企業(yè)都在布局大數(shù)據(jù),搶占先機(jī)。這個(gè)局到底怎么設(shè),很少有人能說出清晰的脈絡(luò)。一個(gè)新事物的出現(xiàn),除了帶給人們驚喜之外,還有毫無思緒的迷茫。
據(jù)可靠數(shù)據(jù)顯示,截止到2016年,全國的大數(shù)據(jù)人才只有46萬,未來3-5年人才缺口高達(dá)150萬之多。市面招聘網(wǎng)站上都在爭搶大數(shù)據(jù)人才,有3-5年工作經(jīng)驗(yàn)的數(shù)據(jù)分析師年薪直接高達(dá)50萬元,但是能找到的確是寥寥。高校培養(yǎng)大數(shù)據(jù)人才仍是初步階段,短期內(nèi)無法快速輸出人才。
相信身邊有很多應(yīng)屆畢業(yè)生以及想轉(zhuǎn)行大數(shù)據(jù)的,狀態(tài)大多都是:萬臉懵逼。
老司機(jī)教你:看書、寫代碼、多交流。
2016年馬上就過完,你看了幾本書呢?小編為大家精心挑選了大數(shù)據(jù)領(lǐng)域里十本有價(jià)值的書,先干掉這幾本書,再和老司機(jī)談大數(shù)據(jù)!不過,像《大數(shù)據(jù)時(shí)代》、《數(shù)據(jù)之巔》等這些經(jīng)典到“爛大街”的書我就不一一推薦了,很多人都看過,沒看過的也都聽說過。
一、《Presto技術(shù)內(nèi)幕》
Presto是Facebook開發(fā)的數(shù)據(jù)查詢引擎,基于Java語言開發(fā)的,專門為大數(shù)據(jù)實(shí)時(shí)查詢計(jì)算而設(shè)計(jì)和開發(fā)的產(chǎn)品,更是大數(shù)據(jù)實(shí)時(shí)查詢計(jì)算產(chǎn)品的佼佼者,比Spark、Impala更加簡單、高效。
《Presto技術(shù)內(nèi)幕》由淺入深地詳細(xì)介紹了Presto的安裝過程、內(nèi)部運(yùn)行原理機(jī)制、功能特性、性能優(yōu)化方法,以及在應(yīng)用過程中常見的問題及解決方案等,可用于多種數(shù)據(jù)源混合進(jìn)行實(shí)時(shí)大數(shù)據(jù)分析計(jì)算,使一些使用其他大數(shù)據(jù)技術(shù)不能解決的業(yè)務(wù)場景有了一個(gè)全新有效的解決方案。
在最后的附錄部分不僅對 Presto 使用過程中出現(xiàn)的各種問題給出了明確的解決方案,還對 Presto中的各個(gè)配置參數(shù)的含義和作用進(jìn)行了詳細(xì)的說明并給出了推薦配置值
作者: JD-Presto 研發(fā)團(tuán)隊(duì) ,是京東眾多研發(fā)團(tuán)隊(duì)中的一員,在開源軟件領(lǐng)域獲得多項(xiàng)大獎(jiǎng)
適讀人群: Presto技術(shù)狂熱者&攻城獅、對京東技術(shù)內(nèi)幕好奇的小伙伴
亮點(diǎn):
市面上第一本詳細(xì)介紹Presto技術(shù)的書籍,可單點(diǎn)突破。
濃縮了京東在開源領(lǐng)域深耕多年的實(shí)戰(zhàn)經(jīng)驗(yàn)
京東CTO張晨、京東首席技術(shù)顧問翁志等技術(shù)大牛重磅推薦
Presto 使用過程中的各種問題都給出明確的解決方案
對Presto中各個(gè)配置參數(shù)的含義和作用進(jìn)行詳細(xì)的說明并給推薦配置值
二、《為數(shù)據(jù)而生》
讀完《為數(shù)據(jù)而生》,你會(huì)清楚的看到中國在大數(shù)據(jù)道路上所留下的軌跡,主要包括在智慧城市、科技、醫(yī)療、教育、商業(yè)、金融等領(lǐng)域的實(shí)踐。書中分別闡述在大數(shù)據(jù)1.0、大數(shù)據(jù)2.0和大數(shù)據(jù)3.0時(shí)代下,相對應(yīng)的數(shù)據(jù)分析需要做到分析、外化、集成:
分析,這里作者提供了一套基本的大數(shù)據(jù)分析框架:確定問題和指標(biāo), 清洗數(shù)據(jù), 特征提取和選擇, 模型訓(xùn)練, 模型融合。
外化,借助外部數(shù)據(jù),將兩個(gè)看起來毫不相干的事物通過數(shù)據(jù)挖掘建立聯(lián)系。
集成,主要講企業(yè)、政府如何收集數(shù)據(jù)、標(biāo)準(zhǔn)化數(shù)據(jù),以及最后如何商業(yè)化。
未來中國的大數(shù)據(jù)發(fā)展提供一條清晰且可行性的路徑指南!
簡言之,看了這本書,不管是企業(yè)或者政府,都可以看到大數(shù)據(jù)比較清晰且可實(shí)現(xiàn)的一條路徑。
作者:周濤,天才少年,電子科技大學(xué)最年輕教授,中國大數(shù)據(jù)領(lǐng)域的傳奇人物,創(chuàng)辦數(shù)之聯(lián)、數(shù)聯(lián)銘品、國信優(yōu)易、DataCastle等20多家公司,公司總市值高達(dá)百億。
適讀人群:大數(shù)據(jù)愛好者、政府人員及苦于轉(zhuǎn)型中的企業(yè)管理者
亮點(diǎn):
手把手教企業(yè)如何蛻變成一個(gè)真正的大數(shù)據(jù)企業(yè)
大數(shù)據(jù)3.0時(shí)代究竟要如何應(yīng)對
為數(shù)不多的把實(shí)操、理論都講明白的書
三、《智能時(shí)代》
《智能時(shí)代》回顧了科學(xué)研究發(fā)展的四個(gè)范式,用實(shí)例證明了數(shù)據(jù)在科學(xué)發(fā)現(xiàn)中的位置。這本書作者分七章從不同角度對大數(shù)據(jù)進(jìn)行介紹,分別以技術(shù)和思維方式的改變?yōu)橹骶€,從工業(yè)革命這個(gè)角度嵌入,順理成章的延伸出大數(shù)據(jù)與智能化,但是沒有將過多筆墨放在技術(shù)的深究上,而是選擇從應(yīng)用層面體現(xiàn)大數(shù)據(jù)的理念。大數(shù)據(jù)應(yīng)用則會(huì)滲透到各行各業(yè),這正是作者的用心之處。
作者:吳軍,原騰訊副總裁。吳軍博士是當(dāng)前Google中日韓文搜索算法的主要設(shè)計(jì)者。除了《智能時(shí)代》,還著有《數(shù)學(xué)之美》、《浪潮之巔》和《文明之光》。
適讀人群:研究大數(shù)據(jù)應(yīng)用的一線實(shí)踐者、人工智能愛好者
亮點(diǎn):
深入淺出,用吃瓜群眾都能看懂的語言講生澀難懂的大數(shù)據(jù)和人工智能
邏輯性強(qiáng),你能想到問題,作者都備好了答案
雷軍、羅振宇、涂子沛、李善友、鄔賀銓院士聯(lián)袂推薦
四、《R語言預(yù)測實(shí)戰(zhàn)》
R語言橫跨了金融、生物、醫(yī)學(xué)、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域,主要用于統(tǒng)計(jì)、建模及可視化。由于上手快、效率高,備受技術(shù)人員青睞。預(yù)測是大數(shù)據(jù)挖掘的主要作用之一,借助R語言來做大數(shù)據(jù)預(yù)測,可以兼具效率與價(jià)值于一身。
《R語言預(yù)測實(shí)戰(zhàn)》主要分為預(yù)測基礎(chǔ)、預(yù)測算法、預(yù)測案例三大部分。從入門級的闡述逐漸過度到深入分析,抽絲剝繭般的講明白了用R語言預(yù)測的諸多問題。
作者:游皓麟,知名高級數(shù)據(jù)分析師
適讀人群:R語言數(shù)據(jù)分析師、R語言研究大數(shù)據(jù)預(yù)測的入門者
亮點(diǎn):
市面上為數(shù)不多的系統(tǒng)講解R語言預(yù)測專題的書籍
可以get到做R語言預(yù)測時(shí)的基本步驟和方法思路,還有更多技術(shù)細(xì)節(jié)
五、《醫(yī)療革命》
在醫(yī)學(xué)大數(shù)據(jù)時(shí)代,數(shù)據(jù)技術(shù)帶來了臨床醫(yī)學(xué)科研的革命性進(jìn)步?!夺t(yī)療革命》通過對醫(yī)療數(shù)據(jù)挖掘的基本理論的闡述,將現(xiàn)代統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘技術(shù)有機(jī)結(jié)合,講述了大量的醫(yī)學(xué)數(shù)據(jù)挖掘的案例,提供了大量的醫(yī)學(xué)數(shù)據(jù)挖掘的實(shí)操方法。本書以數(shù)據(jù)挖掘與模式識(shí)別的七大原理在臨床醫(yī)學(xué)中的運(yùn)用案例為切入點(diǎn),系統(tǒng)而全面地介紹了醫(yī)學(xué)數(shù)據(jù)挖掘的基本方法與原理,對數(shù)據(jù)分析的常用算法進(jìn)行了通俗易懂的講解。
作者:邵學(xué)杰,中國醫(yī)學(xué)大數(shù)據(jù)概念提出的實(shí)踐者與先行者,醫(yī)學(xué)數(shù)據(jù)挖掘的先行者
適讀人群:醫(yī)療數(shù)據(jù)挖掘愛好者、臨床研究者、 醫(yī)療大數(shù)據(jù)初學(xué)者
亮點(diǎn):
將統(tǒng)計(jì)學(xué)與醫(yī)學(xué)深度結(jié)合,首次提出醫(yī)學(xué)數(shù)據(jù)模式識(shí)別的七大原理
實(shí)操技術(shù)與案例分析相結(jié)合,起到很好的技術(shù)示范作用
六、《大數(shù)據(jù)處理之道》
市面上流行的大數(shù)據(jù)處理技術(shù)已經(jīng)有數(shù)十種了,從最初的Hadoop到Spark,再到Storm,到底哪個(gè)戰(zhàn)斗力更強(qiáng)?《大數(shù)據(jù)處理之道》分析比較了當(dāng)下流行的大數(shù)據(jù)處理技術(shù)的優(yōu)劣及適用場景,包括Hadoop、Spark、Storm、Dremel、Drill等,詳細(xì)分析了各種技術(shù)的應(yīng)用場景和優(yōu)缺點(diǎn);同時(shí)闡述了大數(shù)據(jù)下的日志分析系統(tǒng),重點(diǎn)講解了ELK日志處理方案;最后分析了大數(shù)據(jù)處理技術(shù)的發(fā)展趨勢,重點(diǎn)從各種技術(shù)的起源、設(shè)計(jì)思想、架構(gòu)等方面闡述大數(shù)據(jù)處理之道。
在日志分析方案遍地開花的大數(shù)據(jù)時(shí)代,這本書能夠幫助你更理性的做出決策。
作者:何金池, IBM高級軟件工程師,熟悉大數(shù)據(jù)領(lǐng)域內(nèi)的各項(xiàng)熱門技術(shù),具有多年的一線軟件研發(fā)測試經(jīng)驗(yàn)
適讀人群:軟件開發(fā)、大數(shù)據(jù)測試人員
亮點(diǎn):
全。幾乎涵蓋所有的大數(shù)據(jù)處理熱門技術(shù)
易懂。語言詼諧,大數(shù)據(jù)處理技術(shù)與應(yīng)用場景并在,初學(xué)者好上手,專業(yè)人士可系統(tǒng)的擴(kuò)展知識(shí)
預(yù)測。對未來新的大數(shù)據(jù)處理技術(shù)發(fā)展趨勢進(jìn)行了預(yù)測
七、《大數(shù)據(jù)基礎(chǔ)與應(yīng)用》
數(shù)據(jù)本身沒有絲毫意義,通過統(tǒng)計(jì)、分類、萃取、特征抽取等一系列技術(shù)手段才能實(shí)現(xiàn)其價(jià)值。大數(shù)據(jù)技術(shù)是實(shí)踐性比較強(qiáng)的技術(shù),需要重視工具和應(yīng)用方法的選擇與研究?!洞髷?shù)據(jù)基礎(chǔ)與應(yīng)用》作為大數(shù)據(jù)技術(shù)入門的參考書,為小白讀者提供了一次系統(tǒng)學(xué)習(xí)大數(shù)據(jù)理論知識(shí)的機(jī)會(huì)。
作者:陳明,中國計(jì)算機(jī)學(xué)會(huì)理事、中國人工智能學(xué)會(huì)理事。
適讀人群:大數(shù)據(jù)技術(shù)小白
亮點(diǎn):
基礎(chǔ)≠不重要,大數(shù)據(jù)初級必須要掌握的理論知識(shí)都在這里
各章獨(dú)立闡述,讀者可根據(jù)自己的需求,有側(cè)重的加強(qiáng)學(xué)習(xí)
八、《超越大數(shù)據(jù)》
把社交數(shù)據(jù)、移動(dòng)數(shù)據(jù)、位置數(shù)據(jù)與主數(shù)據(jù)結(jié)合起來, 可以實(shí)現(xiàn)與現(xiàn)有客戶建立更加密切的關(guān)系、采用合適的產(chǎn)品, 改進(jìn)尋找的定位新客戶的方法、更加深入地了解客戶的想法以及對產(chǎn)品的看法等,而《超越大數(shù)據(jù)》將教你如何通過社交主數(shù)據(jù)管理深入了解客戶。
作者:馬丁·奧博歐佛,企業(yè)信息架構(gòu)領(lǐng)域,面向全球大客戶的執(zhí)行架構(gòu)師
適讀人群:企業(yè)決策者、大數(shù)據(jù)架構(gòu)師
亮點(diǎn):顛覆了傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)處理
九、《爆發(fā)》
《爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維》揭開了人類行為背后隱藏的模式“爆發(fā)”,大膽的提出人類有93%的行為都是可預(yù)測的,是一本超越《黑天鵝》驚世之作。爆發(fā)模式的揭示,其影響力將與20世紀(jì)初期的物理學(xué)或者基因革命的影響力不相上下。你可以把它當(dāng)成一本歷史小說來看,也可以當(dāng)成科技讀物,社會(huì)是一個(gè)巨大的數(shù)據(jù)庫,這里所有的數(shù)據(jù)、科學(xué)以及技術(shù)都聯(lián)合起來共同對抗那個(gè)很大的謎題——我們的未來。
作者:巴拉巴西,全球復(fù)雜網(wǎng)絡(luò)研究,無尺度網(wǎng)絡(luò)的創(chuàng)立者。世界著名科技雜志《popularscience》雜志稱,“他可以控制世界”。
適讀人群:大數(shù)據(jù)愛好者、樂于探索歷史與未來的人
亮點(diǎn):
神秘色彩十足
觀點(diǎn)極具顛覆性
十、《大數(shù)據(jù)技術(shù)概論》
《大數(shù)據(jù)技術(shù)概論》全書共分成11章分別介紹了大數(shù)據(jù)概論、大數(shù)據(jù)采集及預(yù)處理、大數(shù)據(jù)分析、大數(shù)據(jù)數(shù)據(jù)可視化、Hadoop概論、HDFS和Common概論、MapReduce概論、NoSQL技術(shù)介紹、Spark概論、云計(jì)算與大數(shù)據(jù)、大數(shù)據(jù)解決方案相關(guān)案例等內(nèi)容。每一章中均附有相關(guān)術(shù)語的注釋,方便讀者查閱和自學(xué)。
作者:婁巖,海歸三年,中國醫(yī)科大學(xué)教授,IT專家,作家。
適讀人群:大數(shù)據(jù)小白、培訓(xùn)機(jī)構(gòu)、企劃管理人員
亮點(diǎn):適合自學(xué)
其實(shí),上面的書整體都是偏入門的,希望大家認(rèn)真讀完,但這對于大數(shù)據(jù)來說僅僅是杯水車薪。大數(shù)據(jù)需要的是復(fù)合型的人才,只有不斷學(xué)習(xí)新技術(shù),不斷拓展自己,方能跟上技術(shù)的腳步,不被時(shí)代變革所淘汰!別放棄,小編為大家整理了一部分的學(xué)習(xí)資源,根據(jù)需要可自行索取喲~
慧都控件網(wǎng)2017開年鉅惠,全場6折起,限時(shí)讓利,過時(shí)不候?。?!>>>
截止時(shí)間:2017年1月31日
更多大數(shù)據(jù)與分析相關(guān)行業(yè)資訊、解決方案、案例、教程等請點(diǎn)擊查看>>>
詳情請咨詢在線客服!
客服熱線:023-66090381