收藏 | 史上最全的“大數(shù)據(jù)”學(xué)習(xí)資源(上)
當(dāng)前,整個(gè)互聯(lián)網(wǎng)正在從IT時(shí)代向DT時(shí)代演進(jìn),大數(shù)據(jù)技術(shù)也正在助力企業(yè)和公眾敲開DT世界大門。當(dāng)今“大數(shù)據(jù)”一詞的重點(diǎn)其實(shí)已經(jīng)不僅在于數(shù)據(jù)規(guī)模的定義,它更代表著信息技術(shù)發(fā)展進(jìn)入了一個(gè)新的時(shí)代,代表著爆炸性的數(shù)據(jù)信息給傳統(tǒng)的計(jì)算技術(shù)和信息技術(shù)帶來的技術(shù)挑戰(zhàn)和困難,代表著大數(shù)據(jù)處理所需的新的技術(shù)和方法,也代表著大數(shù)據(jù)分析和應(yīng)用所帶來的新發(fā)明、新服務(wù)和新的發(fā)展機(jī)遇。
為了幫助大家更好深入了解大數(shù)據(jù),云棲社區(qū)組織翻譯了GitHub Awesome Big Data資源,供大家參考。本資源類型主要包括:大數(shù)據(jù)框架、論文等實(shí)用資源集合。
資源列表:
- 關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)
- 框架
- 分布式編程
- 分布式文件系統(tǒng)
- 文件數(shù)據(jù)模型
- Key -Map 數(shù)據(jù)模型
- 鍵-值數(shù)據(jù)模型
- 圖形數(shù)據(jù)模型
- NewSQL數(shù)據(jù)庫
- 列式數(shù)據(jù)庫
- 時(shí)間序列數(shù)據(jù)庫
- 類SQL處理
- 數(shù)據(jù)攝取
- 服務(wù)編程
- 調(diào)度
- 機(jī)器學(xué)習(xí)
- 基準(zhǔn)測試
- 安全性
- 系統(tǒng)部署
- 應(yīng)用程序
- 搜索引擎與框架
- MySQL的分支和演化
- PostgreSQL的分支和演化
- Memcached的分支和演化
- 嵌入式數(shù)據(jù)庫
- 商業(yè)智能
- 數(shù)據(jù)可視化
- 物聯(lián)網(wǎng)和傳感器
- 文章
- 論文
- 視頻
關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)
框架
- Apache Hadoop:分布式處理架構(gòu),結(jié)合了 MapReduce(并行處理)、YARN(作業(yè)調(diào)度)和HDFS(分布式文件系統(tǒng));
- Tigon:高吞吐量實(shí)時(shí)流處理框架。
分布式編程
分布式文件系統(tǒng)
文件數(shù)據(jù)模型
Key Map 數(shù)據(jù)模型
注意:業(yè)內(nèi)存在一些術(shù)語混亂,有兩個(gè)不同的東西都叫做“列式數(shù)據(jù)庫”。這里列出的有一些是圍繞“key-map”數(shù)據(jù)模型而建的分布式、持續(xù)型數(shù)據(jù)庫,其中所有的數(shù)據(jù)都有(可能綜合了)鍵,并與映射中的鍵-值對(duì)相關(guān)聯(lián)。在一些系統(tǒng)中,多個(gè)這樣的值映射可以與鍵相關(guān)聯(lián),并且這些映射被稱為“列族”(具有映射值的鍵被稱為“列”)。
另一組也可稱為“列式數(shù)據(jù)庫”的技術(shù)因其存儲(chǔ)數(shù)據(jù)的方式而有別于前一組,它在磁盤上或在存儲(chǔ)器中——而不是以傳統(tǒng)方式,即所有既定鍵的鍵值都相鄰著、逐行存儲(chǔ)。這些系統(tǒng)也彼此相鄰來存儲(chǔ)所有列值,但是要得到給定列的所有值卻不需要以前那么繁復(fù)的工作。
鍵-值數(shù)據(jù)模型
- Aerospike:支持NoSQL的閃存優(yōu)化,數(shù)據(jù)存儲(chǔ)在內(nèi)存。開源,“'C'(不是Java或Erlang)中的服務(wù)器代碼可精確地調(diào)整從而避免上下文切換和內(nèi)存拷貝”。
- Amazon DynamoDB:分布式鍵/值存儲(chǔ),Dynamo論文的實(shí)現(xiàn);
- Edis:為替代Redis的協(xié)議兼容的服務(wù)器;
- ElephantDB:專門研究Hadoop中數(shù)據(jù)導(dǎo)出的分布式數(shù)據(jù)庫;
- EventStore:分布式時(shí)間序列數(shù)據(jù)庫;
- GridDB:適用于存儲(chǔ)在時(shí)間序列中的傳感器數(shù)據(jù);
- LinkedIn Krati:簡單的持久性數(shù)據(jù)存儲(chǔ),擁有低延遲和高吞吐量;
- Linkedin Voldemort:分布式鍵/值存儲(chǔ)系統(tǒng);
- Oracle NoSQL Database:Oracle公司開發(fā)的分布式鍵值數(shù)據(jù)庫;
- Redis:內(nèi)存中的鍵值數(shù)據(jù)存儲(chǔ);
- Riak:分散式數(shù)據(jù)存儲(chǔ);
- Storehaus:Twitter開發(fā)的異步鍵值存儲(chǔ)的庫;
- Tarantool:一個(gè)高效的NoSQL數(shù)據(jù)庫和Lua應(yīng)用服務(wù)器;
- TiKV:由Google Spanner和HBase授權(quán),Rust提供技術(shù)支持的分布式鍵值數(shù)據(jù)庫;
- TreodeDB:可復(fù)制、共享的鍵-值存儲(chǔ),能提供多行原子寫入。
圖形數(shù)據(jù)模型
NewSQL數(shù)據(jù)庫
|
更多大數(shù)據(jù)與分析相關(guān)行業(yè)資訊、解決方案、案例、教程等請(qǐng)點(diǎn)擊查看>>>
詳情請(qǐng)咨詢在線客服!
客服熱線:023-66090381