• <menu id="w2i4a"></menu>
  • logo 大數(shù)據(jù)干貨(一)

    文檔首頁>>大數(shù)據(jù)干貨(一)>>分布式文件系統(tǒng)HDFS解析

    分布式文件系統(tǒng)HDFS解析


    Hadoop 主要由HDFS和MapReduce 引擎兩部分組成。最底部是HDFS,它存儲Hadoop 集群中所有存儲節(jié)點上的文件。HDFS 的上一層是MapReduce 引擎,該引擎由JobTrackers 和TaskTrackers組成。        

    一、HDFS基本概念

    1、數(shù)據(jù)塊

    HDFS默認的最基本的存儲單位是64M的數(shù)據(jù)塊,這個數(shù)據(jù)塊可以理解和一般的文件里面的分塊是一樣的,不同于普通文件系統(tǒng)的是,HDFS中,如果一個文件小于一個數(shù)據(jù)塊的大小,那么并不占用整個數(shù)據(jù)塊存儲空間。

    2、元數(shù)據(jù)節(jié)點和數(shù)據(jù)節(jié)點

    元數(shù)據(jù)節(jié)點是用來管理文件系統(tǒng)的命名空間,它將所有的文件和文件夾的元數(shù)據(jù)保存在一個文件系統(tǒng)樹中。  數(shù)據(jù)節(jié)點是用來存儲數(shù)據(jù)文件的。  從元數(shù)據(jù)節(jié)點(secondarynamenode)不是我們所想象的元數(shù)據(jù)節(jié)點的備用節(jié)點,其實它主要的功能是主要功能就是周期性將元數(shù)據(jù)節(jié)點的命名空間鏡像文件和修改日志合并,以防日志文件過大。

    3、HDFS中的數(shù)據(jù)流

    讀文件

    客戶端(client)用FileSystem的open()函數(shù)打開文件,DistributedFileSystem用RPC調(diào)用元數(shù)據(jù)節(jié)點,得到文件的數(shù)據(jù)塊信息。對于每一個數(shù)據(jù)塊,元數(shù)據(jù)節(jié)點返回保存數(shù)據(jù)塊的數(shù)據(jù)節(jié)點的地址。DistributedFileSystem返回FSDataInputStream給客戶端,用來讀取數(shù)據(jù)。客戶端調(diào)用stream的read()函數(shù)開始讀取數(shù)據(jù)。DFSInputStream連接保存此文件第一個數(shù)據(jù)塊的最近的數(shù)據(jù)節(jié)點。Data從數(shù)據(jù)節(jié)點讀到客戶端(client),當此數(shù)據(jù)塊讀取完畢時,DFSInputStream關閉和此數(shù)據(jù)節(jié)點的連接,然后連接此文件下一個數(shù)據(jù)塊的最近的數(shù)據(jù)節(jié)點。當客戶端讀取完畢數(shù)據(jù)的時候,調(diào)用FSDataInputStream的close函數(shù)。

    整個過程如圖所示:

    HDFS學習

    寫文件

    客戶端調(diào)用create()來創(chuàng)建文件,DistributedFileSystem用RPC調(diào)用元數(shù)據(jù)節(jié)點,在文件系統(tǒng)的命名空間中創(chuàng)建一個新的文件。元數(shù)據(jù)節(jié)點首先確定文件原來不存在,并且客戶端有創(chuàng)建文件的權(quán)限,然后創(chuàng)建新文件。DistributedFileSystem返回DFSOutputStream,客戶端用于寫數(shù)據(jù)??蛻舳碎_始寫入數(shù)據(jù),DFSOutputStream將數(shù)據(jù)分成塊,寫入data queue。Data queue由Data Streamer讀取,并通知元數(shù)據(jù)節(jié)點分配數(shù)據(jù)節(jié)點,用來存儲數(shù)據(jù)塊(每塊默認復制3塊)。分配的數(shù)據(jù)節(jié)點放在一個pipeline里。Data Streamer將數(shù)據(jù)塊寫入pipeline中的第一個數(shù)據(jù)節(jié)點。第一個數(shù)據(jù)節(jié)點將數(shù)據(jù)塊發(fā)送給第二個數(shù)據(jù)節(jié)點。第二個數(shù)據(jù)節(jié)點將數(shù)據(jù)發(fā)送給第三個數(shù)據(jù)節(jié)點。DFSOutputStream為發(fā)出去的數(shù)據(jù)塊保存了ack queue,等待pipeline中的數(shù)據(jù)節(jié)點告知數(shù)據(jù)已經(jīng)寫入成功。如果數(shù)據(jù)節(jié)點在寫入的過程中失?。宏P閉pipeline,將ack queue中的數(shù)據(jù)塊放入data queue的開始。

    整個過程如圖所示:

    HDFS學習

    二、HDFS的優(yōu)缺點

    2.1 HDFS的優(yōu)點

    1)處理超大文件

    這里的超大文件通常是指百MB、設置數(shù)百TB大小的文件。目前在實際應用中,HDFS已經(jīng)能用來存儲管理PB級的數(shù)據(jù)了。

    2)流式的訪問數(shù)據(jù)

    HDFS的設計建立在更多地響應"一次寫入、多次讀寫"任務的基礎上。這意味著一個數(shù)據(jù)集一旦由數(shù)據(jù)源生成,就會被復制分發(fā)到不同的存儲節(jié)點中,然后響應各種各樣的數(shù)據(jù)分析任務請求。在多數(shù)情況下,分析任務都會涉及數(shù)據(jù)集中的大部分數(shù)據(jù),也就是說,對HDFS來說,請求讀取整個數(shù)據(jù)集要比讀取一條記錄更加高效。

    3)運行于廉價的商用機器集群上

    Hadoop設計對硬件需求比較低,只須運行在低廉的商用硬件集群上,而無需昂貴的高可用性機器上。廉價的商用機也就意味著大型集群中出現(xiàn)節(jié)點故障情況的概率非常高。這就要求設計HDFS時要充分考慮數(shù)據(jù)的可靠性,安全性及高可用性。

    2.2 HDFS的缺點

    1)不適合低延遲數(shù)據(jù)訪問

    如果要處理一些用戶要求時間比較短的低延遲應用請求,則HDFS不適合。HDFS是為了處理大型數(shù)據(jù)集分析任務的,主要是為達到高的數(shù)據(jù)吞吐量而設計的,這就可能要求以高延遲作為代價。

    改進策略:對于那些有低延時要求的應用程序,HBase是一個更好的選擇。通過上層數(shù)據(jù)管理項目來盡可能地彌補這個不足。在性能上有了很大的提升,它的口號就是goes real time。使用緩存或多master設計可以降低client的數(shù)據(jù)請求壓力,以減少延時。還有就是對HDFS系統(tǒng)內(nèi)部的修改,這就得權(quán)衡大吞吐量與低延時了,HDFS不是萬能的銀彈。

    2)無法高效存儲大量小文件

    因為Namenode把文件系統(tǒng)的元數(shù)據(jù)放置在內(nèi)存中,所以文件系統(tǒng)所能容納的文件數(shù)目是由Namenode的內(nèi)存大小來決定。一般來說,每一個文件、文件夾和Block需要占據(jù)150字節(jié)左右的空間,所以,如果你有100萬個文件,每一個占據(jù)一個Block,你就至少需要300MB內(nèi)存。當前來說,數(shù)百萬的文件還是可行的,當擴展到數(shù)十億時,對于當前的硬件水平來說就沒法實現(xiàn)了。還有一個問題就是,因為Map task的數(shù)量是由splits來決定的,所以用MR處理大量的小文件時,就會產(chǎn)生過多的Maptask,線程管理開銷將會增加作業(yè)時間。舉個例子,處理10000M的文件,若每個split為1M,那就會有10000個Maptasks,會有很大的線程開銷;若每個split為100M,則只有100個Maptasks,每個Maptask將會有更多的事情做,而線程的管理開銷也將減小很多。

    改進策略:要想讓HDFS能處理好小文件,有不少方法。

    利用SequenceFile、MapFile、Har等方式歸檔小文件,這個方法的原理就是把小文件歸檔起來管理,HBase就是基于此的。對于這種方法,如果想找回原來的小文件內(nèi)容,那就必須得知道與歸檔文件的映射關系。

    橫向擴展,一個Hadoop集群能管理的小文件有限,那就把幾個Hadoop集群拖在一個虛擬服務器后面,形成一個大的Hadoop集群。google也是這么干過的。

    多Master設計,這個作用顯而易見了。正在研發(fā)中的GFS II也要改為分布式多Master設計,還支持Master的Failover,而且Block大小改為1M,有意要調(diào)優(yōu)處理小文件啊。

    附帶個Alibaba DFS的設計,也是多Master設計,它把Metadata的映射存儲和管理分開了,由多個Metadata存儲節(jié)點和一個查詢Master節(jié)點組成。

    3)不支持多用戶寫入及任意修改文件

    在HDFS的一個文件中只有一個寫入者,而且寫操作只能在文件末尾完成,即只能執(zhí)行追加操作。目前HDFS還不支持多個用戶對同一文件的寫操作,以及在文件任意位置進行修改。

    掃碼咨詢


    添加微信 立即咨詢

    電話咨詢

    客服熱線
    023-68661681

    TOP
    三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();