<menu id="w2i4a"></menu>

Hadoop教程

文檔首頁>>Hadoop教程>>Hadoop教程：談百度是如何使用hadoop的，并做了哪些改進

Hadoop教程：談百度是如何使用hadoop的，并做了哪些改進

百度作為全球最大的中文搜索引擎公司，提供基于搜索引擎的各種產(chǎn)品，幾乎覆蓋了中文網(wǎng)絡(luò)世界中所有的搜索需求,因此，百度對海量數(shù)據(jù)處理的要求是比較高的，要在線下對數(shù)據(jù)進行分析，還要在規(guī)定的時間內(nèi)處理完并反饋到平臺上。百度在互聯(lián)網(wǎng)領(lǐng)域的平臺需求要通過性能較好的云平臺進行處理了，Hadoop就是很好的選擇。在百度，Hadoop主要應(yīng)用于以下幾個方面：

日志的存儲和統(tǒng)計;
網(wǎng)頁數(shù)據(jù)的分析和挖掘;
商業(yè)分析，如用戶的行為和廣告關(guān)注度等;
在線數(shù)據(jù)的反饋，及時得到在線廣告的點擊情況;
用戶網(wǎng)頁的聚類，分析用戶的推薦度及用戶之間的關(guān)聯(lián)度。

MapReduce主要是一種思想，不能解決所有領(lǐng)域內(nèi)與計算有關(guān)的問題，百度的研究人員認為比較好的模型應(yīng)該如下圖:

HDFS 實現(xiàn)共享存儲，一些計算使用MapReduce解決，一些計算使用MPI解決，而還有一些計算需要通過兩者來共同處理。因為MapReduce適合處理數(shù) 據(jù)很大且適合劃分的數(shù)據(jù)，所以在處理這類數(shù)據(jù)時就可以用MapReduce做一些過濾，得到基本的向量矩陣，然后通過MPI進一步處理后返回結(jié)果，只有整合技術(shù)才能更好地解決問題。

百度現(xiàn)在擁有3個Hadoop集群，總規(guī)模在700臺機器左右，其中有100多臺新機器和600多臺要淘汰的機器(它們的計算能力相當于200多臺新機器)，不過其規(guī)模還在不斷的增加中?，F(xiàn)在每天運行的MapReduce任務(wù)在3000個左右，處理數(shù)據(jù)約120TB/天。

百度為了更好地用Hadoop進行數(shù)據(jù)處理，在以下幾個方面做了改進和調(diào)整：

(1)調(diào)整MapReduce策略

限制作業(yè)處于運行狀態(tài)的任務(wù)數(shù);

調(diào)整預(yù)測執(zhí)行策略，控制預(yù)測執(zhí)行量，一些任務(wù)不需要預(yù)測執(zhí)行;

根據(jù)節(jié)點內(nèi)存狀況進行調(diào)度;

平衡中間結(jié)果輸出，通過壓縮處理減少I/O負擔(dān)。

（2）改進HDFS的效率和功能

權(quán)限控制，在PB級數(shù)據(jù)量的集群上數(shù)據(jù)應(yīng)該是共享的，這樣分析起來比較容易，但是需要對權(quán)限進行限制;

讓分區(qū)與節(jié)點獨立，這樣，一個分區(qū)壞掉后節(jié)點上的其他分區(qū)還可以正常使用;

修改DSClient選取塊副本位置的策略，增加功能使DFSClient選取塊時跳過出錯的DataNode;

解決VFS(Virtual File System)的POSIX(Portable Operating System Interface of Unix)兼容性問題。

（3）修改Speculative的執(zhí)行策略

采用速率倒數(shù)替代速率，防止數(shù)據(jù)分布不均時經(jīng)常不能啟動預(yù)測執(zhí)行情況的發(fā)生;

增加任務(wù)時必須達到某個百分比后才能啟動預(yù)測執(zhí)行的限制，解決reduce運行等待map數(shù)據(jù)的時間問題;

只有一個map或reduce時，可以直接啟動預(yù)測執(zhí)行。

（4）對資源使用進行控制

對應(yīng)用物理內(nèi)存進行控制。如果內(nèi)存使用過多會導(dǎo)致操作系統(tǒng)跳過一些任務(wù)，百度通過修改Linux內(nèi)核對進程使用的物理內(nèi)存進行獨立的限制，超過閾值可以終止進程。

分組調(diào)度計算資源，實現(xiàn)存儲共享、計算獨立，在Hadoop中運行的進程是不可搶占的。

在大塊文件系統(tǒng)中，X86平臺下一個頁的大小是4KB。如果頁較小，管理的數(shù)據(jù)就會很多，會增加數(shù)據(jù)操作的代價并影響計算效率，因此需要增加頁的大小。

百度在使用Hadoop時也遇到了一些問題，主要有：

MapReduce的效率問題：比如，如何在shuffle效率方面減少I/O次數(shù)以提高并行效率;如何在排序效率方面設(shè)置排序為可配置的，因為排序過程會浪費很多的計算資源，而一些情況下是不需要排序的。
HDFS的效率和可靠性問題：如何提高隨機訪問效率，以及數(shù)據(jù)寫入的實時性問題，如果Hadoop每寫一條日志就在HDFS上存儲一次，效率會很低。
內(nèi)存使用的問題：reducer端的shuffle會頻繁地使用內(nèi)存，這里采用類似Linux的buddy system來解決，保證Hadoop用最小的開銷達到最高的利用率;當Java 進程內(nèi)容使用內(nèi)存較多時，可以調(diào)整垃圾回收(GC)策略;有時存在大量的內(nèi)存復(fù)制現(xiàn)象，這會消耗大量CPU資源，同時還會導(dǎo)致內(nèi)存使用峰值極高，這時需要減少內(nèi)存的復(fù)制。
作業(yè)調(diào)度的問題：如何限制任務(wù)的map和reduce計算單元的數(shù)量，以確保重要計算可以有足夠的計算單元;如何對TaskTracker進行分組控制，以限制作業(yè)執(zhí)行的機器，同時還可以在用戶提交任務(wù)時確定執(zhí)行的分組并對分組進行認證。
性能提升的問題：UserLogs cleanup在每次task結(jié)束的時候都要查看一下日志，以決定是否清除，這會占用一定的任務(wù)資源，可以通過將清理線程從子Java進程移到 TaskTracker來解決;子Java進程會對文本行進行切割而map和reduce進程則會重新切割，這將造成重復(fù)處理，這時需要關(guān)掉Java進程的切割功能;在排序的時候也可以實現(xiàn)并行排序來提升性能;實現(xiàn)對數(shù)據(jù)的異步讀寫也可以提升性能。
健壯性的問題：需要對mapper和reducer程序的內(nèi)存消耗進行限制，這就要修改Linux內(nèi)核，增加其限制進程的物理內(nèi)存的功能;也可以通過多個map 程序共享一塊內(nèi)存，以一定的代價減少對物理內(nèi)存的使用;還可以將DataNode和TaskTracker的UGI配置為普通用戶并設(shè)置賬號密碼;或者讓 DataNode和TaskTracker分賬號啟動，確保HDFS數(shù)據(jù)的安全性，防止Tracker操作DataNode中的內(nèi)容;在不能保證用戶的每個程序都很健壯的情況下，有時需要將進程終止掉，但要保證父進程終止后子進程也被終止。
Streaming 局限性的問題：比如，只能處理文本數(shù)據(jù)，mapper和reducer按照文本行的協(xié)議通信，無法對二進制的數(shù)據(jù)進行簡單處理。為了解決這個問題，百度人員新寫了一個類Bistreaming(Binary Streaming)，這里的子Java進程mapper和reducer按照(KeyLen，Key，ValLen，Value)的方式通信，用戶可以按照這個協(xié)議編寫程序。
用戶認證的問題：這個問題的解決辦法是讓用戶名、密碼、所屬組都在NameNode和Job Tracker上集中維護，用戶連接時需要提供用戶名和密碼，從而保證數(shù)據(jù)的安全性。

百度下一步的工作重點可能主要會涉及以下內(nèi)容：

內(nèi)存方面，降低NameNode的內(nèi)存使用并研究JVM的內(nèi)存管理;
調(diào)度方面，改進任務(wù)可以被搶占的情況，同時開發(fā)出自己的基于Capacity的作業(yè)調(diào)度器，讓等待作業(yè)隊列具有優(yōu)先級且隊列中的作業(yè)可以設(shè)置Capacity，并可以支持TaskTracker分組;
壓縮算法，選擇較好的方法提高壓縮比、減少存儲容量，同時選取高效率的算法以進行shuffle數(shù)據(jù)的壓縮和解壓;對mapper程序和reducer程序使用的資源進行控制，防止過度消耗資源導(dǎo)致機器死機。以前是通過修改Linux內(nèi)核來進行控制的，現(xiàn)在考慮通過在Linux中引入cgroup來對 mapper和reducer使用的資源進行控制;將DataNode的并發(fā)數(shù)據(jù)讀寫方式由多線程改為select方式，以支持大規(guī)模并發(fā)讀寫和 Hypertable的應(yīng)用。

百度同時也在使用Hypertable，它是以Google發(fā)布的BigTable為基礎(chǔ)的開源分布式數(shù)據(jù)存儲系統(tǒng)，百度將它作為分析用戶行為的平臺，同時在元數(shù)據(jù)集中化、內(nèi)存占用優(yōu)化、集群安全停機、故障自動恢復(fù)等方面做了一些改進。

來源：開源中國作者：MrMichael

慧都科技版權(quán)所有 Copyright 2003-2024 渝ICP備12000582號-13 渝公網(wǎng)安備 50010702500608號本站由提供CDN加速/云存儲服務(wù)

掃碼咨詢

添加微信立即咨詢

電話咨詢

客服熱線
023-68661681

TOP

三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();