• <menu id="w2i4a"></menu>
  • Apache Flume授權(quán)購買
    下載:92 收藏:0

    Apache Flume (產(chǎn)品編號:13963)

    一個高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)

    標簽:大數(shù)據(jù)開源數(shù)據(jù)分析

    開發(fā)商: Apache

    當前版本: 1.7.0

    產(chǎn)品類型:開源

    產(chǎn)品功能:大數(shù)據(jù)分析工具

    平臺語言:

    開源水平:不提供源碼

    本產(chǎn)品的分類與介紹僅供參考,具體以商家網(wǎng)站介紹為準,如有疑問請來電 023-68661681 咨詢。

    Flume是Cloudera提供的一個高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng),F(xiàn)lume支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù);同時,F(xiàn)lume提供對數(shù)據(jù)進行簡單處理,并寫到各種數(shù)據(jù)接受方(可定制)的能力。

    產(chǎn)品質(zhì)量分析及預測

    * 關(guān)于本產(chǎn)品的分類與介紹僅供參考,精準產(chǎn)品資料以官網(wǎng)介紹為準,如需購買請先行測試。

    Hadoop業(yè)務(wù)的整體開發(fā)流程:

    ce699fd02d334071be2be48da5b46736o.jpg

    從Hadoop的業(yè)務(wù)開發(fā)流程圖中可以看出,在大數(shù)據(jù)的業(yè)務(wù)處理過程中,對于數(shù)據(jù)的采集是十分重要的一步,也是不可避免的一步,從而引出我們本文的主角—Flume。本文將圍繞Flume的架構(gòu)、Flume的應用(日志采集)進行詳細的介紹。

    Flume架構(gòu)介紹

    1、Flume的概念

    fb5cb1df24684acebb92c1e4d62d1af6o.jpg

    flume是分布式的日志收集系統(tǒng),它將各個服務(wù)器中的數(shù)據(jù)收集起來并送到指定的地方去,比如說送到圖中的HDFS,簡單來說flume就是收集日志的。

    2、Event的概念

    在這里有必要先介紹一下flume中event的相關(guān)概念:flume的核心是把數(shù)據(jù)從數(shù)據(jù)源(source)收集過來,在將收集到的數(shù)據(jù)送到指定的目的地(sink)。為了保證輸送的過程一定成功,在送到目的地(sink)之前,會先緩存數(shù)據(jù)(channel),待數(shù)據(jù)真正到達目的地(sink)后,flume在刪除自己緩存的數(shù)據(jù)。 在整個數(shù)據(jù)的傳輸?shù)倪^程中,流動的是event,即事務(wù)保證是在event級別進行的。那么什么是event呢?—–event將傳輸?shù)臄?shù)據(jù)進行封裝,是flume傳輸數(shù)據(jù)的基本單位,如果是文本文件,通常是一行記錄,event也是事務(wù)的基本單位。event從source,流向channel,再到sink,本身為一個字節(jié)數(shù)組,并可攜帶headers(頭信息)信息。event代表著一個數(shù)據(jù)的最小完整單元,從外部數(shù)據(jù)源來,向外部的目的地去。

    3、flume架構(gòu)介紹

    flume之所以這么神奇,是源于它自身的一個設(shè)計,這個設(shè)計就是agent,agent本身是一個Java進程,運行在日志收集節(jié)點—所謂日志收集節(jié)點就是服務(wù)器節(jié)點。

    agent里面包含3個核心的組件:source—->channel—–>sink,類似生產(chǎn)者、倉庫、消費者的架構(gòu)。

    source:source組件是專門用來收集數(shù)據(jù)的,可以處理各種類型、各種格式的日志數(shù)據(jù),包括avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy、自定義。

    channel:source組件把數(shù)據(jù)收集來以后,臨時存放在channel中,即channel組件在agent中是專門用來存放臨時數(shù)據(jù)的——對采集到的數(shù)據(jù)進行簡單的緩存,可以存放在memory、jdbc、file等等。

    sink:sink組件是用于把數(shù)據(jù)發(fā)送到目的地的組件,目的地包括hdfs、logger、avro、thrift、ipc、file、null、Hbase、solr、自定義。

    4、flume的運行機制

    flume的核心就是一個agent,這個agent對外有兩個進行交互的地方,一個是接受數(shù)據(jù)的輸入——source,一個是數(shù)據(jù)的輸出sink,sink負責將數(shù)據(jù)發(fā)送到外部指定的目的地。source接收到數(shù)據(jù)之后,將數(shù)據(jù)發(fā)送給channel,chanel作為一個數(shù)據(jù)緩沖區(qū)會臨時存放這些數(shù)據(jù),隨后sink會將channel中的數(shù)據(jù)發(fā)送到指定的地方—-例如HDFS等,注意:只有在sink將channel中的數(shù)據(jù)成功發(fā)送出去之后,channel才會將臨時數(shù)據(jù)進行刪除,這種機制保證了數(shù)據(jù)傳輸?shù)目煽啃耘c安全性。

    5、flume的廣義用法

    flume之所以這么神奇—-其原因也在于flume可以支持多級flume的agent,即flume可以前后相繼,例如sink可以將數(shù)據(jù)寫到下一個agent的source中,這樣的話就可以連成串了,可以整體處理了。flume還支持扇入(fan-in)、扇出(fan-out)。所謂扇入就是source可以接受多個輸入,所謂扇出就是sink可以將數(shù)據(jù)輸出多個目的地destination中。

    flume應用—日志采集

    對于flume的原理其實很容易理解,我們更應該掌握flume的具體使用方法,flume提供了大量內(nèi)置的Source、Channel和Sink類型。而且不同類型的Source、Channel和Sink可以自由組合—–組合方式基于用戶設(shè)置的配置文件,非常靈活。比如:Channel可以把事件暫存在內(nèi)存里,也可以持久化到本地硬盤上。Sink可以把日志寫入HDFS, HBase,甚至是另外一個Source等等。下面我將用具體的案例詳述flume的具體用法。

    其實flume的用法很簡單—-書寫一個配置文件,在配置文件當中描述source、channel與sink的具體實現(xiàn),而后運行一個agent實例,在運行agent實例的過程中會讀取配置文件的內(nèi)容,這樣flume就會采集到數(shù)據(jù)。

    更新時間:2017-04-28 14:23:13.000 | 錄入時間:2017-04-28 14:21:24.000 | 責任編輯:陳俊吉

    相關(guān)產(chǎn)品
    控件
  • 產(chǎn)品功能:大數(shù)據(jù)分析工具
  • 源 碼:非開源
  • 產(chǎn)品編號:12633
  • 當前版本:v1.74.0 [銷售以商家最新版為準,如需其他版本,請來電咨詢]
  • 開 發(fā) 商: RadarSoft 正式授權(quán)
  • ">RadarCube WPF (OLAP Grid & OLAP Chart)

    WPF BI商業(yè)智能應用程序的最佳選擇,具有功能強大、運行速度快、靈活性佳的優(yōu)點。

    軟件
  • 產(chǎn)品功能:大數(shù)據(jù)分析工具
  • 源 碼:非開源
  • 產(chǎn)品編號:14216
  • 當前版本:v2020.4.1 [銷售以商家最新版為準,如需其他版本,請來電咨詢]
  • 開 發(fā) 商: Tableau 正式授權(quán)
  • ">Tableau Prep

    Tableau Prep是一款數(shù)據(jù)準備產(chǎn)品,可幫助您組合,整理和清理數(shù)據(jù)以進行分析。

    軟件
  • 產(chǎn)品功能:大數(shù)據(jù)分析工具
  • 源 碼:非開源
  • 產(chǎn)品編號:14037
  • 當前版本:v2020.4.0 [銷售以商家最新版為準,如需其他版本,請來電咨詢]
  • 開 發(fā) 商: Tableau 正式授權(quán)
  • ">Tableau Desktop

    只需數(shù)分鐘,就可以創(chuàng)建美觀,內(nèi)容豐富的交互式數(shù)據(jù)可視化。

    軟件
  • 產(chǎn)品功能:大數(shù)據(jù)分析工具
  • 源 碼:非開源
  • 產(chǎn)品編號:14220
  • 當前版本:v2020 [銷售以商家最新版為準,如需其他版本,請來電咨詢]
  • 開 發(fā) 商: Minitab 正式授權(quán)
  • ">Minitab Statistical Software

    可視化、分析并挖掘數(shù)據(jù)價值的統(tǒng)計軟件,幫助人們掌握數(shù)據(jù)的強大力量

    控件
  • 產(chǎn)品功能:大數(shù)據(jù)分析工具
  • 源 碼:非開源
  • 產(chǎn)品編號:14329
  • 當前版本:v2022.06 [銷售以商家最新版為準,如需其他版本,請來電咨詢]
  • 開 發(fā) 商: Vizlib 正式授權(quán)
  • ">Vizlib Library

    Vizlib Library是一個不斷增長的強大可視化集合,它可以在不需要一行代碼的情況下重新定義Q

    掃碼咨詢


    添加微信 立即咨詢

    電話咨詢

    客服熱線
    023-68661681

    TOP
    三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();