搭建企業(yè)級大數(shù)據(jù)分析平臺也可以很簡單!
對于大數(shù)據(jù)分析平臺的建設(shè),往往不是某個產(chǎn)品就能夠滿足,而是需要多種不同的產(chǎn)品一起搭建。例如,搭建大數(shù)據(jù)平臺需要大規(guī)模數(shù)據(jù)存儲平臺,需要數(shù)據(jù)處理和挖掘工具,分析結(jié)果需要通過展現(xiàn)工具體現(xiàn)大數(shù)據(jù)分析的價值。所以,沒有一個完善的BigData生態(tài)系統(tǒng),大數(shù)據(jù)分析平臺是搭建不起來的。
IBM作為大數(shù)據(jù)分析領(lǐng)域的領(lǐng)導(dǎo)者,有著其他廠商或開源無法比擬的完整BigData生態(tài)系統(tǒng)。下面然讓我們來看看這個生態(tài)系統(tǒng)包括哪些產(chǎn)品。
IBM Open Platform with Apache Hadoop
IOP是IBM遵循Open Data Platform Initiative 聯(lián)盟標準構(gòu)建,以開源技術(shù)為核心的產(chǎn)品包。所包含的內(nèi)容100%開源,包括HDFS、Spark、HBase、Kafka等。用戶如果想使用IOP,完全可以免費下載和使用,包括在生產(chǎn)環(huán)境上使用。在免費使用的基礎(chǔ)上,IBM還提供了有償?shù)募夹g(shù)支持。
IBM BigInsights 是實現(xiàn)IBM大數(shù)據(jù)戰(zhàn)略的重要旗艦產(chǎn)品,它包含了開源部分-即IOP,和增值部分。BigInsights增值部分則包括了BigSQL-業(yè)界最先進、最成熟的SQL on Hadoop引擎,Text Analytics-基于拖拽的文本分析工具,Big Sheet -類似電子表格的數(shù)據(jù)處理工具,BigR -適合在分布式平臺運行的R改進版本等高級功能。
IBM Streams 是一個高級流計算平臺,幫助用戶開發(fā)的應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來自數(shù)千個實時源的信息。它可處理非常高的數(shù)據(jù)吞吐率,最高可達每秒數(shù)百萬個事件或消息。Streams 旨在從一個幾分鐘到幾小時的窗口中的移動信息(數(shù)據(jù)流)中揭示有意義的模式。該平臺能夠獲取低延遲洞察,并為注重時效的應(yīng)用程序(比如欺詐檢測或網(wǎng)絡(luò)管理)獲取更好的成果,從而提供業(yè)務(wù)價值。
我們常說的SPSS包含SPSS Modeler 和SPSS Analytic Server。SPSS Modeler是一款數(shù)據(jù)挖掘分析的行業(yè)軟件,其采用數(shù)據(jù)流的方式來展示數(shù)據(jù)挖掘的操作過程,并結(jié)合CRISP-DM 工業(yè)標準打造了一個支持眾多數(shù)據(jù)挖掘操作的應(yīng)用平臺。SPSS Analytic Server是大數(shù)據(jù)分析的解決方案,它提供了一個易于實現(xiàn)的框架,從而能夠在分布式文件系統(tǒng)上來執(zhí)行大數(shù)據(jù)分析。它將IBM SPSS 現(xiàn)有的商業(yè)分析技術(shù)與大數(shù)據(jù)技術(shù)相結(jié)合,使得用戶能夠使用復(fù)雜的分析算法以高可伸縮的方式來解決基于大數(shù)據(jù)的分析問題。
Big Replicate集成了Wandisco Fusion技術(shù),為Hadoop集群實現(xiàn)數(shù)據(jù)復(fù)制和高可用方案。BigReplicate為跨任意距離的Hadoop集群提供了單一虛擬命名空間,從而打破信息孤島,實現(xiàn)Hadoop集群之間的自由、靈活數(shù)據(jù)復(fù)制。
IBM Big Integrate
Big Integrate是IBM InfoSphere Information Server(DataStage)的Hadoop版本,為大數(shù)據(jù)平臺提供企業(yè)級ETL方案。
IBM BigQuality
BigQuality采用Data Quality 引擎,為Hadoop環(huán)境提供數(shù)據(jù)分析、清洗和數(shù)據(jù)質(zhì)量監(jiān)控的功能。
IBM Big Match
Big Match使用IBM InfoSphere MDM的相同算法,幫助用戶解決Hadoop環(huán)境中跨非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的客戶身份匹配的挑戰(zhàn)。
結(jié)束語
IBM 提供了企業(yè)級Hadoop方案-BigInsights,而且提供了完善的生態(tài)系統(tǒng),為用戶建設(shè)大數(shù)據(jù)平臺提供完整的產(chǎn)品支持。
更多大數(shù)據(jù)與分析相關(guān)行業(yè)資訊、解決方案、案例、教程等請點擊查看>>>
詳情請咨詢在線客服!
客服熱線:023-66090381