<menu id="w2i4a"></menu>

慧都大數(shù)據(jù)（二）

文檔首頁>>慧都大數(shù)據(jù)（二）>>IBM SPSS Modeler數(shù)據(jù)庫內(nèi)建模

IBM SPSS Modeler數(shù)據(jù)庫內(nèi)建模

IBM SPSS Modeler Server支持對數(shù)據(jù)庫供應(yīng)商的數(shù)據(jù)挖掘工具和建模工具進(jìn)行整合，其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。實(shí)現(xiàn)了在IBM SPSS Modeler的分析功能和易用性將與數(shù)據(jù)庫的功能和性能相結(jié)合，同時還兼?zhèn)鋽?shù)據(jù)庫供應(yīng)商提供的數(shù)據(jù)庫自有算法。模型在數(shù)據(jù)庫創(chuàng)建，然后可以借助IBM SPSS Modeler界面以正常方式瀏覽模型并為之評分。

那么使用IBM SPSS Modeler訪問數(shù)據(jù)庫自有算法有什么優(yōu)勢呢？主要是兩方面：

1.數(shù)據(jù)庫內(nèi)的算法常常與數(shù)據(jù)庫服務(wù)器緊密集成，這有助于提高性能。

2.在“數(shù)據(jù)庫內(nèi)”構(gòu)建和存儲的模型不僅由可訪問數(shù)據(jù)庫的應(yīng)用程序共享，且更易于在這些應(yīng)用程序中部署。

接下來我們以Microsoft Analytics Services為例，介紹如何配置以及使用數(shù)據(jù)庫內(nèi)建模功能。

IBM SPSS Modeler支持集成下列Analysis Services算法包括：

決策樹
聚類
關(guān)聯(lián)規(guī)則
樸素貝葉斯
線性回歸
神經(jīng)網(wǎng)絡(luò)
Logistic回歸
時間序列
序列聚類

安裝與配置：

在您的機(jī)器上，必須安裝以下模塊：

IBM SPSS Modeler Client
IBM SPSS Modeler Server
Microsoft Analysis Services,與相應(yīng)數(shù)據(jù)庫建立ODBC連接

1. 配置IBM SPSS Modeler：

在IBM SPSS Modeler中，在菜單欄的工具-->選項(xiàng)-->幫助應(yīng)用程序，選擇Microsoft面板，如下圖：

spss

勾上之后，會在下面的面板節(jié)點(diǎn)上多了一項(xiàng)數(shù)據(jù)庫建模，列出了Microsoft Analysis Services支持的數(shù)據(jù)庫內(nèi)建模算法，如下圖：

spss

2. 配置 SQL Server

該配置可實(shí)現(xiàn)在數(shù)據(jù)庫內(nèi)進(jìn)行評分。

在 SQL Server 主機(jī)上創(chuàng)建以下注冊表鍵：

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP

為該鍵添加如下 DWORD 鍵值：

AllowInProcess 1

完成上述更改后，重新啟動SQL Server。

3. 配置Microsoft Analysis Services

建立IBM SPSS Modeler 與Microsoft Analysis Services 進(jìn)行通信。

通過MS SQL Server Management Studio 登錄到分析服務(wù)器。

訪問“屬性”對話框，右鍵單擊服務(wù)器名稱，然后選擇屬性。

選中顯示高級（所有）屬性復(fù)選框。

更改以下屬性：

將 DataMining\AllowAdHocOpenRowsetQueries 的值更改為 True（缺省值為False）。

將 DataMining\AllowProvidersInOpenRowset 的值更改為 [all] （無缺省值）。

4. 為SQL Server 創(chuàng)建 ODBC DSN

通過使用 Microsoft SQL Native Client ODBC 驅(qū)動程序，創(chuàng)建一個指向數(shù)據(jù)挖掘過程中使用的 SQL Server 數(shù)據(jù)庫的 ODBC DSN。余下的驅(qū)動程序設(shè)置應(yīng)使用缺省設(shè)置。

對于此DSN，請確保選中了使用集成的 Windows 認(rèn)證。

5. 啟用 SQL 生成和優(yōu)化

從IBM SPSS Modeler菜單中選擇：工具—>流屬性—>選項(xiàng)—>優(yōu)化面板，勾選上所有選項(xiàng)內(nèi)容如下圖：

spss

使用Microsoft Analysis Services 算法生成模型

以上內(nèi)容配置完成后，即可使用數(shù)據(jù)庫內(nèi)的算法生成模型。如下圖：

spss

源節(jié)點(diǎn)從SQL Server數(shù)據(jù)庫中讀取，終端節(jié)點(diǎn)又寫回到SQL Server數(shù)據(jù)庫中，中間使用的是Microsoft的決策樹算法，整個計(jì)算過程都在數(shù)據(jù)庫中實(shí)現(xiàn)。

介紹到這里，我們就了解了，如何使用數(shù)據(jù)庫內(nèi)算法進(jìn)行建模的過程，經(jīng)常會有朋友問說，使用這里的決策樹算法和使用IBM SPSS Modeler封裝好的決策樹算法，結(jié)果會有什么不同？預(yù)測結(jié)果當(dāng)然是會有差異的了。本身決策樹算法就包含多種，像C&R、CHAID、C5.0、QUEST等，每個算法計(jì)算邏輯就不一樣，因此計(jì)算得到的結(jié)果自然也不一樣，前面我們已經(jīng)介紹過C&R、CHAID、C5.0這三種算法，他們核心的差異就是選擇最佳分組變量和分割點(diǎn)的標(biāo)準(zhǔn)，而Microsoft Analysis Services決策樹是使用線性回歸來確定決策樹分割位置，它可以用于分類屬性和連續(xù)屬性的預(yù)測建模。那么到底選擇什么算法為優(yōu)呢，前面已經(jīng)介紹了，使用數(shù)據(jù)庫內(nèi)建模的好處，大家可以綜合考慮，結(jié)合實(shí)際場景和數(shù)據(jù)預(yù)測結(jié)果的評估再做選擇。

SPSS試用版下載請點(diǎn)擊>>>

詳情請咨詢在線客服！

客服熱線：023-66090381

慧都科技版權(quán)所有 Copyright 2003-2024 渝ICP備12000582號-13 渝公網(wǎng)安備 50010702500608號本站由提供CDN加速/云存儲服務(wù)

掃碼咨詢

添加微信立即咨詢

電話咨詢

客服熱線
023-68661681

TOP

三级成人熟女影院,欧美午夜成人精品视频,亚洲国产成人乱色在线观看,色中色成人论坛 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();