在 Power BI Desktop 中導(dǎo)入和分析網(wǎng)頁中的數(shù)據(jù)(上)
使用 Power BI Desktop 從數(shù)據(jù)獲得見解,然后進(jìn)行相關(guān)操作利用可視化分析免費(fèi)創(chuàng)建內(nèi)容豐富的交互式報(bào)表,一切盡在指尖。
如果是一個(gè)資深球迷,他想要獲得多年來歐足聯(lián)歐洲錦標(biāo)賽(歐洲杯)獲勝隊(duì)的報(bào)導(dǎo)。他該怎么做呢?使用 Power BI Desktop,可以將此數(shù)據(jù)從網(wǎng)頁導(dǎo)入到報(bào)表,并創(chuàng)建顯示數(shù)據(jù)的可視化效果。 在本教程中,將學(xué)習(xí)如何使用 Power BI Desktop 完成以下操作(由于內(nèi)容過多,本次內(nèi)容分為上下篇發(fā)布。點(diǎn)擊查看下篇>>):
- 連接到 Web 數(shù)據(jù)源并在可用表之間導(dǎo)航。
- 調(diào)整并轉(zhuǎn)換 Power Query 編輯器中的數(shù)據(jù)。
- 命名查詢并將其導(dǎo)入 Power BI Desktop 報(bào)表。
- 創(chuàng)建和自定義地圖和餅圖可視化效果。
連接到 Web 數(shù)據(jù)源
你可以從 https://en.wikipedia.org/wiki/UEFA_European_Football_Championship 處的歐足聯(lián)歐洲錦標(biāo)賽維基百科頁面上的結(jié)果表中獲得歐足聯(lián)獲勝隊(duì)的數(shù)據(jù)。
僅使用基本身份驗(yàn)證建立 Web 連接。需要身份驗(yàn)證的網(wǎng)站可能無法正常使用 Web 連接器。
若要導(dǎo)入數(shù)據(jù),請執(zhí)行下列操作:
- 在 Power BI Desktop“主頁”功能區(qū)選項(xiàng)卡中,下拉“獲取數(shù)據(jù)”旁邊的箭頭,然后選擇“Web”。
備注:你還可以選擇“獲取數(shù)據(jù)”項(xiàng)本身,或者從 Power BI Desktop“開始”對話框中選擇“獲取數(shù)據(jù)”,再從“獲取數(shù)據(jù)”對話框的“所有”或“其他”部分中選擇“Web”,然后選擇“連接”。
- 在“從 Web”對話框中,將 URL https://en.wikipedia.org/wiki/UEFA_European_Football_Championship 粘貼到“URL”文本框,然后選擇“確定”。
- 在連接到維基百科網(wǎng)頁后,“導(dǎo)航器”對話框會(huì)在頁面上顯示可用表的列表。 可以選擇任意表名稱以預(yù)覽其數(shù)據(jù)。“結(jié)果[編輯]”表具有所需的數(shù)據(jù),盡管它不完全是你希望的外觀。你將可以先重新修整并清理數(shù)據(jù),然后再將其加載到報(bào)表中。
備注:“預(yù)覽”窗格只顯示最近選擇的表,但當(dāng)選擇“轉(zhuǎn)換數(shù)據(jù)”或“加載”時(shí),所有被選中的表都會(huì)加載到 Power Query 編輯器中。
- 選擇“導(dǎo)航器”列表中的“結(jié)果[編輯]”表,然后選擇“轉(zhuǎn)換數(shù)據(jù)”。
- 表的預(yù)覽將在“Power Query 編輯器”中打開,你可以在其中應(yīng)用轉(zhuǎn)換以清理數(shù)據(jù)。
在 Power Query 編輯器中修整數(shù)據(jù)
通過僅顯示年份和獲勝的國家/地區(qū),使數(shù)據(jù)更易于掃描。使用 Power Query 編輯器執(zhí)行這些數(shù)據(jù)修整和清理步驟。
首先,從表中刪除除這兩項(xiàng)之外的所有列。 在此過程中,稍后將這些列重命名為“年份”和“國家/地區(qū)”。
- 在“Power Query 編輯器”網(wǎng)格中,選擇列。 按 Ctrl 選擇多個(gè)項(xiàng)目。
- 右鍵單擊并選擇“刪除其他列”,或者從“主頁”功能區(qū)選項(xiàng)卡中的“管理列”組選擇“刪除列” > “刪除其他列”,以從表中刪除所有其他列。
或者
接下來,從第一列單元格中刪除額外的詞“詳細(xì)信息”。
- 選擇第一列。
- 右鍵單擊并選擇“替換值”或從功能區(qū)“主頁”選項(xiàng)卡中的“轉(zhuǎn)換”組中選擇“替換值”。 在“轉(zhuǎn)換”選項(xiàng)卡中的“任何列”組中也可以找到此選項(xiàng)。
或者
- 在“替換值”對話框中,在“要查找的值”文本框中鍵入“詳細(xì)信息”,“替換為”文本框保持為空,然后選擇“確定”從此列中刪除“詳細(xì)信息”一詞。
某些單元格僅包含“年份”一詞而不是年份值。 你可以篩選列以僅顯示不包含“年份”一詞的行。
- 在列上選擇篩選器下拉箭頭。
- 在下拉菜單中,向下滾動(dòng)并清除“年份”選項(xiàng)旁邊的復(fù)選框,然后選擇“確定”。
因?yàn)槟悻F(xiàn)在只查看最終獲勝隊(duì)數(shù)據(jù),可以將第二列重命名“國家/地區(qū)”。 若要重命名列,請執(zhí)行下列操作:
- 雙擊或點(diǎn)擊并按住第二列標(biāo)題,或者
- 右鍵單擊列標(biāo)題并選擇“重命名”,或
- 選擇 *列,從功能區(qū)的“轉(zhuǎn)換”選項(xiàng)卡中的“任何列”組中選擇“重命名”。
或者
- 標(biāo)題中鍵入“國家/地區(qū)”,然后按 Enter 重命名列。
你還想在“國家/地區(qū)”列中過濾掉類似“2020”這樣包含 null 值的行。 你可以像處理“年份”值那樣使用篩選器菜單,也可以:
- 在具有 null 值的“2020”行中右鍵單擊“國家/地區(qū)”單元格。
- 在上下文菜單中選擇“文本篩選器” > “不等于”以刪除任何包含該單元格的值的行。