數據來源介紹 — 政府資料開放平臺

學數據分析最重要的事情是什麼,當然是要先有數據阿 ! 然而我們在生活中很難蒐集到夠多、有用的資料,所以今天 TinyCorner 要介紹一個政府經營的平臺,裡面放了各式各樣的寶物讓大家去挖掘。今天就教大家要怎麼下載並把他們放到自己的程式中吧 !

政府資料開放平臺:https://data.gov.tw/

可以看到有18個大項目,大家可以依照著自己有興趣的資料點進去。我們先點進去【求學及進修】這個項目當中,看到裡面有很多不同的統計資料,我們點進去看第一份 “大專院校校別學生數”:

大家可以看到裡面有四個年度的統計資料,我們就選擇下載106年的資料來看吧!!

下載下來之後,如果用 Excel 打開,大家可以能會發現裡面都是亂碼,那是因為下載下來的檔案的編碼方式和 Excel 預設的不同,所以我們必須先將編碼形式做轉換,大家可以依照下面的步驟來做:

存檔完後,再開啟就會正常囉~~

接著我們來看看要怎麼樣把它讀到我們的程式裡面吧~~

import pandas as pd
data = pd.read_csv(r"E:\政府資料\106_student_2.csv", engine = "python")
print(data)

這樣我們就把資料讀到 Python 當中囉~~未來我們再來試著處理這份資料吧~~

另外在這篇:使用 Python 讀取 csv 和 xlsx 檔中有對於使用 csv 檔跟 xlsx 檔更詳細的介紹喔!!

Facebook Comments

發表迴響