在本節中我們會利用datareader來下載股市資料,並用該資料介紹觀察資料型態、資訊的方法,以及將DataFrame資料印出的方法
一、匯入套件
二、下載實際股市資料(datareader)
我們利用pandas套件當中的datareader來下載股市資料,下載的內容包含開盤價、收盤價、最高價、最低價等資料,接下來會依據此資料作為說明pandas套件功能的實際資料
1.在Anaconda Prompt或命令提示字元輸入:
pip install pandas-datareader
2.匯入datareader套件
datareader的程式碼為: web.DataReader('股票代號.TW','資料來源',指定開始時間,指定結束時間)
因為是抓台灣的股票資料所以股票代號後面要.TW
資料來源是設為奇摩
資料的期間是從2020年10月1號至2020年10月31號
將下載的資料命名為df1
三、查看資料的型態
有了df1之後,先來看df1的資料型態是什麼?
利用type( ),可以看出指定資料在python中的資料型態
從輸出結果看出資料型態為pandas套件的DataFrame資料結構
想要檢查下載的資料,可以把df1印出來看看
從pandas_datareader下載的股市資料df1是以日期作為索引,columns(欄位)總共有6個欄位
想觀察資料除了將資料直接印出來外,還可以利用.info( ),把資料的資訊印出來
可以得知資料的型態、索引名稱和欄位名稱,資料的筆數,以及各個欄位的資料型態等等資訊
四、印出DataFrame資料
成功下載或匯入資料後,為了確認資料是否正確,可以將DataFrame資料印出來,除了直接打DataFrame的名稱,可以把表格印出,但是如果表格太大,不想要全部印出來時,還可以利用以下程式碼:
.head() 只會將前5個row(列)印出
.head(10) 設定數字,也可以指定想印出的前幾筆資料
.tail() 只會將後5個(列)印出
.tail(8) 設定數字,也可以指定想印出的後幾筆資料
印出前5列資料
設定數字,即可印出指定的前幾列資料
印出後5列資料
設定數字,即可印出指定的後幾列資料