獲「科技部人文社會科學研究中心」補助 AI in Finance: 金融與人工智慧成果分享平台

課程

2020/08/04
python語法介紹
簡介

Python語言中有許多套件可以使用,而Pandas套件主要具有兩種資料結構,分別是DataFrame和Series,DataFrame主要是由index(索引)、columns(欄位)組成的表格,也就類似一般csv檔案或excel檔案的格式,因此要利用python分析excel或csv檔案時,可以利用pandas套件將excel或csv檔案匯入後,資料型態就是DataFrame,而且可以利用套件中的資料合併、資料清理等功能,了解Pandas套件能夠使資料處理上更加方便。另一個資料結構是Series,Series是一個一維陣列,可以想像成DataFrame只有其中一欄。

下圖是DataFrame資料格式的範例資料,最左邊為索引(index),索引預設是由0開始,不是從1開始,必須特別注意,該資料的索引從0到4,總共有5筆資料,欄位名稱分別是:Date、High、Low、Open、Close、Volume、Adj Close,總共有7個欄位(columns),透過columns和index會對應到一個值。
 

下圖是Series資料結構的範例,與DataFrame一樣有索引,索引會對應到一個特定的值,並且只會有一欄,類似一維陣列的物件。