獲「科技部人文社會科學研究中心」補助 AI in Finance: 金融與人工智慧成果分享平台

課程

2020/07/30
文字探勘
簡介

一般的分析資料都是數值型的變數,以股價報酬研究來說,一般會以交易量技術分析財務比率等數值資料來研究。但如果想以新聞資料財務報告書等文字資料進行研究,無法直接透過演算法計算,那就必須經過文字分析。
文字分析主要目的是提取文本資料中的資訊,並量化為可供分析的數據。目前
發展出許多方式,像是萃取關鍵字、情緒分析、關聯分析、語意分析等等,本文會對關鍵字提取及情緒分析進行說明。
本文文字分析介紹的流程如下圖:

第二節 資料預處理~第七節 情緒分析:依據要介紹的主題,將程式碼寫成自定義函式
第八節 實際結果:串聯前六節的自定義函式,把結果跑出,並在最後附上完整程式碼