獲「科技部人文社會科學研究中心」補助 AI in Finance: 金融與人工智慧成果分享平台

課程

2020/07/30
文字探勘
情緒分析

當作者在撰寫文章時,或多或少會透露當下的情緒,而文字探勘中的情緒分析,可以量化文本所傳遞的情緒資訊,進而將情緒分數對應到想研究的領域,像是以新聞文章來預測股價的研究。
目前實現情緒分析的方法有:字典法、應用演算法。本節將介紹應用情緒字典取得文本中的情緒訊息,字典法就是依據情緒字典來計算情緒分數,情緒字典一般分為正面情緒詞、負面情緒詞,更進階的情緒字典甚至有不確定詞、中性詞等。

我們利用張津挺(2015)的碩士論文所建構的情緒字典,做為本節實作的情緒字典。

張津挺(2015)碩士論文建構之情緒字典下載(請點我)

將程式碼自定義為sentiment函式,最後第8節會利用這個函式將結果跑出。

如果字詞(已經過斷詞)出現在正向詞字典就加一分,反之,字詞出現在負向詞字典中就扣一分,最後將分數除以文章中字詞數量,以進行分數標準化。
完成情緒分析,匯出名為sentiment.csv的檔案