當作者在撰寫文章時,或多或少會透露當下的情緒,而文字探勘中的情緒分析,可以量化文本所傳遞的情緒資訊,進而將情緒分數對應到想研究的領域,像是以新聞文章來預測股價的研究。
目前實現情緒分析的方法有:字典法、應用演算法。本節將介紹應用情緒字典取得文本中的情緒訊息,字典法就是依據情緒字典來計算情緒分數,情緒字典一般分為正面情緒詞、負面情緒詞,更進階的情緒字典甚至有不確定詞、中性詞等。
將程式碼自定義為sentiment函式,最後第8節會利用這個函式將結果跑出。
如果字詞(已經過斷詞)出現在正向詞字典就加一分,反之,字詞出現在負向詞字典中就扣一分,最後將分數除以文章中字詞數量,以進行分數標準化。
完成情緒分析,匯出名為sentiment.csv的檔案