組別代號:ZV1
心得
1110446
橋本真之介
我在資訊管理學系學習,不僅掌握了程式設計的知識,也廣泛涉獵了管理學的知 識,因此希望將來能從事一份能活用這兩方面專業的工作,並持續以 IT 顧問為 職業目標。我深信這項研究對未來的求職活動將大有助益,同時,我也考慮在就業 前進入本校研究所,進一步深化我的研究。我們目前進行的研究是從企業的財務報 告等文件中提取單詞並進行評分,這是一項極為耗費時間和精神力的工作。為了順 利完成這項研究 ,我們需要具備高水準的閱讀理解能力和能有效率推進工作的任 務管理能力。然而,由於財務報告書並非我們日常閱讀的文本,當中出現了許多陌 生的專業詞彙,增添了研究的難度。幸運的是,在禹良治老師的大力指導以及小組 成員的幫助下,我們的工作已接近尾聲,我希望能夠全力以赴,完成最後的衝刺。
本次專題最大的收穫,是掌握了 DimABSA 的核心原理:使用情感程度(Valence) 和情緒強度(Arousal)這兩個連續標準,量化日語財務文本中複雜的情感表達。 我們運用 PyABSA 框架對多種模型進行訓練,其中 bert-base-multilingualcased 達成了最低的 RMSE。 然而,我個人感受是,在現有資料規模下,要將 RMSE 進一步降低到 1.50 以下, 已經極為困難。同時,所有模型的 PCC(相關係數)均低於 0.2,未能有效抓住情 感變動的趨勢,這說明當前方法在處理高度專業的財務文本結構時存在根本不足。 針對 PCC 過低的問題,我反思由於財務文本專業性太強,或許應嘗試加入非專業 性的日語通用文章進行訓練,以幫助模型理解情感與語義之間的一般關聯,從而改 善 PCC 數值。 基於這些挑戰,未來的研究方向將會集中在增加訓練資料數量、進行領域適應,以 及探索專門針對 VA 預測的神經網路設計。 總結來說,這次經驗不只提升了我的程式撰寫與數據處理能力,更培養了面對極限 挑戰時的分析思考能力(判讀 RMSE 與 PCC 的差異),為我未來在顧問業或數據分 析領域奠定了堅實的基礎 。
1111672
本多光
1111673
菅原奏由華
透過本研究,我挑戰了以連續值量化財務文本細微差異的嘗試,這是傳統離散情感 分類無法捕捉的。將 DimABSA 這個新框架應用於日語財務報告是首次嘗試,特別是 在資料集建構上花費了超乎預期的時間與心力。 針對每個句子判斷情感效價和喚醒度數值並進行標註的作業,是一個比想像中更 加細緻且主觀的過程。透過這個經驗,我深刻體會到 LLM 的基礎終究是以人類的智 能與感知為根基。再先進的 AI 系統,最終仍然依賴於人類細心準備的高品質資料。 為了建構便利且實用的系統,人力進行的細緻準備工作依然不可或缺,在體認到這 個重要性的同時,我也感受到了相當大的成就感。 雖然實驗結果未能達到當初的期望,但本研究仍具有重大意義。我們成功建立了日 語財務領域 DimABSA 的初步基準線,釐清了四種不同模型的特性與課題,並指出了 未來的改善方向。財務資訊的情感分析在投資決策與市場分析中具有重要作用的 潛力。本研究雖僅是第一步,但若能對此領域的發展有所貢獻,將是我的榮幸。