top of page

Abstract

  傳統的基於方面的情感分析(ABSA)以正面、負面、中立等離散類別來表達情感。然而,這種粗粒度的分類無法充分捕捉財務報告中的細微差異和情感強度。  本研究將以情感效價(Valence:負面~正面)和喚醒度(Arousal:平靜~興奮)等連續值表達情感的維度情感分析框架,應用於日語財務報告。基於心理學及情感科學中已確立的情感效價-喚醒度(VA)模型(Russell, 1980; 2003),本研究旨在更詳細地分析針對財務資訊的情感表達。  財務報告是企業績效及未來展望的重要資訊來源,在投資決策和市場分析中扮演核心角色。本研究依循SemEval2026 Task 3 DimABSA的框架,建構了專門針對日語財務報告的資料集 (jpn_finance_train_task1.jsonl、jpn_finance_dev_task1.jsonl)。  研究採用多種模型進行情感效價和喚醒度的預測,並以均方根誤差(RMSE)及皮爾森相關係數(PCC)進行評估。藉此,本研究期望提升財務資訊中情感分析的準確度,並對更細緻地掌握市場心理做出貢獻。

1. 資料集建構

1.1 資料來源與規劃

本研究建構了1,224筆日語財務DimABSA資料集:
訓練資料(1,024筆): 從chakki-works/chABSA-dataset隨機抽取財務相關文本,擴展為DimABSA格式
開發資料(200筆): 透過EDINET API取得實際財務報告,從零開始標註

1.2 訓練資料處理(1,024筆)

從chakki-works資料集選取財務相關文本
追加/修正財務領域特有的Opinion Term(如「謹慎的展望」「有限的改善」)
對各Aspect賦予Valence(1.009.00)和Arousal(1.009.00)連續值
參考Russell (1980)的VA分布模型確保標註合理性

1.3 開發資料建構(200筆)

資料蒐集: 透過EDINET API隨機取得日本上市企業財務報告
前處理: 句子擷取、格式清理、轉換為CSV格式
標註: 識別Aspect、標註Opinion Term、賦予VA值

2. 標註品質管理

2.1 標註準則制定

建立VA評分標準與參考範例:

定義Entity(market, company, business, product, NULL)

定義Attribute(general, sales, profit, amount, price, cost)

透過小組討論統一模糊情境的標準

2.2 標註者配置

      (4名標註者)

2.2 標註者配置(4名標註者)

編成2人1組的多種配對組合

計算各配對的標註一致率(F1分數)

選擇F1分數最高的配對進行最終標註

2.3 進度管理

工作分批處理,使用表格記錄進度

定期進行資料彙整與一致性檢查

格式統一與錯誤修正

3. 模型訓練與評估

3.1 模型選擇

(4種base規模模型)

選擇理由:驗證日語專用模型性能、比較多語言模型、考量GPU運算資源限制

  • cl-tohoku/bert-base-japanese-whole-word-masking

  • nlp-waseda/roberta-base-japanese

  • bert-base-multilingual-cased(多語言模型)

  • rinna/japanese-roberta-base

使用PyABSA框架進行微調:

學習率: 2e-5

訓練週期數: 5

訓練/驗證資料: 1,024/200筆

3.3 評估方法

上傳預測結果至SemEval2026 Task 3 GitHub

透過官方系統取得RMSE_VA、PCC_V、PCC_A

4. 結果分析與報告

4.1 實驗結果

bert-base-multilingual-cased: 最低RMSE(1.5519)

rinna/japanese-roberta-base: 最高PCC_V(0.1192)

所有模型PCC < 0.2,顯示預測趨勢仍需改善

4.2 主要發現

模型架構對性能影響顯著(RMSE差距0.74)

Valence預測相對容易,Arousal預測困難

財務文本的複雜表達(對比、轉折)增加預測難度

GPU限制影響了large規模模型的探索

bottom of page