top of page

Abstract

  傳統的基於方面的情感分析(ABSA)以正面、負面、中立等離散類別來表達情感。然而,這種粗粒度的分類無法充分捕捉財務報告中的細微差異和情感強度。  本研究將以情感效價(Valence:負面~正面)和喚醒度(Arousal:平靜~興奮)等連續值表達情感的維度情感分析框架,應用於日語財務報告。基於心理學及情感科學中已確立的情感效價-喚醒度(VA)模型(Russell, 1980; 2003),本研究旨在更詳細地分析針對財務資訊的情感表達。  財務報告是企業績效及未來展望的重要資訊來源,在投資決策和市場分析中扮演核心角色。本研究依循SemEval2026 Task 3 DimABSA的框架,建構了專門針對日語財務報告的資料集 (jpn_finance_train_task1.jsonl、jpn_finance_dev_task1.jsonl)。  研究採用多種模型進行情感效價和喚醒度的預測,並以均方根誤差(RMSE)及皮爾森相關係數(PCC)進行評估。藉此,本研究期望提升財務資訊中情感分析的準確度,並對更細緻地掌握市場心理做出貢獻。

1. 資料集建構

1.1 資料來源與規劃

本研究建構了1,224筆日語財務DimABSA資料集:
訓練資料(1,024筆): 從chakki-works/chABSA-dataset隨機抽取財務相關文本,擴展為DimABSA格式
開發資料(200筆): 透過EDINET API取得實際財務報告,從零開始標註

1.2 訓練資料處理(1,024筆)

從chakki-works資料集選取財務相關文本
追加/修正財務領域特有的Opinion Term(如「謹慎的展望」「有限的改善」)
對各Aspect賦予Valence(1.009.00)和Arousal(1.009.00)連續值
參考Russell (1980)的VA分布模型確保標註合理性

1.3 開發資料建構(200筆)

資料蒐集: 透過EDINET API隨機取得日本上市企業財務報告
前處理: 句子擷取、格式清理、轉換為CSV格式
標註: 識別Aspect、標註Opinion Term、賦予VA值

2. 標註品質管理

2.1 標註準則制定

建立VA評分標準與參考範例:

定義Entity(market, company, business, product, NULL)

定義Attribute(general, sales, profit, amount, price, cost)

透過小組討論統一模糊情境的標準

2.2 標註者配置

      (4名標註者)

2.2 標註者配置(4名標註者)

編成2人1組的多種配對組合

計算各配對的標註一致率(F1分數)

選擇F1分數最高的配對進行最終標註

2.3 進度管理

工作分批處理,使用表格記錄進度

定期進行資料彙整與一致性檢查

格式統一與錯誤修正

標註品質管理流程

兩人一組初步標註(Aspect先行)

衝突檢查與識別

雙組裁定機制(VA全員討論)

產出高品質資料集

將4位標註者分為A、B兩組,各自先進行 Aspect判斷與數值賦予。若兩人意見不合,則由另一組兩位標註者共同討論決定。

系統性比較兩組標註結果,若兩位標註者在數值上出現明顯分歧,則判定為標註衝突。

針對衝突數據,由兩組共4位標註者共同討論 VA值 並裁定。

計算不同標註者配對的 F1 分數,選擇一致性最高的組合作為最終基準。降低個人偏差,確保資料的客觀性與泛化性。

3. 模型訓練與評估

3.1 模型選擇

(4種base規模模型)

選擇理由:驗證日語專用模型性能、比較多語言模型、考量GPU運算資源限制

  • cl-tohoku/bert-base-japanese-whole-word-masking

  • nlp-waseda/roberta-base-japanese

  • bert-base-multilingual-cased(多語言模型)

  • rinna/japanese-roberta-base

使用PyABSA框架進行微調:

學習率: 2e-5

訓練週期數: 5

訓練/驗證資料: 1,024/200筆

3.3 評估方法

上傳預測結果至SemEval2026 Task 3 GitHub

透過官方系統取得RMSE_VA、PCC_V、PCC_A

4. 結果分析與報告

4.1 實驗結果

bert-base-multilingual-cased: 最低RMSE(1.5519)

rinna/japanese-roberta-base: 最高PCC_V(0.1192)

所有模型PCC < 0.2,顯示預測趨勢仍需改善

4.2 主要發現

模型架構對性能影響顯著(RMSE差距0.74)

Valence預測相對容易,Arousal預測困難

財務文本的複雜表達(對比、轉折)增加預測難度

GPU限制影響了large規模模型的探索

bottom of page