人工知能学会第二種研究会資料
Online ISSN : 2436-5556
Task Arithmeticに基づく言語モデルにおけるバイアス低減手法の検討
白藤 大幹竹中 誠斉藤 辰彦木村 泰知
著者情報
研究報告書・技術報告書 フリー

2024 年 2024 巻 AGI-028 号 p. 06-

詳細
抄録

近年,言語モデル(LM)が広く利用され,社会的バイアスやステレオタイプがより深刻な問題と見做されている.本研究では,人手作成のデバイアスデータを使用せずにLMのバイアスを軽減するためにBias Vectorを提案する.本手法は,(1)事前学習済みLMをバイアス方向に継続学習し,(2)バイアスLMから事前学習済みLMの重みを減算しBias Vectorを構築し,(3)Bias Vectorを事前学習済みLMの重みから減算しデバイアスする.本研究ではSEATにより3種類のLMにおいて本手法を評価,平均0.177ポイントの改善を確認した.また,GLUEスコアによりLMの表現力が劣化しないと示した.

著者関連情報
© 2024 著作者
前の記事 次の記事
feedback
Top