2025-03-06から1日間の記事一覧

Sarashina2.2:数学・コーディングタスクの性能を向上させた日本語言語モデル

概要 Pretrainingチームの高瀬翔と李凌寒です。 弊チームでは日本語能力に主眼を置いた大規模言語モデルの構築に取り組んでおり、Sarashina2-70BやSarashina2.1-1Bのように、いくつか事前学習モデルも公開してきました。 これまで公開したモデルは日本の知識…