Improvements
指示追従データセット
高難易度の指示追従能力を強化するためのチューニングデータ
実務に近い複雑な指示(多段制約・フォーマット指定・条件分岐・ロール扮演)を含むインストラクションチューニング用データセット。M-IFEval ベースで日本語ネイティブの制約パターンを多数追加し、指示の細部まで漏らさず追従するモデル学習に最適化されています。
主要点
データセット概要
3 万件のインストラクションペアで構成。難易度別に easy(制約 1-2 個)/ medium(3-5 個)/ hard(6-10 個)の 3 階層。各サンプルに含まれる制約の数と種類は構造化メタデータとして付与されています。
制約の種類
形式制約(JSON / Markdown / CSV / 表形式) / 文字数制約(厳密 / 範囲 / おおよそ) / 言語制約(日英中混在 / 敬語レベル) / コンテンツ制約(含めるべき / 避けるべき要素) / 構造制約(章立て / 箇条書きの深さ) を体系化。
評価指標
各制約ごとの達成率(per-constraint accuracy)と全制約同時達成率(strict accuracy)の 2 軸で評価。一部達成 / 完全達成を可視化することで、モデルの「指示の細部まで追従する力」を測定できます。
実務シナリオ
メール作成 / レポート要約 / 議事録整形 / コードレビュー / SQL 整形 / 規約文書作成 など、実際の業務に頻出するタスクから生成された指示を含み、デモ的でない実利用に近いデータ設計になっています。
チューニング推奨設定
SFT のみで +6〜10 点、SFT + DPO の併用で +9〜13 点の改善が期待できます。ハイパーパラメータの推奨レンジを技術ドキュメントに明記しています。
M-IFEval ランキング
Benchmark | M-IFEval
01
gpt-oss-20bⓘ
指示追従特化チューニングで本データセット利用時に +10。
1025.9
02
gemini-2.5-proⓘ
長文指示の構造化指示で安定。
921.84
03
o3-proⓘ
推論強化系での指示追従精度が向上。
820.42
データで、
革新のきっかけを。
APTOの高品質AIデータで、あなたのビジネスに新たな可能性を。
まずは資料請求からお気軽にお問い合わせください。