APTOが公開した安全性学習データセットの規模はどれくらいですか？

APTOが独自設計した日本語安全性学習データセットは約18,000件です。

安全性チューニングに採用されたモデルは何ですか？

Qwen3.5シリーズをベースにチューニングが行われています。

データセットにはどのようなカテゴリが含まれますか？

有害な質問の拒否、過剰拒否防止、応答途中からの軌道修正、捏造防止などのカテゴリが含まれています。

チューニングの手法には何が採用されていますか？

攻撃プロンプト設計から模範回答作成までを行う多段階プロセスに加え、学習にはLoRAを採用し、モデルサイズごとに最適化を行っています。

安全性チューニングの効果はどのように測定されましたか？

AnswerCarefully v2.2、SORRY-Bench、MultiJail、MT-Benchなどのベンチマークと、Qwen・Mistral・Gemmaによるクロス評価で測定されました。

AI News NQ Analysis

APTO Releases Learning Dataset and Safety-Tuned Models to Enhance Japanese LLM Safety

NQ Score 88/100

N1 Content Completeness 95

AI Summary (NQ-processed)

株式会社APTO (APTO) has released a proprietary dataset of approximately 18,000 Japanese safety training records and safety-tuned Qwen3.5 series models. The initiative aims to address safety challenges in Japanese LLMs by optimizing for both security and conversational quality using a rigorous multi-stage verification process and LoRA fine-tuning.

AI Analysis

Frequently Asked Questions

Q: APTOが公開した安全性学習データセットの規模はどれくらいですか？: A: APTOが独自設計した日本語安全性学習データセットは約18,000件です。
Q: 安全性チューニングに採用されたモデルは何ですか？: A: Qwen3.5シリーズをベースにチューニングが行われています。
Q: データセットにはどのようなカテゴリが含まれますか？: A: 有害な質問の拒否、過剰拒否防止、応答途中からの軌道修正、捏造防止などのカテゴリが含まれています。
Q: チューニングの手法には何が採用されていますか？: A: 攻撃プロンプト設計から模範回答作成までを行う多段階プロセスに加え、学習にはLoRAを採用し、モデルサイズごとに最適化を行っています。
Q: 安全性チューニングの効果はどのように測定されましたか？: A: AnswerCarefully v2.2、SORRY-Bench、MultiJail、MT-Benchなどのベンチマークと、Qwen・Mistral・Gemmaによるクロス評価で測定されました。