理光免費公開自主研發的防護欄(Safeguard)模型
NQ 評分
90/100
N1 內容完整性
5
AI 摘要(NQ 加工版)
理光公司在 Hugging Face 免費公開了「Llama-Ricoh-SafeGuard-20260520」,該模型內建自主開發的防護欄功能,可檢測大型語言模型(LLM)的有害輸入與輸出。
AI 分析
常見問題
- Q: リコーが無償公開したセーフガードモデルとは何ですか?
- A: 大規模言語モデルに対する有害情報の入出力を検知・ブロックするガードレール機能を組み込んだ「Llama-Ricoh-SafeGuard-20260520」です。
- Q: どのモデルをベースに開発されましたか?
- A: Meta社が提供する「Meta-Llama-3.1-8B」の日本語性能を向上させた「Llama-3.1-Swallow-8B-Instruct-v0.5」をベースに開発されています。
- Q: 有害情報の検知対象にはどのようなものがありますか?
- A: 暴力、犯罪、差別、プライバシー侵害など14種類のラベルに分類されたデータで学習しており、不適切または有害な内容を検出可能です。
- Q: 公開先はどこですか?
- A: Hugging Face(https://huggingface.co/ricoh-ai/Llama-Ricoh-SafeGuard-20260520)にて無償公開されています。
- Q: 開発の背景は?
- A: 生成AIの社会実装が進む中、安全な利活用への課題に対し、リコーが社内プロジェクトとして2024年10月から開発・実装に取り組んできた成果を社会へ還元する狙いがあります。