リコーが無償公開したセーフガードモデルとは何ですか？

大規模言語モデルに対する有害情報の入出力を検知・ブロックするガードレール機能を組み込んだ「Llama-Ricoh-SafeGuard-20260520」です。

どのモデルをベースに開発されましたか？

Meta社が提供する「Meta-Llama-3.1-8B」の日本語性能を向上させた「Llama-3.1-Swallow-8B-Instruct-v0.5」をベースに開発されています。

有害情報の検知対象にはどのようなものがありますか？

暴力、犯罪、差別、プライバシー侵害など14種類のラベルに分類されたデータで学習しており、不適切または有害な内容を検出可能です。

公開先はどこですか？

Hugging Face（https://huggingface.co/ricoh-ai/Llama-Ricoh-SafeGuard-20260520）にて無償公開されています。

開発の背景は？

生成AIの社会実装が進む中、安全な利活用への課題に対し、リコーが社内プロジェクトとして2024年10月から開発・実装に取り組んできた成果を社会へ還元する狙いがあります。

AI News NQ Analysis

Ricoh Releases Proprietary Safeguard Model for Free

NQ Score 90/100

N1 Content Completeness 5

AI Summary (NQ-processed)

Ricoh has released 'Llama-Ricoh-SafeGuard-20260520,' a model featuring a proprietary guardrail function to detect harmful inputs and outputs in LLMs, for free on Hugging Face.

AI Analysis

Frequently Asked Questions

Q: リコーが無償公開したセーフガードモデルとは何ですか？: A: 大規模言語モデルに対する有害情報の入出力を検知・ブロックするガードレール機能を組み込んだ「Llama-Ricoh-SafeGuard-20260520」です。
Q: どのモデルをベースに開発されましたか？: A: Meta社が提供する「Meta-Llama-3.1-8B」の日本語性能を向上させた「Llama-3.1-Swallow-8B-Instruct-v0.5」をベースに開発されています。
Q: 有害情報の検知対象にはどのようなものがありますか？: A: 暴力、犯罪、差別、プライバシー侵害など14種類のラベルに分類されたデータで学習しており、不適切または有害な内容を検出可能です。
Q: 公開先はどこですか？: A: Hugging Face（https://huggingface.co/ricoh-ai/Llama-Ricoh-SafeGuard-20260520）にて無償公開されています。
Q: 開発の背景は？: A: 生成AIの社会実装が進む中、安全な利活用への課題に対し、リコーが社内プロジェクトとして2024年10月から開発・実装に取り組んできた成果を社会へ還元する狙いがあります。