Visual Bank株式会社(东京都港区,代表取缔役CEO 永井真之)宣布,其通过旗下子公司Amanaimages株式会社推出的AI学习用数据集解决方案「Qlean Dataset(キュリン数据集)」,将强化针对数字厅推动的「政府AI(源内)」试用LLM选定企业*的行政实务专用数据支持体系。 本计划旨在通过提供权利清晰且高纯度的数据集,强力支持AI在行政实务应用中对「事实性(Factality)」和「日本固有语境」的适应,这两者是其成功的根本。 *政府AI试用国产大型语言模型(LLM)的公开招募结果:https://www.digital.go.jp/news/10d55c63-b3e1-42b9-9cc5-93a06943ae0e ## Qlean Dataset:支持「政府AI」社会实践的基础 在人口减少的社会中,AI的利用是维持和强化公共服务的紧迫课题。数字厅主导的「政府AI(源内)」项目,是确保日本在AI方面自主性,并培育针对行政现场优化的国产LLM的极其重要的举措。 投入行政实务的AI,除了需要超越一般对话能力,更需要「高度可靠性」,即深入理解日本的法律制度、文化、习惯以及公文书特有的记述方式。Qlean Dataset以日本国内最大规模的权利清晰数据资产为基础,从数据层面提出解决方案,以满足政府严格的要求标准,从而推动各公司的模型进入政府正式采购阶段。Qlean Dataset不仅仅是提供数据,更是行政DX这一大规模社会实践中的「数据战略合作伙伴」,强力支持这项工作。 ## Qlean Dataset的数据品质和价值符合政府采购标准 Qlean Dataset提供以下价值,以最大化入选企业模型的性能: - **高度适应行政实务** 提供高精度数据集,用于学习和评估公文书特有的结构以及高度专业领域(如法务、医疗、社会保障等),这些是仅凭网络公开数据无法达到的。 - **客观可靠性和事实性验证** 为抑制幻觉现象(即生成式AI产生的看似真实的谎言),并确保行政现场可接受的事实性,支持基于证据的模型强化,例如利用未学习数据建构基准测试。 - **注入日本独特的价值观和语境** 通过反映日语特有细微之处以及日本文化背景和价值观的数据,加速AI与日本国内用户产生共鸣,成为「值得信赖的AI」。