## Sansan 将国家计划「GENIAC」开发的 AI 模型「Cello」导入旗下产品 致力于提供 AX(模拟转型)服务以改变工作方式的 Sansan, Inc. 宣布,已将其在经济产业省与国立研究开发法人新能源产业技术综合开发机构(NEDO)共同推动的计划「GENIAC(Generative AI Accelerator Challenge)」中所开发的文档专用 AI 模型「Cello」导入旗下产品中。该计划目的在于强化日本生成式 AI 的开发能力。 本模型已集成至公司旗下的合约管理服务「Contract One」与会计 AX 服务「Bill One」的数据处理流程中。此举进一步提升了合约与发票等商业文档数据化的精确度与处理速度,有助于提升用户的工作效率与劳动生产力。未来计划将此模型扩展导入至商务数据库「Sansan」等其他产品中。 ### 关于文档专用 AI 模型「Cello」 「Cello」是 Sansan 在国家计划「GENIAC」第三阶段中构建的自有 AI 模型,该计划旨在支持基础生成式 AI 模型的开发。 Sansan 过去曾独家开发「Viola」,这是一款多模态生成式 AI,能通过问答格式直接从文档图像中截取必要信息。「Cello」是「Viola」的高端扩展模型。除了提取文本信息外,它还具备同时输出「位置信息」的功能,能标示信息在文档上的具体位置。通过此进化,AI 在处理信息的同时能够辨识作为回答依据的文本区域,从而创建检测并排除 AI 幻觉(生成式 AI 的常见挑战)的机制。这使得数据化过程能够与 Sansan 的数据转换规则高度一致,实现极高精确度的数据化。 此外,在数据处理流程中,「Cello」将过去分开处理的「文本数据化」与「项目识别与语意理解」工程进行了集成处理。这提升了整个数据管线的处理速度,实现更迅速的数据交付。 ### 商务 AI 应用中的数据重要性与 Sansan 的努力 随着生成式 AI 的普及,仅依赖公开信息将难以产生竞争优势。利用企业内部基于事实的「第一手信息(Primary Information)」并将其投入 AI 应用,才是竞争优势的源泉。然而,商业环境中 AI 的性能很大程度上取决于数据品质。由于 AI 将输入信息直接作为判断基准,充满杂讯的非结构化数据容易导致 AI 幻觉。因此,消除推测并准备好 AI 能准确处理的结构化数据至关重要。 Sansan 长期以来创建了结合机器学习 AI 技术、严格的数据转换规则以及人工品质保证的独特数据化体系。这种能够从多样化模拟文档中创建极高准确度数据的运作基础,已成为在 AI 普及时代公司强大的竞争优势。此次导入的「Cello」正是将此长年耕耘的数据化运作提升至下一个阶段的关键。 通过导入本模型,Sansan 将进一步提升企业生产力,并强化为了最大化 AI 应用而建构的高精确度数据库基础。