提供自主研发的国产生成式AI基础设施及面向企业的生成式AI服务的Stockmark株式会社(总部:东京都港区;代表取缔役CEO:林 达;以下简称「本公司」)发布了「Stockmark-DocReasoner-Qwen2.5-VL-32B」文档阅读基础模型。该模型是在经济产业省(METI)和新能量产业技术综合开发机构(NEDO)推动的旨在强化日本生成式AI开发能力的「GENIAC」项目的第三阶段支持下开发的。 本次开发的模型,充分利用了本公司在自主研发AI基础模型方面的经验,在32B(320亿参数)这一中型模型中实现了抑制幻觉和精通日语/商业的特点。 这使得低成本的本地部署运行成为可能,而这是通用AI难以实现的。同时,由于能够安全处理高度机密的企业数据而不必将其发送到外部,因此它是一个针对社会实践优化的基础模型,可在完全保护企业「数据主权」的同时,实现高速高精度的生成式AI环境。 **模型发布地点** **Stockmark-DocReasoner-Qwen2.5-VL-32B** https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B **关于「Stockmark-DocReasoner-Qwen2.5-VL-32B」** 「Stockmark-DocReasoner-Qwen2.5-VL-32B」是在开源模型「Qwen2.5-VL-32B-Instruct」的基础上,对包含图表和图像的复杂商业文档,以及以制造业为代表的、更复杂的文档进行了丰富学习的多模态基础模型。 该模型不仅在处理商业场景中常用的大量复杂文档方面表现出色,而且还能够阅读包含制造业特有专业知识的文档,如化学式和图纸。 其性能超越了所采用的基础模型「Qwen2.5-VL-32B-Instruct」以及在日本广泛使用的「Qwen3-VL-32B-Instruct」。此外,通过实现「链式思维(Chain of Thought, CoT)」生成,即在回答复杂问题时,不一次性输出最终答案,而是逐步生成导向回答的中间思考过程,使得生成式AI在商业场景中能够被信赖地使用。 **「Stockmark-DocReasoner-Qwen2.5-VL-32B」的特点** 作为本模型的特点,我们采用了32B(320亿参数)这一战略性尺寸,以打破传统大型模型面临的「营运成本膨胀」与轻量级模型的「精度极限」这两难局面。 32B与