独立开发国内生成式AI基础平台并提供生成式AI服务的Stockmark股份有限公司(总公司:东京都港区,代表董事CEO:林 达,以下简称「本公司」),谨此宣布将金牌赞助于2026年6月举办的「2026年度人工智能学会全国大会(第40届,以下简称JSAI2026)」。 此外,在本大会上,本公司LLM组织的研究员高桥及会田将发表一篇关于针对农业日历图像的大规模视觉语言模型(VLM)基准测试的论文。 本研究并非旨在农业领域开展新业务,而是利用「栽培历」——一种分析难度极高的文档代表,来验证AI在多大程度上能精确理解现实社会中的复杂文档,这是一个跨产业的技术课题。本公司将利用从本研究中获得的知识,应用于提升商业文档、规格书、图纸、内部知识等结构化技术,以及支持企业AI BPR的基础技术。 赞助背景 本公司秉持「重塑价值创造机制,推动人类进步」的使命,利用最尖端的自然语言处理技术和LLM等生成式AI技术进行产品开发及研究开发。目前,我们提供支持制造业研发现场的AI代理「Aconnect」和将复杂内部数据结构化为AI可利用形式的「SAT Agent Cockpit」,从而推动企业AI BPR(业务流程再造)。 汇集日本顶尖AI研究人员的人工智能学会(JSAI),在日本AI技术的发展及其实际社会应用中扮演着极其重要的角色。为进一步活化和发展国内AI研究社群,本公司今年也将再次以金牌赞助商的身分参与。 发表论文:利用农业日历验证VLM极限 在本大会上,本公司的高桥及会田将发表关于「FiT-QA:栽培历VQA基准测试 – 数据集建构与通用VLM的极限 –」的研究。 栽培历是一种实用文档,将作物栽培相关的操作信息,连同表格、图表、照片、注释及时间串行信息,高密度地集成在一张纸上。与一般文档相比,它需要跨越多个领域来读取信息,并根据上下文进行综合性推理,因此对于AI来说是极其难以理解的目标。 在本研究中,我们提出了针对这些栽培历图像的VQA(视觉问答)基准测试「FiT-QA(Figures and Tables Question Answering)」。FiT-QA由自动生成后经过人工编辑确认的easy-QA,以及为需要跨多领域综合推理而人工创建的difficult-QA组成,收录了347张图像和1,152个问答对。使用高性能通用VLM进行评估的结果显示,即使在easy-QA中仍存在错误回答,而difficult-QA中的正确回答则非常有限。 这澄清了将现有通用VLM直接应用于现实世界中复杂实用文档时的极限,并将FiT-QA作为未来模型开发和评估的实用基准测试发布。 发表会议详情 ・标题:FiT-QA:栽培历VQA基准测试 – 数据集建构与通用VLM的极限 ・发表者:高桥 洸丞、会田 勇斗(Stockmark股份有限公司) 宫脇 一辉、中川 菫、木村 泰知(小樽商科大学) 门脇 一真(株式会社日本总合研究所) 小林 晓雄、大友 将宏、石原 润一、马场 研太(农研机构 农业信息研究中心) ・发表日期与时间:2026年6月9日(星期二)14:00〜15:30 ・地点:Y会场(展览厅AB-1) ・会议URL:https://pub.confit.atlas.jp/ja/event/jsai2026/presentation/2Yin-A-50 论文发表目的:从农业数据研究到商业文档分析 本次发表的「FiT-QA:栽培历VQA基准测试」乍看之下是在农业领域进行的研究,这与本公司主要业务领域不同。然而,其底层的技术挑战与本公司的业务紧密相关。 本公司至今为止,在研发和解决方案提供两方面,都将「复杂文档的高度理解」作为一贯的重要主题。通过「Aconnect」和「SAT Agent Cockpit」,我们精确地结构化混杂表格、图表、注释的实用文档,并将其转换为AI可利用的形式。