MLism株式会社(总部:千叶县柏市;代表董事社长:木之下 滉大郎;以下简称「MLism」)与WED株式会社(总部:东京都涩谷区;代表董事:新井 俊树;以下简称「WED」)通过共同调优,共同开发了针对WED营运的「ONE」平台所收集的真实环境收据数据优化的收据专用OCR模型。 此模型是基于MLism提供的日语OCR引擎「YomiToku」开发的,并已作为WED「ONE」平台的OCR引擎采用。 ## 背景 WED提供「ONE」服务,该服务向用户购买收据并将其作为购买数据利用。「ONE」每日处理约一百万张图像,通过OCR从收据中提取购买信息。 此前,WED使用第三方OCR引擎,但在高昂的营运成本以及根据业务需求进行调优的灵活性方面面临挑战。为应对这些挑战,MLism以其日语OCR引擎「YomiToku」为基础,利用WED拥有的真实环境收据数据,共同开发了收据专用OCR模型,支持WED将OCR引擎内部化。 ## 合作内容 在本次共同开发中,「YomiToku」根据WED拥有的真实环境收据数据进行了收据读取方面的调优。调优时,考虑了实际操作中遇到的各种复杂条件,如模糊、手震、折叠、弯曲和特殊字体,并推进了模型的优化。 结果,相较于基础模型,辨识率提升了5%以上。此外,为了应对大量处理,我们对模型进行了轻量化并优化了处理管道,将处理时间缩短了30%以上。这创建了一个能够稳定处理每日约一百万张收据图像的体系。与之前使用的第三方OCR引擎相比,营运成本降低了80%以上。 ## 未来展望 MLism未来将继续通过提供针对各行业和用途的真实数据优化的OCR模型,支持创建符合各企业业务需求的高精度、高效文本辨识基础设施。 WED株式会社 代表评论: 通过结合「ONE」收集的真实数据与MLism的日语OCR引擎「YomiToku」,我们实现了营运成本的大幅削减。此外,「ONE」收集的数据不仅用于此次收据专用模型,也用于改进「YomiToku」的通用模型精度。未来,我们将继续深化与YomiToku的合作,努力进一步发掘所累积的真实购买数据的价值。 MLism株式会社 公司概要: 公司名称:MLism株式会社 代表者:代表董事社长 木之下 滉大郎 总部所在地:千叶县柏市若柴178番地4 柏之叶园区148街区2 商店及办公楼6F 设立:2024年12月 业务内容:算法研究开发以及许可证销售提供 公司网站:https://www.mlism.com/ WED株式会社 公司概要: 公司名称:WED株式会社 代表者:代表董事 新井 俊树 总部所在地:东京都涩谷区千駄谷4丁目14−4 SK大楼千駄谷2F 设立:2016年 业务内容:提供以收据业务为中心的数据应用型行销服务 公司网站:https://wed.company