WED株式会社(总公司:东京都涩谷区,代表董事:新井 俊树,以下简称「WED」)与开发并提供日语OCR引擎「YomiToku」的MLism株式会社(总公司:千叶县柏市,代表董事社长:木之下 滉大郎,以下简称「MLism」)进行技术合作,共同开发了专为通过可赚取金钱的购物应用程序「ONE」所收集的真实环境收据数据进行优化的客制化OCR模型。此外,通过此项合作,也为提升YomiToku通用模型的精准度做出了贡献。本次合作的详细内容将于今日作为导入案例公开。 背景与课题 在高精准度OCR模型开发中,最大的课题是确保能反映真实环境的学习数据。现实文档包含许多通用数据集无法预期的噪音、失真和特殊字体。 WED的「ONE」服务每日累积数百万张收据图像。其中混合了印刷文本和装饰字体,存在大量需要高端OCR处理的真实环境数据。 【合作详情】 MLism和WED以相互提供数据和技术的方式创建合作伙伴关系,并实施了以下两项共同措施。 1. 开发WED专用客制化模型 MLism和WED以WED的收据数据为基础,对YomiToku进行了调校,共同开发了针对WED环境优化的客制化OCR模型。在调校过程中,确认了超出预期的数据多样性,例如折叠和特殊字体,再次证明了真实环境数据独有的难度和实用性。 2. 模型成果 通过本次合作开发的WED专用客制化模型,在ONE上的收据读取处理中实现了比传统方法更高的精准度。此模型是通过ONE每日累积数百万张数据的多样性和规模才得以实现,即使在通用OCR难以应对的条件下(例如折叠、模糊、装饰字体等),也能发挥稳定的读取性能,进一步提升了服务品质。 此外,这些成果也应用于YomiToku通用模型的学习。通过此项合作,在特定领域的文本识别精准度达到了90%以上。 公司概要 WED株式会社 代表者:代表董事 新井 俊树 设立:2016年 所在地:东京都涩谷区 事业内容:提供以收据业务为中心的数据利用型行销服务 企业愿景:「每次消费都充满期待的世界」 网址:https://wed.company MLism株式会社 代表者:代表董事社长 木之下 滉大郎 设立:2024年12月 所在地:千叶县柏市若柴178番地4 柏之叶校园148街区2 商店与办公大楼6F 事业内容:算法的研究开发及授权销售与提供 公司网站:https://www.mlism.com/