日本最大规模地方政府的防灾文档基础设施 ── 在一个约 6,000 万日圆规模、为期 3 年的项目中,如何针对数千页的文档实现「相似搜索」?这还不到需要雇用专职架构师的程度,但仅靠公司内部又无法做出最终决定。MIZUNARA 株式会社利用 Leach 生成式 AI 顾问填补了这一空白。我们采访了 CTO 小田将之先生和 CEO 木下祐马先生。 「市场上几乎没有像律师一样可以按小时收费提供技术顾问的人,」MIZUNARA CTO 小田将之先生说。 *本文介绍的防灾领域举措包括在 MIZUNARA 前身组织下进行的项目。文中提到的约 6,000 万日圆规模是指该项目的整体规模(包括基础设施),并非指 Leach 的顾问费或维护合约金额。出于公开考虑,客户名称和部分特定信息已被隐藏。 支持摘要: - 约 6,000 万日圆:日本最大规模地方政府防灾领域项目的规模感(3 年合约,含基础设施)。 - 7 个候选方案缩减至 1 案:对 MySQL 全文检索、Aurora PostgreSQL + pgVector 等进行成本、运维负担和需求契合度对比。 - 维护工时几乎为零:自发布以来约一年,公司内部日常使用相似搜索。运维保持稳定。 - 一份 PDF 搞定:在合约时间尚有剩余的情况下就确定了设计,甚至让人觉得「再要求下去都不好意思了」。 企业简介: - 企业名称:株式会社 MIZUNARA (Mizunara Inc.) - 特色:东京都立产业技术大学院大学 (AIIT) 公认的大学衍生初创企业。 - 主要举措:致力于大规模文档管理的「Wordless」、AI 时代的办公工具「OffiStill」。 - 体制:7 人体制(2 名全职)。 - 本次主题:约 6,000 万日圆规模防灾领域文档平台相似搜索的设计咨询。 - 网站:https://www.mizunara.io/ 1. 关于 MIZUNARA ── 创建处理大规模文档的基础 MIZUNARA 以「如何管理、编辑和发布大规模文档」为主题。公司研发了针对大规模文档管理的「Wordless」和 AI 时代的办公工具「OffiStill」。现实中的业务文档不仅仅是 Markdown,还需要能处理表格数据、图表和引用关系的机制。本次项目也是这一方向的延伸。 2. 导入前的课题 ── 需要相似搜索,但受限于规格书和预算无法决定技术 咨询对象是日本最大规模地方政府的防灾文档平台。该项目将大量 PDF 和图像通过 OCR 转化为文本信息,并在 Web 上提供搜索和浏览。最大的问题是,虽然有「寻找相似描述」的需求,但公司内部无法决定选择哪种技术。Leach 提出了矢量搜索的建议,这是 MIZUNARA 单独无法想到的解决方案。 3. 政府项目特有的「100% 达成率」限制 在政府项目中,严格运行规格书是绝对的,以避免补助金被取消或甘特图崩溃。他们需要的不是单纯的「新技术」,而是「符合限制条件的技术」。