Kotozna 株式会社(总公司:东京都港区,代表董事 CEO:后藤玄利)作为一家提供利用生成式 AI 的多语言通信平台之 B2B SaaS 企业,已发布独家 RAG(Retrieval-Augmented Generation)架构「TocDex RAG(目录+索引 RAG)」,旨在提高生成式 AI 聊天机器人的回答精准度。 通过实施此架构,生成式 AI 聊天机器人的回答精准度、多语言支持能力和扩展性将大幅提升。 TocDex RAG 采用结合了类别搜索(目录)和索引搜索(索引)的两层结构搜索方式,并已搭载于企业级生成式 AI 平台「Kotozna TPG」中。这是一个全新的 RAG 架构,重新审视了搜索结构本身,以应对传统 RAG 在语境理解和多语言搜索方面所面临的挑战。 TocDex RAG 的运作机制 近年来,许多企业利用大型语言模型(LLM)导入了搜索和回答内部知识及客户信息的系统。然而,传统 RAG 在语境理解的精准度、多语言查找的应对以及大规模数据处理等方面存在课题。 为了解决这些课题,TocDex RAG 采用了结合类别搜索和索引搜索的两层结构搜索架构。通过按类别整理和筛选信息,同时像索引一样以单词为单位进行搜索,生成式 AI 在生成回答之前,能够更有效率地获取更符合语境的信息。 TocDex RAG 与传统 RAG 的差异 比较传统 RAG 与 TocDex RAG 传统 RAG 通常的做法是将通过搜索获取的文本片段(chunk)直接传递给 LLM 以生成回答。然而,这些片段在分割时往往没有考虑语义上的区隔,导致 LLM 在某些情况下无法获得足够的语境信息。 另一方面,TocDex RAG 不仅将获取的片段,还将包含其周边的语义上连贯的文本(passage)传递给 LLM。这使得 LLM 能够理解前后语境,从而生成更精确、更自然的回答。 Kotozna 株式会社代表董事 CEO 后藤玄利表示: 「RAG 的性能在很大程度上取决于片段的品质。由有意义的单位组成的片段才能实现高精准度的回答,但在传统 RAG 中,这一点往往没有得到充分考虑。」 TocDex RAG 的主要优势 与传统 RAG 相比,TocDex RAG 具有以下特点: ・通过强化语境理解来提高回答精准度 ・强化多语言查找的应对能力 ・在成本效益高地处理大规模数据的同时,抑制对回应速度的影响 ・无需额外的维护负担 支持扩展性和灵活性的功能 考虑到企业的营运,还实施了以下功能: ・数据更新时自动同步矢量数据库 ・可按机器人单位切换功能的打开/关闭 ・支持关键字搜索设置的客制化 预期应用领域 TocDex RAG 在特别需要精确术语理解和多语言支持的领域中,将发挥高效作用。例如,在观光和酒店业中,需要精确处理店铺名称、设施名称、商品名称等具有独特性的信息。此外,它也适用于处理包含专业术语的文档,如产品手册和技术文档。 未来,作为支持企业知识利用和客户服务的生成式 AI 基础,预计将在各行各业中得到广泛应用。 体验新功能 TocDex RAG TocDex RAG 已实施于 Kotozna 的生成式 AI 平台「Kotozna TPG 2.0」。「Kotozna TPG 2.0」是一个无需代码、即使没有专业知识也能轻松创建生成式 AI 聊天机器人的平台。目前,我们为企业和个人用户提供了免费方案,因此您可以实际体验 TocDex RAG 带来的舒适机器人体验。 Kotozna TPG 2.0 注册(使用注册) https://www.kotozna.com/ja/tpg Kotozna TPG 2.0 使用手册 https://prompt-engineering.kotozna.com/manuals/ Kotozna CEO 关于 AI 技术和特性的解说视频(系列超过 30 集。每集约 3 分钟) https://www.youtube.com/@kotoznaofficial9548 解说设计者应注意的「分割思维」 AI 精准度,取决于如何划分。 在这段视频中,Kotozna 代表后藤玄利将解说在使用 RAG 和 KAG 进行 AI 设计时常被忽略的重点「有意义的片段」。 https://youtu.be/btxqQlOddEA 关于 Kotozna 株式会社 官方网站:https://www.kotozna.com/ja/about 代表者:代表董事 CEO 后藤 玄利 设立:2016 年 10 月 资本金:70,000,000 日圆 ※截至 2025 年 12 月 31 日 所在地:东京都港区赤坂 2-5-8 HULIC JP 赤坂大楼 3F 事业内容:提供利用生成式 AI 的多语言通信支持服务 联系方式:sales@kotozna.com 公司