FlashLabs 株式会社(总部:东京都千代田区,代表取缔役:细井洋一)宣布,自 2026 年 6 月 1 日(周一)起,于合作伙伴 Continuum AI 提供的 LLM 路由闸道「OrcaRouter」中,正式支持 MiniMax 公司的次世代 AI 模型「MiniMax M3」。MiniMax M3 采用独家的「MiniMax Sparse Attention (MSA)」技术,实现了高达 100 万 Token(保证最低 512K)的上下文窗口。相较于前代模型,处理速度提升了 15.6 倍,大幅增强了在代理工作流(Agent Workflow)与程序编写辅助方面的性能。 背景与目标 随着企业 AI 应用的普及,对于大规模文档处理、整个代码库分析以及长时间代理运行等需要超长上下文的业务需求急剧增加。然而,传统 AI 模型受限于上下文窗口,必须将文档分割处理,导致处理速度下降与成本增加。 特别是在法律文档全文分析、大规模代码重构以及跨文档信息提取等企业领域,对于 100 万 Token 规模的上下文处理需求日益增长。此外,当 AI 代理自主运行任务时,若要维持长时间的推理过程,超长上下文的高速处理至关重要。 FlashLabs 通过 OrcaRouter 提供超过 200 种 AI 模型的访问权限,此次添加 MiniMax M3 API,将能为需要超长上下文处理的企业用例提供更快速且具成本效益的解决方案。 MiniMax M3 概览 价格:可通过 OrcaRouter 使用(Token 加价 0%)。详细价格信息请参阅 OrcaRouter 官方网站。 主要功能:超长上下文处理(最大 100 万 Token)、稀疏注意力技术 (MSA)、先进的程序编写性能、代理工作流优化、原生多模态支持。 为企业带来的价值 1. 大规模文档处理效率化:无需分割,即可一次处理数百页文档。 2. 代码库全域分析与重构:一次读取数万行代码,进行依赖关系分析与错误检测。 3. AI 代理长时间运行:在维持 100 万 Token 上下文的状态下,支持数小时的代理运行。 技术特色:稀疏注意力技术的创新 MiniMax M3 的最大特色在于自主研发的「MiniMax Sparse Attention (MSA)」技术。通过大幅降低计算量,相较于前代模型 (MiniMax M2.7),预填充速度提升 9.7 倍,解码速度提升 15.6 倍,并将推理成本降低至约 1/20。 与 OrcaRouter 集成的综效 OrcaRouter 是一个能根据提示词难度自动路由至最佳 AI 模型的平台。通过加入 MiniMax M3,企业可针对常规处理、超长上下文处理及复杂推理进行优化,预计可降低约 40% 的 LLM 支出。 防护栏与安全功能 OrcaRouter 集成了 8 种防护栏功能,包括 PII Shield(个人信息保护)、Secrets & API Keys(认证信息保护)、Prompt Injection 防御及品牌安全性等,强化企业生产环境的控管。 未来展望 FlashLabs 将持续迅速提供最新的 AI 模型,并强化企业领域所需的超长上下文处理与多模态支持等功能。