株式会社Feedforce(总公司:东京都港区,代表取缔役社长:冢田耕司,以下简称「Feedforce」)已在其AI搜索品牌分数可视化服务「Answer IO」中,添加对OpenAI于2026年4月23日发布的最新模型「GPT-5.5」的支持。GPT-5.5正陆续向ChatGPT的Plus、Pro、Business、Enterprise方案用户提供,全球数亿人每天都在使用ChatGPT。此次更新使得企业能够测量付费方案用户实际接触到的最新ChatGPT回应中的品牌可见度。 查看详情 支持GPT-5.5的背景 OpenAI于2026年4月23日发布了最新模型「GPT-5.5」,并开始陆续向ChatGPT的Plus、Pro、Business、Enterprise方案用户提供。ChatGPT是一个全球数亿人使用的AI服务,日常被广泛用于商业信息搜索和决策支持。随着GPT-5.5的发布,付费方案用户接触到的AI回应内容已更新,品牌提及模式也随之改变。 GPT-5.5在评估复杂命令行工作流程的Terminal-Bench 2.0中达到82.7%,显著超越Anthropic的Claude Opus 4.7(69.4%)和Google的Gemini 3.1 Pro(68.5%),在此基准测试中展现了行业领先的性能(※1)。 尤其值得注意的是,GPT-5.5专为代理在实际电脑环境中的自主任务运行进行了优化。它具备在无人监督下持续运行代码撰写与调试、网页浏览、试算表输入和多步骤任务的能力,在衡量实际操作性的OSWorld-Verified中获得78.7%。此外,在衡量44种职业知识工作的GDPval基准测试中,它达到84.9%,超越了前一代GPT-5.4(83.0%)。通过API提供的上下文窗口达到1M token,能够一次性处理长篇文档和复杂的任务历史(※1)。 模型性能如此显著的飞跃,直接影响了AI选择信息的标准和推荐品牌的依据。我们收到许多关于「最新ChatGPT(GPT-5.5)如何评估自家品牌」以及「与前一代模型相比,品牌分数产生了什么变化」的需求。本次更新使得企业能够立即测量实际运行的最新模型中的品牌可见度,从而精确评估AI搜索优化(AEO)策略的成效。 模型版本差异对品牌可见度测量的影响 AI搜索优化(AEO/GEO/LLMO)工具市场正在迅速扩大,国内外众多服务不断涌现。然而,仅凭「支持ChatGPT」或「支持Gemini」这样的平台名称,往往难以判断实际测量使用的是哪个模型版本。 即使是相同的「ChatGPT」,GPT-5.4和GPT-5.5的品牌评估结果也可能不同。在GPT-5.5中,代理式的信息收集和验证流程得到了加强,使其能够自主运行涉及网页浏览和电脑操作的多阶段工作流程。因此,不同模型世代的品牌提及情况和评估结果可能会有所不同。在评估AEO策略成效和持续监测时,若能有明确说明测量所用模型版本的机制,将能实现更精确的分析。 Answer IO的特色是能够明确选择和确认用于测量的AI模型版本。用户可以指定模型版本,例如「OpenAI GPT-5.5 (固定)」或「OpenAI GPT-5.4 (固定)」,如果选择「自动使用最新模型」,则在新模型发布时会自动切换。由于也能比较不同模型世代之间的分数,因此可以量化追踪AI模型演进对品牌可见度的影响,并根据数据做出策略判断。 为何使用最新模型进行测量很重要? 代理能力提升对品牌评估的变化 GPT-5.5在Terminal-Bench 2.0中达到82.7%,显著增强了网页浏览和多步骤任务的自主运行能力。AI积极地…