GMO互联网集团旗下的GMO互联网股份有限公司(总公司:东京都涩谷区,代表取缔役社长运行役员:伊藤 正,以下简称「GMO互联网」)、NTT东日本股份有限公司(总公司:东京都新宿区,代表取缔役社长:澁谷直树,以下简称「NTT东日本」)、NTT西日本股份有限公司(总公司:大阪府大阪市,代表取缔役社长:北村亮太,以下简称「NTT西日本」)以及QTnet股份有限公司(总公司:福冈县福冈市,代表取缔役社长:小仓 良夫,以下简称「QTnet」),已完成利用「IOWN (Innovative Optical and Wireless Network)」之「APN (All-Photonics Network)」进行东京至福冈间远程分布式AI基础设施的技术验证。 本次验证中,于2025年11月至2026年2月期间,在东京(保存设备)与福冈(GPU)之间铺设了IOWN APN实际线路,并针对连接「GMO GPU云端」之GPU与大容量保存设备的AI开发基础设施,进行了AI工作负载性能的测量与评估。结果显示,在大型语言模型(LLM)的训练方面,与本地环境相比,性能下降幅度仅约0.5%,确认其影响极为有限。针对伴随数据读取的影像分类任务,通过学习数据的优化等方式,亦确认了即使在远程环境下也能达到实用等级的处理能力,证实了通过针对工作负载特性进行设计,在远程分布式环境下进行实用性AI开发是可行的。 此外,在本次验证之前,四家公司曾于2025年7月作为事前验证(Phase 1),针对仿真东京至福冈间(约1,000km)的远程环境进行了性能测试,并已将其详细内容作为技术报告公开。 新闻稿: https://www.ntt-west.co.jp/news/2510/251002a.html 技术报告: https://www.ntt-west.co.jp/news/2510/251002a_1.html 四家公司今后将基于本次验证的成果,持续推动针对客户需求之远程分布式AI基础设施的实用化工作。 【背景与目的】 随着近年生成式AI与大型语言模型(LLM)的普及,对AI开发基础设施的需求正急剧扩大。过去,GPU与大容量保存设备必须在物理位置上相邻配置,但为了因应数据中心的空间限制,以及企业希望在自有据点管理数据的需求,实现跨越地理限制的分布式AI开发基础设施已成为必要。四家公司利用具备高速大容量且低延迟特性的IOWN APN,针对连接远程GPU与保存设备时的技术可行性进行了探讨。 建构AI开发基础设施时的课题范例 【事前验证(Phase 1)概要与结果】 2025年7月,于福冈的数据中心内设置延迟调整设备「OTN Anywhere」,并利用GMO GPU云端运行了影像辨识(ResNet)与语言学习(Llama2 70B)两项测试任务。在相当于东京至福冈间(15毫秒)的仿真延迟条件下,确认ResNet的基准测试分数下降幅度约为12%,判断已达商用范围,进而推进至本次验证。 【本次验证(Phase 2)概要与结果】 本次验证中,作为实际的据点间网络,将GMO互联网集团的第二总部(东京・涩谷区)与QTnet的数据中心(福冈・福冈市)通过IOWN APN(100GbE)进行连接。在福冈端配置GPU服务器「NVIDIA HGX H100」,在涩谷端配置高速保存设备「DDN AI400X2」,并测量使用远程保存设备时的AI训练性能。 验证期间:2025年11月~2026年2月 连接区间: 东京都涩谷区(GMO互联网) ~ 福冈县福冈市(QTnet) 验证内容:影像分类任务(ResNet)及大型语言模型处理任务(Llama2 70B)的训练时间测量 【验证结果】 验证实验结果显示,即使在经由IOWN APN的远程分布式环境下,也能发挥与本地环境(同一数据中心内连接)不相上下的性能。 ■ 大型语言模型(Llama2 70B)训练任务 本地环境:24.87分钟 远程环境(经由IOWN APN):24.99分钟 证实了在以运算处理为主的LLM训练中,延迟的影响极为有限(差异约0.5%)。 ■ 影像分类(ResNet)任务 本地环境:13.72分钟 远程环境(经由IOWN APN):14.38分钟 确认了即使在发生数据读取的任务中,通过适当的数据整理,在远程环境下也能达到实用等级的处理能力。 ※本验证结果未经MLCommons Association官方验证与认可。 详细内容请参阅以下附件。 利用『IOWN APN』之远程分布式AI基础设施中,GPU与保存设备间连接性能测试的详情与结果 URL https://www.ntt-west.co.jp/news/2603/260330b_1.html 【 本次验证带来的变革 】 本次验证的成功,是解决因物理距离导致「计算资源与数据分离」