数据分析实验室股份有限公司(总公司:东京都中央区,代表董事:近藤 雅彦,以下称「本公司」)谨此宣布,在与エヴィクサー股份有限公司(以下称「エヴィクサー」)共同进行的一项研究中,已汇整了关于生成式AI语音内容判断技术的研究成果。此项共同研究是エヴィクサー获日本总务省采纳之「网络伪假信息等对策技术开发与实证事业」项目的一部分。本研究旨在结合エヴィクサー的声学信号处理技术与本公司的AI及数据分析技术,以提升应对生成式AI发展所导致日益严重的伪假信息(如深度伪造)的对策技术。 ■研究成果概要 本研究重现并分析了生成式AI语音内容的特性,并创建了用于判断合成语音的验证数据与AI模型验证环境。 ■主要成果 ① 创建支持多种语音生成模型的验证基础 为分析包含日语在内的合成语音, ・Tortoise ・XTTS(多语言对应模型) ・Qwen3-TTS 本研究调查并比较了上述等尖端语音生成模型,并针对多种生成方式进行了验证。尤其是,通过支持如XTTS这类基于多语言、大规模学习的语音生成技术,本研究得以在接近真实生成式AI环境的条件下进行验证。 ② 合成语音数据的系统性生成与特征量分析 在本研究中, ・合成语音数据生成条件的整理与系统化 ・语音频号(频谱图等)的分析 ・提取与自然语音的结构性差异 旨在定量地掌握合成语音的特性。借此,本研究致力于开发不依赖特定生成模型的通用判断技术。 ③ 通过深度学习验证合成语音判断模型 关于生成语音的判断, ・深度学习模型的调查与验证 ・训练数据集的建构 ・判断精度评估流程的完善 并在一定程度上确认了利用AI语音独有特征的判断模型之有效性。 ④ 声学信号处理与AI融合的技术提升 本研究结合了エヴィクサー拥有的声学信号处理技术与本公司的AI技术,为强化エヴィクサー的合成语音判断系统(EAF)提供了验证支持。具体而言, ・合成语音数据的生成及多样化生成模型的运行验证 ・通过语音频号特征量分析掌握合成语音与自然语音的差异 ・利用深度学习模型进行判断精度验证及评估数据集的建构 并致力于提供技术知识,以提升EAF的判断精度。 ■本研究的定位 本研究是エヴィクサー股份有限公司为主体,在获日本总务省事业采纳的项目中推进的,其中エヴィクサー负责声学信号处理及AI对策技术的开发,本公司则负责数据设计、分析及验证领域。 本公司特别负责: ・合成语音数据的生成与设计 ・语音数据的分析与特征量提取 ・判断模型的验证与评估基础的建构 并为本研究整体技术的高度化做出了贡献。 ■社会意义 随着生成式AI的进步,确保语音与影像内容的可靠性已成为一个重要的社会课题。本研究成果被定位为可在以下领域贡献技术开发的知识: ・深度伪造对策 ・信息真实性验证 ・AI治理与标准化应对 ■未来发展 未来,本公司将持续与エヴィクサー股份有限公司在必要时进行合作,推动发挥双方优势的措施,并继续为声学信号处理与AI融合的伪假信息对策领域的发展做出贡献。 ■数据分析实验室股份有限公司 https://dalab.jp/ 代表者:代表董事 近藤 雅彦 所在地:东京都中央区筑地5-4-18 汐留EAST SIDE大楼6楼 设立:2019年4月26日 资本金:2,000万日圆 事业内容:数据分析・AI应用支持、AI开发、数据人才教育服务等 本案相关咨询处 数据分析实验室股份有限公司 公关负责人 E-mail:info@dalab.jp