营运AI视频与图片生成平台「DomoAI」的DomoAI PTE. LTD(总部:新加坡,CEO:Joe Lam,以下简称「DomoAI」)已对「说话虚拟主播(Talking Avatar)」功能进行更新并开放使用。通过本次更新,语音、情感与对话表现获得强化,除了传统的视频生成外,现在更能制作具备故事性与演出效果的内容。此外,从生成、演出到对话,皆可作为一连串流畅的流程进行制作。伴随此次更新,我们提供了一个能将角色动作与说话视频一体化制作的环境。 ## ■ 说话虚拟主播功能的主要更新 说话虚拟主播(Talking Avatar)是一项以图片或视频为基础生成角色,仅需输入文本就能制作出自然说话视频的功能。无需进行录音,即可赋予角色语音及表情,生成对话形式的内容。 在本次更新中,我们以这项说话虚拟主播功能为内核,强化了语音、情感、对话等表现元素。其结果是扩大了影音内容中角色表现的幅度,支持具备故事性与演出效果的内容制作。 - 语音品质提升(自然语音模型) 实现更接近人类的语音表现。 - 添加情感表现(情感控制) 可针对每句台词设置「希望」、「耳语」、「愤怒」等语调。 - 实现对话生成(多重语音) 可设置多种声音,生成角色之间的对话。 - 智能粘贴功能(剧本自动分割) 自动将输入的文本依角色进行分割。 - 支持视频上传(可输入视频素材) 除了人像图片外,也支持视频素材的输入。 ## ■ 通过与说话虚拟主播结合扩展制作流程 本次更新的特色在于,从角色的生成、赋予动作到对话表现,皆能作为一连串流畅的流程进行制作。