e-triad株式会社(所在地:石川县金泽市,代表取缔役社长:山边 英洋)宣布,与15VISION(所在地:石川县金泽市,代表:一神 友郎)共同开发的服务「Radio Choppit」正式上线。该服务能从广播节目或Podcast等语音内容中,制作出适合社群媒体发布的附字幕短影音。 Radio Choppit是一项只需上传音档,就能一气呵成地简化说话者分离、语音转文本、精华截取、字幕确认至视频输出等所有流程的服务。 它不仅仅是单纯的逐字稿或剪辑,而是支持建构一个易于持续制作附带字幕、且能让观众清楚知道是谁在说话的短影音运作环境。 此外,支撑这项制作服务的几项内核技术,包含语音内容的范围指定、说话者辨识、说话者图像获取、字幕生成以及视频生成等,目前皆已申请专利。 开发背景 近年来,Podcast的使用率日益普及,而大众接触语音内容的管道已不再局限于语音应用程序,更扩展至YouTube等平台。加上Spotify也开放每个单集刊登短影音等趋势,将语音内容以类似视频的形式传递的做法正不断扩散。因应这样的变化,将语音内容转换为容易在社群媒体及各大平台上传递的格式,其重要性与日俱增。 另一方面,将语音内容制作成视频需要花费许多任务时,包括挑选剪辑片段、打逐字稿、调整字幕以及设计制作等。因此,许多广播电台或Podcaster虽然感受到发布的必要性,却难以跨出持续经营的这一步。 Radio Choppit的开发初衷,正是为了解决因制作负担过重导致语音内容价值无法被充分利用的课题,作为一个能在不损害其价值的前提下,将内容传递给更多人的机制。 Radio Choppit的特色