语音功能更新,专业性与准确性进一步提升。 专注于工程师转职的AI面试练习Web应用程序「MENREN」的提供商X-HACK股份有限公司(总公司:东京都品川区,代表董事:松田信介,以下简称「本公司」)宣布,已发布对其语音识别管线的更新,该管线集成了理解工程师面试情境的AI。 我们成功地在通用语音识别AI的输出中集成了: - (1) 根据面试情境校正同音异义词为适当汉字的层级 - (2) 自动检测并去除静音时生成的不自然文本的机制 这将使用户能够获得更自然、更准确的语音面试练习体验。 服务网址:https://menren.recruit-hub.ai/ ## 决定生成式AI服务价值的「领域特化层」 随着OpenAI、Anthropic、Google等提供的生成式AI的出现,近年来以AI为内核的B2C服务急剧增加。 在这种情况下,不直接使用通用AI的输出,而是能否插入针对自身服务领域进行优化的「特化层」,已成为决定服务体验差异的关键点。 特别是在处理语音的服务中,通用语音识别AI的输出有以下两个优化点: - 理解上下文的同音异义词选择:根据行业特定词汇和说话者上下文,转换为适当汉字的层级 - 静音输入的稳定运行:检测并去除语音识别AI在静音或背景音乐下可能生成无意义文本(例如:「感谢您的收看」)的机制 MENREN作为专注于工程师转职这一专业领域的AI面试教练,已实现了这两项优化。 ## 使语音识别「更自然」的两大机制 MENREN是一项服务,用户对着麦克风回答面试问题时,AI面试官会根据工程师招聘的5个轴(技术说明力/逻辑结构/具体性/表达力/流畅性)进行评分并提供回馈。体验的基础在于「AI正确理解用户所说的内容」。本次更新在通用语音识别AI之上,新搭载了以下两个特化层。 ### ① 理解上下文的同音异义词自动选择 这是一种机制,理解面试上下文的AI会自动选择语音识别结果中同音异义词的适当汉字。说话习惯和语气词会原样保留,尊重用户的发言。 ### ② 通过静音检测即时回馈录音问题 如果麦克风处于静音状态或出现静音,语音识别AI可能会生成源自训练数据的固定短语(例如:「感谢您的收看」)。此机制会自动检测此情况,并立即向用户通知「未检测到音频」。这使得用户能够当场发现录音问题,提供可靠的练习体验。 ## 本次更新带来的价值 - 提高评分准确性:通过符合上下文的精确文本转录,提高回馈的准确性。 - 即时检测录音问题:用户可以当场发现录音错误,提供可靠的练习体验。 - 支持持续使用的可靠性:对结果的高度信任促进重复练习。 在以生成式AI为内核的服务中,在通用模型输出中插入针对自身领域优化的特化层设计,将创造服务体验的差异。MENREN将在工程师转职这一专业领域,持续磨练这种「特化层」技术。 ## 公司概要 公司名称:X-HACK股份有限公司 所在地:东京都品川区东五反田2-5-2 THE CASK GOTANDA 702 代表者:代表董事 松田信介 设立:2018年3月 业务内容:生成式AI/LLM活用支持、AI驱动型开发基础设施的设计与开发、IT系统导入支持与受托开发 公司网站:https://x-hack.jp ## 本案相关咨询处 X-HACK股份有限公司 负责人:丰田 电子邮件:support@menren.recruit-hub.ai