以「在玩乐中学习」为理念的CLOViZ株式会社(总公司:东京都,代表董事:真崎飒太郎),在其游戏型扑克策略学习应用程序「POKER Q’z」中,推出了可以在对战中即时学习游戏思维的**「即时解说功能(β)」**。扑克是不完全信息游戏的典型代表,即时计算每个局面最佳策略本身就是一个高度的技术挑战。此功能不仅能在对战中的各个局面即时生成策略判断,还能以自然语言清晰地解释达成该判断的思考过程,实现了**业界独一无二的学习体验**。 **■ 技术背景与独特性** 扑克与西洋棋或围棋等完全信息游戏不同,是一种看不到对手手牌的不完全信息游戏。在决策所需信息不确定的情况下导出最佳策略,需要基于赛局理论的高度计算。 传统的扑克解算器(GTO策略计算工具)主流设计是预先花费大量计算时间来算出最佳策略,要在对战中即时输出解答的技术门槛极高。此外,现有的分析工具通常是学习与对战分离的结构,在对战游戏中自动识别局面并提供解说的机制尚未确立。部分工具虽然存在对战中的建议功能,但仅限于提示期望值数值和推荐行动,不具备以自然语言传达判断背后思考过程的功能。 POKER Q’z 的即时解说功能针对这些课题,**集成实现了对战中的局面识别、策略解答的即时生成、以及以自然语言解说思考过程这三个技术要素**,具有独特性。用户可以在不中断对战的情况下,学习强大玩家如何整理情况并做出判断的思考流程。 **■ 开发背景** 近年来,基于GTO(赛局理论最佳策略)的扑克学习工具已广泛普及,但现有工具大多以数值或表格形式呈现策略。即使显示了最佳解,如果无法理解其背后的思维方式,也很难在实际游戏中重现。 此外,学习与实践分离也是一个课题。许多任务具通常是预先查找解答,或在游戏后回顾的形式,无法在判断迷惘的瞬间获得学习。 POKER Q’z 针对这些「难以理解」、「实战中难以运用」的结构性课题,开发了此功能,旨在传达思维方式而非答案,并提供在实践中即时学习的体验。 **■ 即时解说功能概要** 在对战中,当您对行动感到迷惘时,只需按下按钮,POKER Q’z 的角色「アリア」(Aria)就会提示该局面下的思维方式。此功能支持AI对战和与朋友的对战,让您在接近实战的环境中培养判断力。 **1. 在迷惘的瞬间即可提问** 由于可以在判断迷惘的瞬间获得建议,与传统的游戏后回顾型学习不同,能够以接近实战的感觉吸收思维方式。 **2. 支持AI对战和与朋友的对战** 不仅可用于练习用的AI对战,也可用于与朋友的人际对战。在更接近实战的环境中,边玩边学习思维方式。 **3. 学习的不是数值,而是思考流程** Aria 的解说设计旨在模仿强大玩家如何整理情况并做出判断的思考过程。它提供的不是数值上的最佳解,而是用户可以重现的思考模式。 **4. 以自然语言理解「为何该玩法是好的」** 通过自然语言解释为何该玩法是好的,不仅是单纯的模仿,更能帮助提升应用能力。 **■ 开发者/AI工程师 大端俊辉评论** **(CLOViZ株式会社 运行董事 兼 东京大学大学院情报理工学系研究科 鹤冈研究室)** 本次的即时解说功能,我们重视的不是单纯地返回最佳解,而是如何重现强大人类玩家的思考过程来进行设计。 在不完全信息游戏中,即时生成高精度的解答本身就是一个技术上困难的课题,而本功能在于将该解答转换为「为何如此」的自然语言解释,并一贯地实现了这一点,这是其技术上的挑战。 POKER Q’z 一贯的目标是,不只是提供强大的AI,而是旨在支持用户的理解和成长。未来,我们也将持续提供让学习者快乐学习,并能在实践中运用策略的体验。 **■ 研究开发体制与未来展望** POKER Q’z 的研究开发,主要由隶属于东京大学・鹤冈研究室(专长:赛局理论・自然语言处理)的工程师推动。我们将赛局理论的学术知识与AI技术相结合,致力于扑克策略的进一步高度化和学习体验的进化。未来将在以下3个领域推进研究开发: **1. 策略AI的高度化** ・进化为更接近GTO策略、实用且高精度的判断AI ・导入针对每局游戏的深入解说功能 ・追加回顾整个游戏会话并提示改进点的会话分析功能 ・扩展为能应对多样情况的通用型AI **2. 多样对战环境的建构** ・开发重现初学者特有失误或特定习惯的AI ・开发指导针对弱点对手的最佳攻略法的AI ・建构重现初级者/中级者/高级者等不同等级对战环境的机制 **3. 个人化学习支持** ・开发分析游戏历史,自动检测失误倾向和弱点的AI ・根据弱点提供练习题 ・自动推荐学习内容 ・建构优化每个人成长的学习导航功能 **扑克学习应用程序「POKER Q’z」概要** POKER Q’z 致力于竞技扑克策略的研究与开发。提供可在零碎时间高效学习策略的扑克学习应用程序。搭载了学习环形赛(Ring Game)和