研究显示,通过在算法中使用"演绎推理","深度角色"根据观察到的部分行为,推断某一玩家是敌是友,快速学习应该与谁结盟从而获得胜利。
今年7月,美国卡内基-梅隆大学宣布,人工智能Pluribus在六人桌德州扑克比赛中击败多名世界顶尖选手,突破了人工智能仅能在国际象棋和围棋等二人游戏中战胜人类的局限。但在这些游戏中,人工智能从一开始就知道"谁是敌人、谁是朋友"。
研究人员让"深度角色"参与了超过4000轮在线桌游"抵抗组织:阿瓦隆"。"阿瓦隆"类似于"杀人游戏"或"狼人杀",玩家通过游戏进程推测出其他玩家的身份,同时掩藏自己的身份。结果显示,不论作为"好人"还是"坏人","深度角色"都比人类玩家表现更加出色。
"深度角色"采取了一种被称为"反事实遗憾最小化"的博弈算法,利用"博弈树"预测每个玩家的行为,并推断出玩家角色的最大可能性。这种人工智能程序在游戏中进行自我对抗,逐步接近最佳策略,实现"至少与对手打平"的纳什均衡。
"阿瓦隆"的人类玩家通常要在游戏过程中通过对话为决策提供部分依据,而"深度角色"只观察玩家行为,无需参与交流。研究人员未来计划让机器表达简单的信息,如玩家是敌是友等。
语言是人工智能的下一个前沿,因为人类玩家会说谎,需要更复杂的交流技巧。只有掌握表达技巧后,人工智能才能参与那些需要对其他玩家进行劝说的复杂社交推理游戏。
研究人员说,这项工作可以更好模拟人类是如何做出社会决策的,从而帮助人工智能更好理解人类、向人类学习并与人类共事。
最新评论