AI也会读空气!脸书发展可理解游戏队友意图的AI

人工智能在各种游戏,包括围棋和象棋等击败人类,而现在脸书更应用人工智能技术,并结合先进的搜索技术,让机器人掌握花火(Hanabi)这个更复杂的纸牌游戏,程度不只更胜过去的算法,还能够击败菁英玩家。

花火是一种需要高度合作的纸牌游戏,玩法类似团队接龙,但玩家无法看到自己拥有的牌,只能看到其他玩家的牌组,玩家通过每回合有限的信息,经推理、集成和发挥默契来完成游戏,最后才能成功将不同花色的数字牌,按顺序排列并成功施放出花火。

玩家必须通过交换消息,才能了解要出牌还是弃牌,但是决定行动的线索,只能通过特定纸牌颜色和编号等,非常有限的提示进行沟通,而由于玩家都知道,花火是一款合作游戏,因此会直接相信队友的暗示,不会认为队友的暗示存在欺骗或是误导等目的。

脸书提到,人类通过观察行为,来解释队友的意图,像是队友可能以特定颜色卡片,来暗示玩家下一回合要使用的卡片,而这是一种演绎的能力,玩家用来理解队友的意图,并预测他们对线索的解释,和回应的行为。而在真实世界中,脸书也期待人工智能系统拥有协作能力,能够在需要的环境进行合作。

在今年的时候,DeepMind和Google Brain的人工智能研究人员,同时也认为花火是研究人工智能的新领域,因为花火多人游戏,同时结合了合作性玩法以及不完整的消息。而脸书现在发布了最新的研究,他们开发了一种应用即时搜索方法的人工智能机器人,这种搜索方法结合预运算的策略,可以对游戏过程中遇到的各种情况进行微调,显著改善包括增强学习等,任何游玩花火的算法。

这项研究主要贡献是在不完整消息的情况下,使用搜索方法。脸书提到,过去搜索方法只能用在如象棋和围棋等,这类公开完整信息的游戏,而由于花火游戏进行时,每个玩家只能看到部分而非全部纸牌,任意阶段的游戏都只有非完整的信息,机器人在做出决定之前,需要考量多种不同的可能,而这种情况让搜索变得困难,通常也需要花费更多的计算资源。

脸书提到,尽管不少多重代理的人工智能研究,都专注在零和竞争上,但是通过有限沟通进行有效率协调的人工智能技术,在现实世界的潜在用途更大,像是在只有部分可观察的环境交通导航,需要驾驶员需要传达自己的意图以及解释他人意图,而在工作环境中,人工智能系统需要能够解释人类所提供的非语言线索。

当人工智能可以理解这些意图,就能以更高的效率进行合作,脸书认为,他们在花火游戏中的研究,能够推进现实世界中合作式人工智能代理的发展。