您的关注是对我最大的支持👇
人工智能(AI)系统已经展示出在广泛领域实现超人表现的巨大潜力,甚至在棋类、围棋、扑克和雅达利等复杂游戏中赢得了人类专业玩家的胜利。然而,这些AI系统仍在努力将其泛化到新的场景。
在一篇新的论文《多元化AI:利用AlphaZero实现创新性国际象棋》中,Google DeepMind研究团队探讨了人工智能是否可以在推动其计算理性的极限的同时,从人类智能中识别出的创新问题解决机制中受益,他们还推出了基于AlphaZero的Agent AZdb,该Agent在下国际象棋时实现了更具创新性的决策制定和强大的表现。
研究人员相信,AI可以从基于他们承认的创新问题解决机制中受益,即强化学习(RL)代理可以通过试错来解决任何问题。
为了测试他们的假设,他们训练了一个由高质量、多样化的代理组成的联盟,每个代理都基于AlphaZero(AZ),但是通过应用潜在条件架构将它们结合在一起。具体来说,联盟中的每个玩家都通过一个潜在变量来表示。为了鼓励多样性,研究人员采用了行为和反应多样性技术,以内在动机来提高行为多样性,并使用一个为每个玩家抽样对手的配对者来提高反应多样性。
在他们的实证研究中,团队比较了AZdb和更同质化的AZ团队在解决国际象棋难题上的表现。值得注意的是,AZdb在解决数据集中最具挑战性的难题,包括具有挑战性的Penrose位置时,解决率是AZ团队的两倍。 总的来说,这项工作证明了AI代理团队中的多样性奖励。尽管人类和机器智能之间仍然存在差距,但团队希望他们的工作可以作为基础,鼓励更多的研究以弥合这个差距。
明日预告
《理解AI思维-AI基础系列文章第14篇》AI使用复杂的神经网络进行文本生成,将句子分解为标记,并预测下一个标记。需要理解这些AI是数学函数,而非思维实体。这些基本概念对于深入学习和理解人工智能至关重要。