此次,英国“深度思维”公司科学家克里斯托弗·萨摩菲尔德及其同事训练一个AI系统为公共产品的重新分配设计一种新机制。研究团队先让数千名志愿者4人一组参与一次投资博弈。博弈中,每个人会拿到不同数额的钱,并需要决定是把钱留下来自己用,还是为了整个组的利益分享出来,让共享资金连本带利重新返回给自己。
研究团队接下来训练该AI系统寻找一种向个人重新分配资金的策略,策略的受欢迎程度取决于人类选手在决定选择哪种策略再玩一次时的投票结果。这个AI系统成功发现了一种比基线策略得到更多人投票的策略,比如将资金重新平均分配给每个人,或是按照个人贡献的比例返还。当研究团队请其他人类志愿者担任重新分配的决定者时,他们的策略都没有AI的策略受欢迎。
虽然该研究关注的是一次4人参与的特殊版公共产品博弈,但研究人员认为,今后的研究可以继续拓展该AI的概念,并研究其对于更大团体和更复杂的博弈情景是否有效。