更新时间:2021-10-13 09:14:18
大家好,我是本栏目的编辑郝帅。现在我给大家解释一下上面的问题。谷歌正在帮助研究人员通过为他们自己的项目打开一个强化学习框架来寻求训练人工智能模型。
到目前为止,强化学习已经被用于一些最令人印象深刻的AI演示中,包括那些在Alpha Go和Dota 2中击败人类专业游戏玩家的演示。谷歌的子公司DeepMind将其用于Deep Q网络(DQN)。
建立强化学习框架需要时间和重要资源。为了让AI充分发挥它的潜力,它需要变得更容易接近。
从今天开始,谷歌正在开发一个基于TensorFlow的开源增强框架——它的机器学习库——可以在GitHub上获得。
谷歌大脑研究人员巴勃罗塞缪尔卡斯特罗和马克贝勒马尔在一篇博客文章中写道:
“灵感来自大脑激励行为的主要组成部分之一,这反映了神经科学和强化学习研究之间的强大历史联系。该平台旨在实现那种可以促进激进发现的思辨研究。
这个版本还包括一组说明如何使用我们的框架的协作。"
谷歌的框架设计有三个关键点:灵活性、稳定性和可重复性。
该公司为街机学习环境提供了15个代码示例——一个使用视频游戏评估人工智能技术性能的平台——以及四种不同的机器学习模型:C51、上面提到的DQN、隐式索引网络和彩虹代理。
强化学习是最有效的训练方法之一。如果你正在训练一只狗,提供治疗作为对所需行为的奖励是实践中积极强化的一个关键例子。
训练机也是类似的概念,只提供奖励或者保持零零,而不是好吃的商品或者工资。
Bellemare和Castro写道:“我们希望我们框架的灵活性和易用性将使研究人员能够尝试新的想法,无论是渐进的还是激进的。“我们积极将其应用到研究中,发现它使我们能够灵活、快速地迭代许多想法。”
“我们非常高兴看到一个更大的社区能够做到这一点。”