图灵奖得主Hinton和LeCun最新演讲:深度学习如何继续反动 ...(1/36)

更多
2023-2-21 09:29 441人参与 0条评论 自动播放 开灯

图灵奖得主Hinton和LeCun最新演讲:深度学习如何继续反动 ...

无模型强化学习很合适游戏范畴应用。往常强化学习范畴的一大问题就是数据的缺乏,运用强化学习锻炼系统需求大量的重复实验和试错,要抵达人类锻炼15分钟的水平,机器需求大约80小时的实时游戏,关于围棋来说,要抵达超人的水平,机器需求完成大约2000万盘的自对弈。Deepmind最近的《星际争霸2》AI则完成了大约200年的游戏时间。 [查看原文]

上传图片 点击发表评论 (441人参与 0条评论)