下一图集
性能暴跌25%:高通旗舰芯片骁龙8 Gen 3今年或提早发布
无模型强化学习很合适游戏范畴应用。往常强化学习范畴的一大问题就是数据的缺乏,运用强化学习锻炼系统需求大量的重复实验和试错,要抵达人类锻炼15分钟的水平,机器需求大约80小时的实时游戏,关于围棋来说,要抵达超人的水平,机器需求完成大约2000万盘的自对弈。Deepmind最近的《星际争霸2》AI则完成了大约200年的游戏时间。 [查看原文]
<< 上一图集
下一图集 >>