AI能忆起昨日的你了但触景生情还有点难

发布时间：2021-11-04 13:39:30 所属栏目：大数据来源：互联网

导读：据谭茗洲介绍，此次深层思维提出将范例建立在深入的强化学习基础上，并引入长期信用分配的原则。首先，智能体需编码并存储感知和事件记忆；然后，智能体需通过识别和访问过去事件的记忆来预测未来的回报；再有，智能体需根据其对未来奖励的贡献来重新评估这

据谭茗洲介绍，此次“深层思维”提出将范例建立在深入的强化学习基础上，并引入长期信用分配的原则。首先，智能体需编码并存储感知和事件记忆；然后，智能体需通过识别和访问过去事件的记忆来预测未来的回报；再有，智能体需根据其对未来奖励的贡献来重新评估这些过去的事件。这样可让智能体使用特定的记忆来信任过去的行为，并对未来做出正确的决策。　　为了做到这一点，“深层思维”论文显示，其做的首要工作是形式化任务结构，主要包括两种类型的任务。具体而言，在第一种信息获取任务中：一阶段，智能体需在无即时奖励情况下探索一个环境来获取信息；二阶段，智能体在很长一段时间内从事一项不相关的干扰任务，并获得许多附带奖励；三阶段，智能体需利用一阶段中得到的信息获取远端奖励。　　在第二种因果任务中：一阶段，智能体需采取行动触发仅具有长期因果关系的某事件；二阶段，同样是一个干扰任务；三阶段，为了取得成功，智能体需利用一阶段活动引起的环境变化来获得成功。　　而在研究这种结构的完整任务之前，研究人员考虑让智能体实现一个更简单的被动过程的任务——“被动视觉匹配”，即智能体不用采取任何主动措施去采集信息，如同一个人在街上走路，不经意间就观察到某些信息一样。　　“深层思维”的论文呈现一个打游戏过程中的简单场景，并让AI智能体对探索过的路径及攻略进行记忆，当然与人类复杂的记忆机制相比，还是相当初期的阶段。　　谭茗洲强调，正如论文所述，新方法的范式拓宽了AI研究的范畴。这是一个有趣的话题，涉及人脑科学的研究，以及神经科学、心理学和行为经济学等多学科交叉研究的尝试，今后还有很长的路要走，需要更多开放性的探索。

（编辑：大连站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2022年优秀预测分析工	一篇学会初级中级高
几时使用机器学习	为何预测分析对零售企

AI能忆起昨日的你了 但触景生情还有点难

AI能忆起昨日的你了但触景生情还有点难