加入收藏 | 设为首页 | 会员中心 | 我要投稿 大连站长网 (https://www.0411zz.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

AI能忆起昨日的你了 但触景生情还有点难

发布时间:2021-11-04 13:39:30 所属栏目:大数据 来源:互联网
导读:据谭茗洲介绍,此次深层思维提出将范例建立在深入的强化学习基础上,并引入长期信用分配的原则。首先,智能体需编码并存储感知和事件记忆;然后,智能体需通过识别和访问过去事件的记忆来预测未来的回报;再有,智能体需根据其对未来奖励的贡献来重新评估这
据谭茗洲介绍,此次“深层思维”提出将范例建立在深入的强化学习基础上,并引入长期信用分配的原则。首先,智能体需编码并存储感知和事件记忆;然后,智能体需通过识别和访问过去事件的记忆来预测未来的回报;再有,智能体需根据其对未来奖励的贡献来重新评估这些过去的事件。这样可让智能体使用特定的记忆来信任过去的行为,并对未来做出正确的决策。     为了做到这一点,“深层思维”论文显示,其做的首要工作是形式化任务结构,主要包括两种类型的任务。具体而言,在第一种信息获取任务中:一阶段,智能体需在无即时奖励情况下探索一个环境来获取信息;二阶段,智能体在很长一段时间内从事一项不相关的干扰任务,并获得许多附带奖励;三阶段,智能体需利用一阶段中得到的信息获取远端奖励。     在第二种因果任务中:一阶段,智能体需采取行动触发仅具有长期因果关系的某事件;二阶段,同样是一个干扰任务;三阶段,为了取得成功,智能体需利用一阶段活动引起的环境变化来获得成功。     而在研究这种结构的完整任务之前,研究人员考虑让智能体实现一个更简单的被动过程的任务——“被动视觉匹配”,即智能体不用采取任何主动措施去采集信息,如同一个人在街上走路,不经意间就观察到某些信息一样。     “深层思维”的论文呈现一个打游戏过程中的简单场景,并让AI智能体对探索过的路径及攻略进行记忆,当然与人类复杂的记忆机制相比,还是相当初期的阶段。     谭茗洲强调,正如论文所述,新方法的范式拓宽了AI研究的范畴。这是一个有趣的话题,涉及人脑科学的研究,以及神经科学、心理学和行为经济学等多学科交叉研究的尝试,今后还有很长的路要走,需要更多开放性的探索。

(编辑:大连站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!