心理所研究揭示基于单眼的无意识奖赏学习的机制-凯发k8官网手机客户端

科研进展

心理所研究揭示基于单眼的无意识奖赏学习的机制

来源:心理研究所发布时间:2021-06-30

  奖赏可以影响人的知觉和行为,这在生活中随处可见,例如外卖平台、打车软件对骑手和司机实行的金钱与积分的奖惩规则,再到其他各种行业职场里常见的绩效考核,以及体育竞技中的奖项奖金的激励……

  值得注意的是,绝大多数的实验室研究乃至生活经验,无一例外都具有一个基本共同点——人们可以从意识和知觉上来区分哪些事物能带来奖赏、哪些不能。这种意识和知觉上的差异为人们追求奖赏提供了重要的线索,所以在很多情况下,人们很清楚在何种情况下可以得到奖赏,并借此寻求更多的奖赏。其实,这也符合很多奖励规则制定的初衷:希望藉由奖励来引导人们选择一种行为或者关注一件事物。

  奖励规则的制定显然是人们有意为之的。可是大脑的奖赏系统未必需要靠意识来调控奖赏学习。现在已经了解到,对于奖赏的神经调节信号弥散地分布在整个大脑,奖赏系统也与大脑中很多脑区都有连接。这种连接的复杂性使得无意识的奖赏学习成为潜在的可能。但以往研究难以证明这一猜想,因为正如前面所说的,以往研究的范式里用来关联有无奖赏(或者不同程度的奖赏)的视觉刺激在外观上大多是可以区分的。

  为解决这个问题,中国科学院心理研究所的鲍敏研究组与蒋毅研究组合作开展了一项研究。以往研究发现,人类对于单眼呈现的刺激并不能很好地判断刺激究竟是通过哪只眼呈现的。研究者把一个单眼刺激究竟从哪只眼呈现,简称为刺激的“眼源信息”。利用这个原理,研究者尝试把奖赏和眼源信息关联起来。如图1a所示,在实验1a中,通过立体镜给被试的一只眼呈现彩色动态的连续闪烁刺激,另一只眼呈现一个目标刺激。在这种视觉呈现方式下,被试一开始只能意识到连续闪烁刺激,目标刺激则被掩蔽于意识之外。但是随着呈现时间的推移,目标刺激有可能破除连续闪烁刺激的掩蔽,被试便能够看见目标刺激了。被试被告知实验任务是只要看见目标刺激就按键。被试不知道的是,目标刺激在有的试次中呈现在左眼,有的试次中呈现在右眼,并且只有当被试报告发现在给定的一只眼中呈现的目标时,他(她)才会得到金钱奖赏,我们把这只眼称作“奖赏眼”。根据上面介绍的原理,被试并不能意识到有奖赏的试次和无奖赏的试次仅仅区别在目标刺激呈现在哪只眼;对他们来说,实际感受可能是只有一部分按键报告能伴随奖励。关于这一点,该研究之后通过对96名被试进行的问卷报告得以确认(见图2)。

  由于每个试次有几秒的最长呈现时间限制,如果在限定时间内被试一直没看见目标刺激,也就不会做出反应;倘若这是一个有奖赏试次,也就意味着被试错过了一次赚钱的机会。那么既然被试并不知道目标刺激的眼源信息,随着奖赏学习的进行,被试是否可以习得这个关联?如图1c所示,答案是肯定的。相对于训练前来说,训练过程中被试在有奖赏试次中报告发现目标刺激的概率显著上升。这意味着被试的奖赏系统在训练过程中似乎已经“知道”:只有奖赏眼中呈现的刺激与奖赏有关,需要被更早发现和报告。而被试自己却并不知道这一点,说明发生了无意识的奖赏学习。由于单眼神经元在初级视皮层中存在,因此这种无意识奖赏学习效应可能发生在视觉加工的很早的阶段。

 

图1. 实验1a的刺激和结果

(a) 试次流程; (b) 四种可能的目标刺激,分别对应右、左、下、上的按键报告; (c) 训练阶段1、训练阶段2,目标刺激突破连续闪烁刺激的掩蔽的概率相比于训练前有所增长,且在奖赏眼里增长更为明显。这一基于单眼的奖赏学习效应在后测阶段消失。

 

图2. 实验后的问卷调查发现96名被试中,仅2人报告认为奖赏与刺激呈现在奖赏眼有关。大部分被试要么报告不认为奖赏有规律,要么错误地认为奖赏与其它刺激属性有关联。

 

  实验1b进一步发现,当把目标刺激挪到一个偏离视野中心的位置,并使用一个较为困难的注视点任务来控制被试的注意远离目标刺激所在的位置,这种无意识的奖赏学习效应就消失了。说明该效应的形成需要注意的参与。实验2和实验3证明该效应还依赖连续闪烁刺激所带来的眼间抑制,且当任务中含有意识上的奖赏刺激关联时,无意识的奖赏学习效应就无法被观测到,说明它被意识上的奖赏学习效应遮蔽了。

  总的来说,该研究揭示了人类奖赏系统存在两种不同类型的奖赏学习。其中一种被称为无意识奖赏学习,它并不依赖于意识上可以分辨的奖赏刺激,但是仍需消耗注意资源;另一种可称之为意识上奖赏学习(也是生活中更常见的),它可以教导选择性注意去选择奖赏关联的刺激;而意识上的奖赏学习可以遮蔽无意识的奖赏学习效应。该研究目前已在线发表于british journal of psychology

 

  论文信息:

  dong, x., zhang, m., dong, b., jiang, y., & bao, m.* (2021). reward produces learning of a consciously inaccessible feature. british journal of psychology. [epub ahead of print] doi: 10.1111/bjop.12518.


附件下载:

网站地图