分享

为什么多巴胺会让你变得更加冲动?

 SHP周 2019-06-23

在过去的几十年中,神经化学递质多巴胺作为大脑奖励分子被人们熟知。它之所以被称为大脑奖励分子,是因为人们观察到当体内多巴胺水平上升时,动物和人类会产生被奖励的满足感;机体在这种满足感的激励下,会寻求更多可引起多巴胺分泌的体验或物质。

但是你可能不知道的是,多巴胺还要为你的冲动负责。

研究人员从理论上推定,多巴胺源于一种古老的机制。经过进化,这种机制通过让机体产生快感来激励它们追求可以满足个体需求的事物——从生存所需的营养物质到那些已得到社会认可的复杂欲望,再或者是金钱这种用于换取社会资源的票据。 

多巴胺除了能让人们产生被奖励的感觉之外,还会让人们变得更容易冲动。帕金森患者就频繁受到后者的影响。

帕金森病人体内多巴胺分泌不足,因此大多需要服用促进多巴胺产生的左旋多巴,或者是刺激多巴胺受体的阿朴吗啡等药物(该类药物发生作用的方式类似于多巴胺天然释放的过程)。

临床医师和研究人员观察到帕金森患者在接受药物治疗过的程中容易形成强迫性的赌博、购物和饮食习惯。除了药物,酒精或可卡因等物质也会令大脑内的多巴胺分泌量暂时增加,因此长期接触这些物质的人常容易冲动行事。

无论是在消遣性毒品,还是在多巴胺能药物的影响下,人类都很容易做出一些类似的事情——变得渴望一时的快感而明显缺乏远见。

理论上来讲,相比于需要等待的遥远奖励,大多数动物和人类都更偏爱实时奖励。然而,大部分人会在眼前利益与长期利益之间犹豫和挣扎。有一部分人相比于其他人更容易受到短期利益的诱惑。这就给我们提出了一个问题:每个人的冲动程度不同,这是不是大脑多巴胺系统的遗传差异导致的?

当我们在权衡利弊作出选择时,多巴胺是如何参与其中的?在日常生活中或在可卡因等毒品的影响下,这种神经化学物质又如何改变我们的行为倾向,让我们变冲动的?

要了解上述问题,我们首先需要搞清楚什么东西会刺激大脑释放多巴胺,或者在何种情况下大脑细胞会释放多巴胺。为了找出问题的答案,研究人员多次检测了腹侧被盖区(VTA)这个大脑区域。

之所以检测这个区域,是因为隐藏在大脑深处的这个区域是多巴胺的主要产地,聚集在此处的神经细胞能产生大量的多巴胺。

研究人员在实验中记录了猴子在受到奖励,比如收到几滴果汁或小份水果时大脑腹侧被盖区数百个多巴胺神经元的活动。 

每个黑点代表一个尖峰信号,表示神经元在释放化学物质的过程中(在这个实验中,化学物质为多巴胺)产生的信号。神经元能通过这个信号与其他神经元沟通。

左框:随着时间的推移,腹侧被盖区中的某个神经元产生的尖峰信号。

右框:同一个神经元在猴子获得意想不到的奖励时产生的尖峰信号。

下框:当猴子收到意外的奖励时,作为响应,其大脑腹侧被盖区中的神经元变得十分活跃,并在短时间内产生了许多尖峰信号。这种神经元活动的增加或爆发导致腹侧被盖区中的神经元释放大量多巴胺到其他脑区的脑细胞中。

如果告诉猴子某种特定的声响预示着奖励的到来,那么猴子们一旦听到这种声音,其脑内的多巴胺神经元的活动就会激增。由此产生的大量多巴胺警示猴子它马上就会得到奖励,这使得猴子能集中注意力,避免错过奖励。

历时数十年前的这项实验表明:

(1)多巴胺神经元对意外奖励非常敏感 ;

(2)神经细胞释放的多巴胺能够帮助大脑掌握奖励的相关讯息。多巴胺的活性随着奖励幅度的增加而增加,这使得神经化学递质能够向大脑发送更强大的教学信号,从而塑造我们的基本行为倾向,即某件事带来的奖励越大,我们就越有动力。 

但如果我问你,你愿意现在就拿到 50 美金还是愿意再等两个月拿到 50 美金?你想必会选择前者——立马就拿到这笔钱,对吗?如果把钱换成果汁,猴子们在面对同样的问题时也会做出与我们一样的选择。两个月的等待降低了我们对 50 美金的兴趣。这是因为等待时间的长短也是决定奖励价值的一个重要因素

当动物(包括人类)在不同的行动方案之间做选择时,他们不仅需要考虑不同的行动可以带来的回报,还需要考虑收获这些回报所需的时间。

松鼠们在找到橡果时,是应该选择立刻吃掉它,还是把它埋起来为冬眠做打算?如果选择后者,它就必须承担橡果可能被盗的风险。

类似地,一万两千年前的古人在得到一把谷物时,是应该选择立刻吃掉它,还是把它埋在土里,试试看它能不能生根发芽,从而获得更大的回报( 并从此开始农业革命)?但是谁知道在等待谷物成熟的期间会不会发生干旱或洪水呢?

我们知道,等待和延迟都是有风险的,这也就是为什么在权衡选择利弊时,大脑需要考虑时间流逝。我们的生活经验和实验证据都表明,等待会降低奖励在我们心中的主观价值。这叫做“延迟折扣”现象。这也是为什么动物或人类天生着迷于及时享乐的原因了——我们能立即感受到当下的快乐带来的价值,或者说当下享乐的价值没有被时间所腐蚀。

延迟给猴子喝果汁的时间,会如何影响猴子大脑内的多巴胺分泌呢?研究人员在一项实验中记录了猴子大脑深处的一组多巴胺细胞活动的全过程。

在这个实验当中,科学家为了保证猴子能够理解等待时长的概念,在任务开始的时候屏幕上会闪现两张图片,它们代表两种不同份量的果汁。猴子自然会把目光投向他们想要选择的那张图片。随后,紧接着出现在屏幕上的是两张代表不同等待时长的图像。

研究人员通过这种方式告诉猴子,不同的选择对应不同的等待时长。他们在正式记录猴子脑内的多巴胺细胞活动之前,会要求猴子重复这个任务 2,0000 次,以此来保证猴子们能充分理解他们需要等待一段时间才能得到果汁。

这个实验的结果是,距离奖励的日子越遥远,猴子大脑种的多巴胺细胞活动就越不活跃,细胞释放的多巴胺数量就越少。而猴子本身的表现则和多巴胺神经元的活动类似——如果猴子需要等待才能享受奖励,那么它们就会表现得没那么兴奋。

除了猴脑,研究人员还探究了奖励延迟对人脑的影响。利用 fMRI 技术,研究人员测量了流向各大脑区域的血液的富氧性,并据此确定脑内各区域的活动水平。研究人员发现:人类在期盼金钱奖励时,等待的时间越长,大脑(主要是多巴胺作用的多个脑区)对奖励的反应也就越平淡。

多巴胺在促进我们追求奖励方面起着至关重要的作用,而延迟享受则减弱了大脑奖赏系统对奖励的反应,这可能从根本上解释了,为什么延迟会让一个奖励失去它的吸引力。事实上,这个fMRI 研究还发现,如果一个人的大脑对奖励延迟的反应越消极,这个人越有可能失去耐心去追求短期回报。

那么如果改变我们大脑多巴胺系统的运作过程,是否可以动摇我们的耐心,让我们放弃等待, 做出冲动的决定呢? 

在回答这个问题之前,我们首先要弄清楚如何科学地评价一个人的冲动程度。一个可行的方法是让实验参与者(无论他们是猴子、人类还是老鼠)在实时奖励与远期奖励之间做一个选择。

不过如果参与者面对的是两个数额一致,等待时长不同的奖励,那么他们当然会选择可以更快兑现的那个奖励。这样一来研究人员就无法量化人们的冲动程度了(因为每个参与者的决定都是相同的)。

因此,实验人员通常会要求被试者在较小的实时奖励和较大的未来奖励之间做选择。在这种情况下,有利有弊的选择为每个参与者留下很大的选择空间。比如实验人员问参与者他们是愿意立即就有 20 美元转入他们的银行账户,还是愿意在 6 个月后获得 40 美元的银行转帐,另外,如果第二个选择是需要等上 12 个月才能获得 40 美元,人们又会作何选择呢?

为了测量特定奖励因等待时间而会失去多少价值,研究人员记录了人们对不同选择的偏好。

比如,如果一个人无所谓立即收到 20 美金还是在 12 个月的等待后收到 80 美金,那么我们可以说,这两种奖励在他们心中的价值是一样的。对于这个人来说,他可能选择 20 美金,也可能选择 80 美金,这两个选择在他心中没有差别——因为需要等待,80 美金的价值变得并不比 20 美金高。那么我们便可以认为, 12 个月的等待期让 80 美金的主观价值贬值为了原来的 1/4 。

通过这种实验设计,一个人的无偏好平衡点(不等待就可以拿到的钱和等待一段时间可以拿到多一些的钱这两个选择对这个人来说是同等价值的)就可以用来量化等待时间对应的奖励价值。研究人员利用这一点探究了等待时长与奖励贬值之间的关系,并得到了所谓的“延迟折扣”函数,这个函数进一步揭示了不同人拥有的不同冲动水平。

以下三个“延迟折扣函数”代表了三种不同冲动水平的人。

延迟折扣函数(AVERAGE)代表人们平均冲动水平,该曲线显示:随着需要等待的时间变长,奖励在人们心中的主观价值稳步下降。也就是说,如果需要等待 180 天才能拿到奖励(曲线上的最后一个点),那么奖励的价值只有初始价值(也就是没有等待时长的价值)的一半。这意味着,人们无所谓 180 天后拿到 100 美金还是立即就拿到 50 美金。

蓝色延迟折扣函数(PAYIENT)代表了一个非常有耐心的人。对于他来说,奖励的价值几乎不受等待或延迟的影响。也就是说,决定他们行动的几乎就是是奖励的绝对数量,而不是等待时间的长短。

绿色延迟折扣函数(IMPULSIVE)展示了一个十分冲动的人。该图显示,这个人几乎无法忍受等待,将奖励推迟一个月就会使得其价值降至原始价值的 10% 。显然这个人认为等待是不值得,他宁愿立即获得 10 美金,而不是等待 180 天获得 100 美金。我们大多数人可能无法理解他的这种选择,因为他错过了更有利的远期利益。因此,我们可以认为这个人十分冲动,更偏爱实时奖励而非远期回报。相关研究显示,长期服用促进多巴胺分泌的药物的人更容易冲动,因为此类药物会从根本上影响奖励在我们心中的价值。

在另一项实验中,实验人员让身体健康的参与者服用一定剂量的 L-DOPA(一种促进多巴胺释放的药物),并让他们在近期奖励与远期奖励之间做选择。几个小时后,随着多巴胺能药物开始逐渐发挥作用,实验参与者变得更难容忍等待,因为在他们心目中,因为等待而给奖励打的折扣变得更大了。与服药之前相比,他们变得更加在乎眼前的利益。 也就是说,在一个人大脑奖赏系统的多巴胺水平上升后,金钱奖励因为等待而会失去更多的价值。 

然而值得注意的是,服用了多巴胺药物的参与者做决定所花的时间和平时相差不多,这说明他们的决定并不是仓促而就的。在深思熟虑之后,这些参与者仍然认为实时奖励更具有吸引力。这充分说明了多巴胺药物能够向我们的大脑传递出“奖励不值得等待”的讯息,使我们的行为变得更加冲动。

当然,多巴胺增强药物不是解释冲动行为的唯一原因。上文讨论过的三种延迟折扣函数说明了人们的冲动程度本身就不尽相同。

一些研究证据表明,人体内多巴胺系统各组成部分的差异可以解释人们在冲动性上的先天差异。这其中尤其重要的是多巴胺 D2 受体。

这些多巴胺受体非常特殊,它们有的位于突触后细胞的树突上,有的位于突触前细胞的末端上。由于多巴胺 D2 受体位于释放多巴胺的神经细胞的末端,因此它能够检测细胞附近的神经化学递质浓度,进而帮助调节多巴胺的释放数量,防止多巴胺过量积聚。也就是说,多巴胺D2 受体能控制大脑中多巴胺的释放量。

D2 受体在功能上的先天差异可以影响人们的冲动性行为,这或许就可以解释为什么有的人生来就更为冲动。研究人员发现,天生冲动的人大脑中功能正常的 D2 受体数量很少或少于一般水平,这就好像是他们大脑中控制多巴胺释放的刹车生锈了一样。

容易冲动的人在遇到自然的奖励的时候,大脑会释放比一般人更多的多巴胺。类似的机制也发生在头脑冲动的老鼠身上,科学家发现这些老鼠的 D2 受体功能也存在衰退和多巴胺反应过于剧烈的现象。

框一:D2 受体能够控制大脑中多巴胺的释放结果。当细胞附近多巴胺浓度过高时,D2 受体会抑制细胞,使它在本次停止释放多巴胺,在下一次减少多巴胺的释放量。

框二:突触后 D2 受体具有能够抑制钙通道和控制起搏器活动的多种功能。

框三:对于容易冲动的人来说,他们大脑中功能正常的 D2 受体数量很少,或少于正常水平,这意味着他们无法有效地控制多巴胺的释放。容易冲动的大脑会释放过量的多巴胺以响应自然奖励或多巴胺增强药物(例如可卡因或安非他明)。

对于心理变态(Psychopathy)患者这种人格障碍的特点是无情、易冲动、喜欢操纵他人、不惜一切代价寻求满足)来说,他们的大脑看待奖励的方式更加夸张:他们极其缺乏耐心,随着等待的时间的延长,奖励在他们的心中渐渐变得一文不值。

当然我们知道,心理变态是根植于多种生物缺陷的复杂疾病。但即便如此,我们仍然有理由相信,心理变态的冲动倾向源于过分敏感的多巴胺系统。

研究人员在测量了心理病态者的冲动水平后发现,那些得分最高、最容易冲动的被试者们在期盼奖励或吸毒时,他们的多巴胺分泌水平远高于正常水平。这些人经常冲动行事,这可能是因为他们大脑响应实时奖励的多巴胺反应是如此强烈,以至于远期奖励的价值很难和实时的奖励相提并论。

事实上,关于多巴胺细胞是如何获取信息,以及是如何利用这些信息(比如时间信息)调整大脑对奖励的价值判断的,研究人员至今还没有找到答案。  我们甚至不知道大脑是如何以及在哪里感知和记录时间的。  

曾经有研究人员提出,大脑利用某些像心脏起搏器那样运作的神经元计时,神经元有节奏地“滴答”、“嘀嗒”,并凭此积累有关时间流逝的信息。但是起搏器法可能只允许大脑在较小的时间尺度上(范围从几毫秒到几秒)记录时间,而当我们需要用周,月,年来做决定时,起搏器法并没有什么帮助。

虽然科学家还不知道神经元究竟如何感知与记录巨大的时间尺度,但不可否认的是,等待时间的确影响着我们大脑做决策的结果。而你的多巴胺系统或许在很大程度上决定了你是个冲动不计后果的人还是个耐心等待长远回报的人。

作者: Sofia Deleniv

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多