大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 财经

为超越人类记忆,他们给ChatGPT配上了小抄

2024-04-13 简体 HK SG TW

今天小编分享的财经经验:为超越人类记忆,他们给ChatGPT配上了小抄,欢迎阅读。

文 |   追问 nextquestion

" 读书破万卷,下笔如有神。" 这一古语在现代大模型的训练过程中有了更为清晰的诠释。在足够多的训练数据基础上,AI 在诸多任务上已获得了比肩人类的表现。为了方便理解,一种观点将大模型拟人化,认为大模型也与人类一样,拥有记忆,甚至拥有相似的记忆模式和机制。然而,正如不应简单将飞机类比为铁鸟,人类记忆从产生到提取的过程,都与基于上下文预测下一个词的语言模型有着本质的区别。

不过,对人类记忆的研究为我们理解大型模型的记忆机制提供了一个出发点。人类记忆分为长期记忆和短期记忆(又称工作记忆)。对于大型模型而言,其 " 长期记忆 " 存储在模型的亿万参数中,短期记忆则体现为模型一次对话中可回忆起的上下文长度的 context。例如 GPT-4 的 context 是 128k,这相当于可一次性输入 10 万汉字左右。

但这种类比真的有效吗?大语言模型与人类记忆有何异同?我们又该如何借助人类的记忆机制解决大模型应用尝试中所遇到的问题?

01 大模型的长期记忆与人类的相似

对于任何动物而言,其大腦功能都只是为了在进化的无情筛选中胜出。作为交流工具的语言也并不例外。在语言中,诸如语法结构、递归嵌套等复杂特征,探究其最底层的目的,仍在于更高效、准确地完成沟通。既如此,在一般情况下,语言就不必追求完美无缺。对于经过人类强化调整过的大模型,其本质同样是概率的、随机的。于是可以通过调整温度(用于调整模型生成时文本创作和多样性的超参数)这一参数,让模型的输出看起来更具有创造性。

就记忆而言,大模型与人类一样,呈现出首因效应和近因效应 [ 1 ] ,尤其是当需要记忆的事实更多时(图 1)。

首因效应:primary effect,即先入为主,记忆时对第一印象念念不忘;近因效应:recency effect,即对事物的最近一次接触给人留下深刻的感知或认知。

▷图 1:大模型的预测准确性随词汇而呈现先下降再上升,与人类记忆类似。图源:参考文献 1

这一性质是模型大小达到一定阈值之后出现的涌现特征(图 2),而当模型参数只有 70M 时,模型实际上无法预测更远的单词,所以也不会出现首因效应。

▷图 2:不同参数大小的模型在预测不同位置单词时的准确性。图源:参考文献 1

在学习过程中,人类可以通过重复来提升记忆效果,这一现象在大模型中也会出现(图 3)。此外,相比于直接重复待学习的内容,将内容更改顺序后重复学习,模型的效果还会有所提升。

▷图 3:对比模型在面对重复内容时的预测准确性。图源:参考文献 1

当人类在面对相互矛盾的事实时,记忆会出现差错,这意味着遗忘的原因不在于记忆随时间衰减,而在于记忆产生时存在干扰。大模型在面对相互冲突的事实时,也会有类似的表现,当冲突越具体(例如冲突来自于同一个人而非不同国家的人),记忆的差错就越明显(图 4)。

▷图 4:在加入不同类型的干扰信息后,大模型的预测准确性显著下降。图源:参考文献 1

此外,加拿大认知心理学家托尔文(Endel Tulving)认为,记忆的存储和读取是两个相互独立的过程,这一点也适合大模型,其训练和推理过程中使用的机制截然不同。托尔文将长期记忆进一步分为陈述性记忆和程式性记忆,其中陈述性记忆包括语义记忆和情景记忆。

对于大模型来说,语义记忆对应于模型通过预训练或微调过程积累的知识库,这些知识隐式地存储在其参数中。与此同时,情景记忆的对应体现在模型处理或生成文本时,依赖于特定上下文信息的能力上。然而,当生成全新内容时,所需激活的是类似于程式性记忆的能力,这超越了单纯的情景记忆。 [ 4 ]

尽管在训练过程中,大模型主要涉及到显式的情景记忆的应用,程式性记忆并未显著涉及。在推理过程中,大型语言模型利用输入的上下文信息来引用先前的对话或与当前语境相关的数据,这一过程可以被视为对情景记忆的模拟调用。这表明,尽管大模型在训练过程中主要处理与特定实例相关的显式信息,它们仍能通过处理与之前互動相关的上下文信息,展现出一种类似于人类情景记忆的能力。进一步地,有研究者认为,当模型接收到足够详细和具体的上下文信息时,它能够 " 激活 " 更复杂的行为模式,类似于人类的程式性记忆,从而展现出因果推断、心智模拟等高级涌现能力。

虽然大模型和人腦在特定表现上呈现出相似性,但这并不代表两者也有着相似的信息处理机制。实际上,对于大模型为何会表现出这样的特征,学界目前也还没有明确的结论。例如上述研究中,我们并不清楚如果只考虑大模型最上层的参数,能否重现诸如首因效应的特征,也不清楚当限定上下文的范围时,模型的表现是否会改变。或许通过受限的大模型,可以更进一步定位大模型与人类记忆相似的模块,从而有助于对此现象给予解释。

02 大模型通过 " 外挂 " 增加记忆容量

理解记忆的对于拓展大模型的能力至关重要。正如解决数学难题时在草稿纸上记录步骤可增强我们的工作记忆一样,为大模型引入 " 记忆外挂 " 技术,可以帮助模型显著提升其工作记忆。

例如,通过TiM 系统应用,让大模型在每次回答问题之前,都对外部的存储空间进行一定处理,包括插入、遗忘和合并(见图 6)。这样,大模型在应对多轮对话或问题时,可以更有效地处理并回忆上下文信息,准确检索出所需信息。类似的方式还包括递归式生成场景记忆 [ 6 ] ,该方法可视作让大模型在每一轮回答完问题后,总结前一轮问题包含的上下文,将其放入外置记忆中,从而避免大模型在多轮对话时忘记前几次谈话中的内容。

▷图 6:对比大模型传统的记忆与新提出的 TiM 在回答问题时的表现。图源:参考文献 5

为了解决长文本处理的挑战,2023 年在 NIPS 上发表的一篇论文提出了一种名为LongMem的方法 [ 7 ] 。这项技术应对的问题不是多轮对话,而是一次处理一个长文本。通过将长文本切抽成多个部分,每部分由固定的大模型独立处理,随后通过一个可训练的残差网络综合各部分信息,根据提问的具体内容选择最相关的部分进行回答。这样,LongMem 可以让大模型更准确地提取信息。

▷图 7:LongMem 机制的运作流程示意图。图源:参考文献 7

在机器人控制问题上,应用大模型同样需要给其配上记忆模块 [ 8 ] ,这一类模型被称为具身 AI。在机器人控制任务中,具身 AI 的 " 眼睛 " 通过处理视觉传感器的输入来产生周围环境的语言描述,之后其 " 神经 Nerve" 结合机器人的自身动作,生成以第一人称为中心的状态信息描述。这些信息随后被编码并存储于一个高级的语言处理系统中,即所谓的 " 大腦 "。同时这个大腦还可根据导航任务,产生控制指令。

这样的运作方式,能够实现机器人与人经由自然语言的直接互动,还可利用大模型中存储的海量常识,来识别和适应环境变化,例如某些东西是有生命会运动的,我需要避开它。这样构建的机器人,就会在导航时 " 意识到 " 眼前的猫尽管趴着不动,也可能会在自己靠近后避开。这类具身 AI 的基础,就在于生成、存储及更新关于自身状态的记忆模型。

▷图 8:LLM-Brain 具身 AI 的架构。图源:参考文献 8

另一个应用大模型加记忆的例子来自于搜索场景。研究者提出名为CoPS [ 9 ] 的架构,其由三个部分组成:外部记忆模块存储用户的搜索记录和行为,之后交由大模型来推断搜索用户的意图及背景,并基于推断的个人档案对传统搜索引擎给出的链接进行重现排序,从而使搜索引擎给出的结果更加个性化。由于利用了预训练的大模型,CoPS 可以进行零尝试学习,即不需要招募测试用户,收集用户数据及反馈,就可以利用大模型中的知识提升搜索的准确性。

▷图 9:CoPS 架构。图源:参考文献 9

通过向大模型增加外部记忆来拓展大模型的应用范围,其还有众多案例。研究表明 [ 10 ] ,在被赋予可读写的关联性外部记忆后,当前 Transformer 架构的语言模型在计算上可被视作 " 通用图灵机 "。这意味着,这些模型不仅能够处理有限长度的输入字元串,还能够模拟任何算法,处理任意大小的输入。

03 大模型的 " 幻觉 "无需克服

认知科学家莉莎 · 费德曼 · 巴瑞特(Lisa Feldman Bartlett)指出:" 记忆不是简单地重新激活无数固定的、毫无生趣的、细碎的痕迹,而是一种富有想象力的重构或者构建。" 这一描述似乎对大模型也颇为适合。

理解了生物记忆的不完美,我们也许不该再将大模型的 " 幻觉 " 视为一种需要克服的顽疾,而是将其视作一种内生的、不可避免的涌现特征。就如《红楼梦》中贾宝玉所言," 古来杜撰的多了,偏我杜撰不得 "。事实上,《红楼梦》的作者也践行了笔下人物的话,在书中杜撰了多个典故。可这丝毫不会影响《红楼梦》的伟大。一旦我们将大模型的幻觉视作记忆生成过程中的副产品,就不应当在大模型自身的框架内试图消除 " 幻觉 ",而应通过外部记忆的方式解决幻觉在特定场景下带来的问题。甚至,还可以将 " 幻觉 " 视作通向 AGI 过程中遇到的山谷,需要先设法让模型增加幻觉,从而促进模型的创造力。

虽然无论对于大模型还是人腦,我们目前都没有完全理解其记忆的运作机制。不过,神经科学研究中有着对记忆的多种分类方式,这或许提醒大模型开发者不应只采用一种记忆模式。通过在大模型外部增加显式的记忆,可以显著提升大模型在长文本,以及多轮对话中的表现,同时扩展大模型的应用场景。这给只想通过简单扩大模型规模以卷出更好模型的开发者,提出了另一条更为经济且资源节省的优化路径。

在神经科学中,记忆是相互竞争的,这样的动态特征意味着记忆的提取、更新、强化与遗忘应当在同一框架下被审视。而在当今的大模型中,记忆的产生和读取是相互独立的。大模型不会由于反复读取某段记忆就更新对其的存储,而人类每次读取长期记忆都是一次生成式的往日再现,反复读写之后,最初的原始记忆就可能发生改变,这也是之后大模型和记忆相关研究者需要注意的差异。 

参考文献

[ 1 ] https://arxiv.org/abs/2311.03839

[ 2 ] https://arxiv.org/ftp/arxiv/papers/2309/2309.01660.pdf

[ 3 ] https://arxiv.org/abs/2402.15052

[ 4 ] https://arxiv.org/pdf/2401.02509.pdf

[ 5 ]   https://arxiv.org/pdf/2311.08719.pdf

[ 6 ] https://arxiv.org/pdf/2308.15022.pdf

[ 7 ] https://arxiv.org/pdf/2306.07174.pdf

[ 8 ] https://arxiv.org/pdf/2304.09349v1.pdf

[ 9 ] https://arxiv.org/pdf/2402.10548.pdf

[ 10 ] https://arxiv.org/abs/2301.04589

熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們