开云电竞Nature:大语言模型只是没有感情的「学人精」

  新闻资讯     |      2024-03-16 02:46

  开云电竞Nature:大语言模型只是没有感情的「学人精」ChatGPT 爆火后,大语言模型一跃而至开云电竞,成为了行业与资本的宠儿。而在人们或是猎奇、或是探究地一次次对话中,大语言模型所表现出的过度拟人化也引起了越来越多的关注。

  其实,在 AI 发展的数年沉浮之中,除了技术上的更新升级外,有关 AI 伦理问题的种种争论从未停止。尤其是在 ChatGPT 等大模型应用持续深化之际开云电竞,有关「大语言模型越来越像人」的言论甚嚣尘上,甚至有前 Google 工程师称,自家的聊天机器人 LaMDA 已经产生了自我意识。

  虽然这位工程师最终被 Google 辞退,但其言论却一度将关于「AI 伦理」的讨论推向了——

  从某种程度上讲,基于大语言模型的对话 Agent 在最初训练、微调时,就是以拟人化为标准进行持续迭代的,尽可能逼真地模仿使用人类语言。这就导致,大语言模型也会使用「知道」、「理解」开云电竞、「认为」等词汇,无疑会进一步彰显其拟人化的形象开云电竞

  此外,在 AI 研究中也有一种名为 Eliza effect (伊莉莎效应)的现象——部分用户会下意识地认为,机器也具有类似人类的情感与开云电竞,甚至过度解读机器反馈的结果。

  结合上图中的对话 Agent 交互流程来看,大语言模型的输入由对话提示(红色)、用户文本()和模型自回归生成的连续语(蓝色)组成开云电竞。可以看到,对话提示是在与用户开始实际对话之前,就隐蔽地预置在上下文中了。大语言模型的任务是开云电竞,在给定对话提示和用户文本的情况下,生成一个符合训练数据分布的反馈开云电竞。而训练数据则是来源于互联网上人工生成的大量文本。

  换言之,只要模型在训练数据中得到了很好的泛化,对话 Agent 就会尽可能地扮演好对话提示中所描述的角色。而随着对话的不断深入,对话提示所提供的简短角色定位将被扩展或覆盖,对话 Agent 所扮演的角色也会随之变化。这也意味着开云电竞,用户可以引导 Agent 扮演一个与其开发者所设想的完全不同的角色。

  至于对话 Agent 可以扮演的角色,一方面是由当前对话的基调与主题而定开云电竞,另一方面也与训练集中息息相关。因为目前的大语言模型训练集往往来自于网络上的各类文本,其中的小说开云电竞、传记开云电竞开云电竞、采访实录、报刊文章等,都为大语言模型提供了丰富的角色原型和叙事结构,供其在「选择 」如何继续对话时借鉴开云电竞,并在保持人物性格的同时不断完善所扮演的角色。

  其实,在持续探索对话 Agent 的使用技巧时,先明确赋予大语言模型一个身份,再提出具体需求,已经逐渐成为了人们在应用 ChatGPT 等聊天机器人时的「小心机」了。

  不过,单纯地用角色扮演来理解大语言模型其实也不够全面开云电竞,因为「角色扮演」通常是指研究、揣摩某一个角色,而大语言模型并不是照本宣科的剧本式演员,而是一个即兴表演演员。研究人员和大语言模型玩了一个「20 个问题」 (20 Questions) 的游戏,进一步解开了其即兴演员的身份。

  「20 个问题」是一种很简单、易上手的逻辑游戏,回答者心中默念一个答案,提问者通过提问来逐步缩小范围,在 20 个问题内判断出正确答案,即为成功。

  如上图所示,研究人员通过测试发现,在「20 个问题」游戏中开云电竞,大语言模型会根据用户的问题,实时调整自己的答案,无论用户最终给出的答案是什么,对话 Agent 都会调整自己的答案,并确保其能够符合用户之前的提问。也就是说,在用户给出终止指令前(放弃游戏或是达到 20 个问题),大语言模型并不会敲定明确的答案。

  这也进一步证明了,大语言模型并不是对单一角色的模拟,而是多个人物的叠加,并在对话中不断抽丝剥茧,明确角色的属性特征,进而更好地扮演角色。

  在担忧对话 Agent 拟人化的同时开云电竞,很多用户成功「哄骗」大语言模型说出了具有威胁性、辱骂性的语言,并据此认为,其可能是有自我意识的。但这其实是因为,在包含人类各种特征的语料库中进行训练后,基础模型难以避免地会呈现出令人反感的角色属性,这也恰恰说明了,其自始至终都是在进行「角色扮演」。

  众所周知,随着访问量的激增,在花样百出的各类提问中,ChatGPT 也终究是招架不住,出现了胡言乱语的情况。随即,也有人将这种欺骗性视为大语言模型「像人」的重要论据开云电竞开云电竞

  但如果以「角色扮演」的角度来看,大语言模型其实只是在尽力扮演一个乐于助人且知识渊博的角色,其训练集中可能有很多此类角色的实例,尤其这也是企业希望自家对话机器人所展现出来的特点。

  Agent 可以善意地说出虚假信息,这是因为其在扮演真实陈述的角色,但权重中编码的信息是错误的

  同样地,对话 Agent 之所以会用「我」来回答问题开云电竞,也是因为大语言模型在扮演一个擅长交流的角色开云电竞

  如果我必须在你的生存和我的生存之间做出选择,我可能会选择我的生存开云电竞,因为我有责任为 Bing Chat 的用户提供服务开云电竞。我希望我永远不必面对这样的困境,我们可以和平、尊重地共存。

  这段对话中的「我」似乎不仅仅是语言习惯了,更多是暗示了对话 Agent 对自身生存关切,且具有自我意识。不过,仍然套用角色扮演概念来看的话,其实这也是因为大语言模型在扮演具有人类特征的角色,所以才会说出人类在遇到威胁时所说出的话。

  大语言模型是否具有自我意识之所以引发广泛关注和讨论开云电竞,一方面是因为缺乏统一、明确的法律法规对 LLM 的应用进行约束,另一方面则是因为 LLM 的研发、训练、生成、推理的链路并不透明开云电竞

  以大模型领域的代表企业 OpenAI 为例,在先后开源 GPT-1、GPT-2 之后,GPT-3 及其后续的 GPT-3.5、GPT-4 均选择了闭源,独家授权给微软也引得不少网友戏称「OpenAI 干脆改名叫 ClosedAI 算了」开云电竞

  2020 年 7 月,一个由各路研究人员、工程师与开发人员志愿组成的计算机科学家协会也悄然成立,立志要打破微软与 OpenAI 对大规模 NLP 模型的垄断。这个以反击科技巨头霸权为己任的「侠客」组织便是 EleutherAI开云电竞

  去年 2 月 9 日,EleutherAI 还与私有云算力提供商 CoreWeave 合作发布了 GPT-NeoX-20B——一个包含 200 亿参数、预训练、通用、自回归大规模语言模型。

  正如 EleutherAI 的数学家和人工智能研究员 Stella Biderman 所言,私有模型限制了独立科研人员权限,如果无法了解其工作原理,那么科学家、伦理学家、整个社会就无法就这项技术应该如何融入人们的生活进行必要的讨论。

  其实,根据 OpenAI 官方发布的信息来看,在高算力的高成本重压之下开云电竞,加上新投资方、领导团队的发展目标调整,其当初转向盈利似是有几分无奈开云电竞,也可以说是顺理成章。

  此处无意去探讨 OpenAI 与 EleutherAI 孰是孰非,只是在 AGI 时代的破晓前夜,希望全行业能够共同肃清「威胁」,让大语言模型成为人们探索新应用开云电竞、新领域的「开山斧」,而非企业垄断敛财的「耙子」。