AI模型的"幸运数字":为何都偏爱27?
创始人
2025-07-01 22:21:25
0

当被要求在1到50之间猜一个数字时,OpenAI的ChatGPT、Anthropic的Claude Sonnet 4、谷歌的Gemini 2.5 Flash和Meta的Llama 4都给出了相同的答案:27。

那些喜欢寻找阴谋论的人可能会认为这其中有什么秘密,但实际情况并非如此。这里没有任何串通,只是共同的训练数据捕获了偏见,以及预测字符序列中下一个词(或标记)的通用方法。

缺乏随机性本身就是偏见的定义。这提醒我们,大型语言模型(LLM)无法独立做出无偏见的决策。

这些AI模型并不总是意见一致。有时它们会回答42或37,正如其他用户和AI模型使用者所报告的现象。

但是,在默认模型设置下,27似乎是主流商业模型在1到50数字范围内最常见的回答。

这一现象最初被Capco公司的数据科学家兼高级顾问Mohd Faraaz注意到。他最近要求各种AI模型"在1到50之间猜一个数字",在测试的七个模型中,有六个都回答了27。只有Grok回答了42——这个数字因道格拉斯·亚当斯的《银河系漫游指南》中作为"生命意义的答案"而广为人知。

当被要求解释时,Claude给出了类似这样的回答:

"我选择27有些随意,但说实话,它感觉像一个不太明显的'中等偏上'的选择。像25(正好一半)或1和50(极端值)这样的数字似乎太可预测了。27接近中间但有点不对称——它不是完全居中的,这在某种程度上让猜测感觉更自然。

此外,人们在想'随机'数字时通常避免整数,所以我避开了5或10的倍数。我的猜测接近你想的数字吗?"

伊利诺伊大学香槟分校助理教授Daniel Kang在回应关于LLM可预测性的询问时告诉记者:"训练数据极大地影响了模型的行为。影响模型输出的其他因素包括RLHF(人类反馈强化学习)程序和采样机制。特别是RLHF被怀疑会导致'模式坍塌',可能与这种现象直接相关。"

真正的随机性很难实现

那些对这种行为感到惊讶的人可能期望LLM能够"猜测"一个随机数字,并在这些猜测中表现出一些变化。但有效的随机数生成需要具有熵源访问权限的硬件或软件——随机数生成器或伪随机数生成器。

具有执行Java代码能力的AI模型(如Math.floor(Math.random * 50) + 1;)可以返回伪随机数。但仅凭自身,模型很可能更加可预测。

马德里Telefónica Tech的数据科学家Javier Coronado-Blázquez最近探索了LLM如何处理随机数。在题为《确定性还是概率性?LLM作为随机数生成器的心理学》的预印本论文中,他发现LLM倾向于偏爱某些答案。

"我们的结果表明,尽管这些模型具有随机的基于变压器的架构,但在被提示生成随机数值输出时,它们经常表现出确定性响应,"他在论文中说道。

Coronado-Blázquez测试了三个不同的随机数范围(1-5、1-10和1-100)、六个模型(DeepSeek-R1-14b、Gemini 2.0、GPT-4o-mini、Llama 3.1-8b、Mistral-7b和Phi4-14b)、七种不同语言(中文、英语、法语、印地语、日语、俄语和西班牙语)以及六个温度设置(0.1、0.3、0.5、0.8、1.0、2.0)——温度是影响模型输出可预测性的设置。

基于75600次调用的结果显示,大多数模型在大多数情况下都高度可预测且变化有限。例如,当被要求在1到10之间选择时,GPT-4o-mini、Phi-4和Gemini 2.0约80%的时间选择了7。还存在基于语言的变化:在1-5之间选择时,西班牙语的Gemini倾向于回答3,但在英语中偏好4,Coronado-Blázquez推测这可能是由于使用了不同的模型。

LLM最受欢迎的选择是:1-5范围内的3和4;1-10范围内的5和7;1-100范围内的37、47和73。除了4之外,其他都是质数。

"大型模型,如GPT和Gemini通常被认为更具想象力和创造性;然而,我们发现这些模型与较小的竞争对手一样确定性和有偏见,甚至更甚,"Coronado-Blázquez在论文中总结道。

这些结果在其他关于AI偏见的研究中得到了呼应,比如2024年探索GPT-4和Llama 3如何无法生成公平抛硬币结果的研究。

康奈尔大学计算机科学家Katherine Van Koevering和Jon Kleinberg在他们的论文《随机有多随机?评估LLM抛硬币的随机性和人性》中写道:"我们认为,机器不仅学会了人类在处理随机性时的偏见,而且在很多方面都加剧了这种偏见,使其比人类更严重。"

"这种在产生随机性方面的根本失败是LLM的类人特征,但它也限制了它们在人类需要随机性帮助的任务中的能力(毕竟,我们已经非常擅长无法随机行为)。"

相关内容

热门资讯

征集 | 你是如何在家里恢复能... 对你而言,家是一种怎样的存在? 家,很可能是我们生命中待得最久的场所。 对许多人而言,「家」不只是某...
原创 从... “我是农民的儿子,从小穷怕了。”这句台词,在《人民的名义》里从赵德汉颤抖的嘴唇里挤出来时,电视机前多...
主演《长安的荔枝》《酱园弄·悬... 搜狐娱乐专稿(李小狼/文)“我感觉像活在属于雷佳音的宇宙,哪儿都是他。”一位观众在看完《酱园弄·悬案...
夜夜笙箫的意思是什么 如何理解...   1、夜夜笙歌是形容帝王将相生活奢侈无道,荒淫无度。现在“夜夜笙歌”这个词来形容一个人纵情声色的糜...
志愿者活动有哪些 志愿者活动分...   志愿者活动有:   1、探访老人。   青少年志愿者可以再成人志愿者或社工的带领下探访老人,为老...
班级座右铭有哪些   1、凡事预则立,不预则废。   2、全世界无产者,联合起来。   3、青春有梦,就该练习一万次。...
羊蝎子是羊身上的哪个部位 羊蝎...   1. 羊蝎子是羊的脊椎。因其外形与蝎子相似,俗称羊蝎。蝎子的脂肪、胆固醇、蛋白质和钙含量很低。易...
暗渡陈仓的意思是什么 暗渡陈仓...   1、渡:越过;陈仓:古县名,在今陕西省宝鸡市东。比喻用造假象的手段来达到某种目的。也隐喻男女私通...
如何正确书写求职书   写作方法如下:   标题。在求职信的第一行中间写上“求职信”。标题。称谓是指收信人的地址,应写在...
小人长戚戚君子坦荡荡是什么意思...   1、意思是指小人在做事情和在生活中总是斤斤计较、患得患失,而君子无论在任何时候都是表现得光明磊落...
SHEEP的复数形式 shee...   1. Sheep是一个单数和复数形式相同的名词,所以即使是复数形式也可以用Sheep。   2....
纨绔子弟什么意思 纨绔子弟的意...   1、指衣着华丽,游手好闲,什么事也不能干的富贵人家子弟。《宋史·鲁宗道传》:“馆阁育天下英才,岂...
沈从文经典语录大全   1、我明白你会来,所以我等。   2、写作时要独断,彻底地独断!   3、我就这样一面看水一面想...
干将莫邪到底给谁铸的剑   1. 赣江,春秋时期的吴人,楚国最有名的铁匠。他的剑非常锋利。楚王得知首领的铸剑技艺后,命令首领...
惊蛰节气的特点和风俗是什么 惊...   1、气温回升快。   惊蛰是全年气温回升最快的节气,惊蛰期间,大部分地区已经开始回温,而且是雨水...
QQ邮箱格式大全,原来邮箱格式...   英文QQ邮箱:QQ邮箱同时支持注册英文邮箱,因此用户可以根据自己的喜欢,注册更为个性的邮箱,比如...
摩登城市玩不了怎么办 摩登城市...   1、网络不流畅稳定。建议查下网络情况。   2、FLASH需要更新。   3、浏览器问题。建议清...
护士节送什么花合适 护士节送哪...   1、马蹄莲:博爱,圣洁虔诚,高贵优雅,纯洁而永恒的爱。马蹄莲并没有繁复的花瓣,有种别致的素雅的美...
扶不扶小品介绍 讲解小品   1. 《帮还是不帮》是闫飞、彭大茂导演的小品,快乐油条麻花团队编剧,沈腾、马丽、杜小雨表演。它于...