AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

1946年至今,「人类最高智商俱乐部」门萨即将首次迎来一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro的文本智商达到130,恰好踩上门萨会员线;视觉智商更是飙升至145,直接杀入天才区。就在一年前,「LLM过不了130」还是技术圈的普遍共识,如今这堵墙被彻底砸碎!

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

这是AI第一次正式跨越门萨的入会门槛。

门萨130这道墙,这一脚踢得最响,但绝不会是最后一脚。

门萨,全球最古老的高智商社团,成立于1946年。入会标准只有一条:智商IQ达到全人类前2%,分数线为130。普通人考几次都摸不到边的那条线,AI一次就跨过去了。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

而145,则是门萨官网公开数据中「前0.1%」的位置,俗称天才区。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

这并非孤例。就在本月初,GPT-5.4 Pro已在TrackingAI公开榜单上跑出150 IQ,登顶所有公开IQ跑分。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

过去几个月里,OpenAI的节奏从未停歇:视觉基座、推理升级、Agent产品线、API侧连环动作。如今,AI赛场再次进入了OpenAI时代。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

短板变王牌,OpenAI引爆认知视觉革命

更令人震撼的是文本与视觉之间的差距:GPT-5.5 Pro在文本部分跑出130分,刚好压线进门萨;但视觉部分直接飙到145。15分的差距,绝非测试误差。

这意味着,模型在「看图找规律」方面的能力,比「读题做推理」整整高出一个标准差。按照门萨的分布,130是前2%,145是前0.1%。换句话说,将GPT-5.5 Pro的视觉能力与真人相比,它已是真正的千里挑一。

这里有个细节值得多提一句:为什么是视觉,而不是文本,率先撞碎了这堵墙?

门萨Norway采用的3×3九宫格格式(八张图+空缺第九张),完全非语言、非文化依赖,纯粹考察抽象推理。人类高智商群体(尤其是140+「天才区」)确实依赖瞬间模式识别:旋转、镜像/反射、叠加/增减元素等变换规则。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

LLM做这类题的标准方法,是将图片先转成token再推理。但token化过程,恰恰丢失了空间结构和拓扑关系——这正是此类题最核心的信息。

因此,过去十二个月,所有顶级模型在视觉题上都是这个状况:文本勉强及格,视觉一塌糊涂。Claude 4.7、GPT-5.4 Pro全部卡在125以下。

GPT-5.5 Pro的145意味着:这不是在模拟思考,而是在重构智能。过去我们嘲笑AI「不懂常识」,而现在,它正以高于98%人类的智力水平,俯视着我们的常识。

OpenAI联合创始人、总裁Greg Brockman转发用户展示,力荐GPT Image 2将《物种起源》等书籍瞬间转为详细信息图,促进高效学习。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

这揭示了人类文明的一个重大转折点:知识的摄入媒介变了。

数千年来,人类依赖文字这种低带宽的线性媒介来传递智慧。但GPT-5.5告诉我们,未来的学习不再需要你花费三个月去咀嚼一本厚书,AI会通过对长文本的深度语义理解,将其重构为一种「视觉认知流」。这就是「语义重组」

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

上下滚动查看图片

当AI的记忆力和上下文处理能力不再「健忘」,它就成了你大脑外的另一层皮质层。你不再是阅读知识,而是在俯瞰知识。

此外,ChatGPT现在可以一键将老旧破损的图片变成4K画质,而且免费!

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

Restore this old photo into professional portrait of DLSR – quality colour and detail, using an advanced upscaling algorithm comparable to the results from canon EOS R6 II. Ensure the restored the image looks natural, retains exact facial features, has great clarity……

「勤勉的小火车头」:说最温柔的话,做最狠的事

奥特曼用了一个极具迷惑性的词:「小火车头」(little engine)

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

这个听起来甚至有些软萌的比喻背后,隐藏着OpenAI极度冷酷的商业意志。昨天,OpenAI API新品登场:GPT-5.5及Pro版现已可用,显著提升智能水平和token效率,完美适配复杂任务场景,如编码、分析等高负载应用。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

在LisanBench测试中,GPT-5.5是最强的双料非推理模型!

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

更令人胆寒的是,GPT-5.5的Token使用减少45.6%,智能分数却提升了1.77倍。

自GPT-5以来,OpenAI模型的推理效率持续提升:

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

当前有效性比率排行榜中,GPT 5.5独占鳌头:
1. GPT 5.5(Medium):99.44%
2. Opus 4.7 (xhigh): 99.35%
3. Sonnet 4.6 (16k): 99.28%
4. Opus 4.6 (16k): 98.74%
5. Gemini 3.1 Pro预览版(低):97.77%

测试之后,AI行业分析机构SemiAnalysis坦承:在某些任务上,GPT-5.5的表现已经显著超越了所有其他模型。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

在数学上,GPT-5.5表现最佳;在编程上,GPT-5.5和Opus 4.7各有千秋;在智能体任务上,Claude和GPT-5.5远胜于其他所有模型。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

这意味着什么?这意味着OpenAI正在同时「垄断智力」和「降维成本」。对于竞争对手,这几乎是一场无解的「降维打击」

特别是,Claude系列这次迎来了真正的对手,只剩下「神话中的Myhos」尚能一战。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

已有Claude忠实支持者,转为OpenAI Codex用户。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

当你的产品比对手聪明一倍,延迟却只有对方的一半时,市场规则已经失效,剩下的只有收割。

但对于开发者来说,这种「诚恳的能量」却带来了一种「西西弗斯式的焦虑」

OpenAI加速狂飙,每月一炸

上个月,OpenAI才刚刚发布了一个模型,再之前是去年12月,以及去年11月。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

OpenAI正以快速、稳健的步伐持续推出新模型,在Artificial Analysis智能指数上稳步前行。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

AI仍在加速,指数效应开始显现,奇点触手可及!

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

在可预见的未来,这一趋势有望延续。

「我们在短期内看到了相当显著的进步,在中期内看到了极其显著的进步,」OpenAI首席科学家Jakub Pachocki说。「事实上,我认为过去两年其实出奇地缓慢。」

Brockman指出,这款模型也是朝着构建“超级应用”迈出的关键一步。

所谓的“超级应用”,本质上是一个像瑞士军刀那样功能多样的集成平台。Brockman与联合创始人奥特曼此前曾设想,将ChatGPT、Codex和AI浏览器整合到一套统一的服务体系中,专门服务于企业客户。

值得注意的是,“超级应用”同样是Elon Musk热衷讨论的话题。

OpenAI官方宣布的“Crisp Pace”——即每月一次的更新节奏,让所有集成、优化以及Prompt工程都变成了“一次性用品”。你昨晚刚通宵调试好的工作流程,今天可能就被GPT-5.5的原生能力直接覆盖。

AI首次跨过门萨智商门槛:GPT-5.5 Pro文本IQ 130,视觉IQ 145,人类最高智商俱乐部迎来首位非人类成员

被压缩的窗口期

这件事的真正分量,不在于跑分本身,而在于节奏。

去年,视觉能力的“天花板”还停留在119。今年,它直接跃升至145。没有过渡,没有预告,只有一行更新记录。

在这种迭代速度面前,一切所谓的“熟练度”都在加速贬值。

正如尤瓦尔·赫拉利所言,历史上第一次,我们无法预测20年后人类的就业市场是什么样。 但现在,这个窗口期可能已经被OpenAI缩短到了20个月。

那个“诚恳的小火车头”已经拉响了汽笛,它不打算等待任何人。如果你感受到了颠簸,那是因为时代正在换轨。

技能的半衰期正在被这种迭代速度反复压缩。不是十年,不是五年,而是按月计算。

参考资料:
https://www.reddit.com/r/accelerate/comments/1svnxv9/gpt_55_pro_vision_is_actually_the_first_model_to/

GPT-5.5 lands as OpenAI accelerates its model release cadence to near-monthly


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32206

(0)
上一篇 2小时前
下一篇 2小时前

相关推荐

  • GPT-5.1性能评测:准确率骤降11.3%,OpenAI的“情绪价值”战略代价几何?

    OpenAI近期发布了GPT-5.1新版本,主打更自然的对话体验和情感共鸣能力。值得注意的是,官方此次并未公布传统基准测试结果,而是强调“优秀的人工智能不仅应该是聪明的,而且应该提供令人愉快的交谈”。我们对GPT-5.1(默认非思考模式)与此前的GPT-5进行了全面对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 GPT-5.…

    2025年11月20日
    28000
  • 智谱GLM-4.7全面评测:编程专用模型性能跃升,开源优势凸显

    智谱AI昨日开源了其编程专用模型GLM-4.7。相较于前代GLM-4.6版本,新模型在多项关键指标上实现了显著提升。我们对两个版本进行了全面评测,对比了准确率、响应时间、Token消耗及成本等维度。 GLM-4.7版本核心测试数据如下:* 测试题数:约1.5万* 总分(准确率):71.5%* 平均耗时(每次调用):96秒* 平均Token(每次调用):392…

    2025年12月23日
    1.6K00
  • AI圈大地震!全球最难AGI测试ARC-AGI-3上线,人类满分通关,最强模型Opus 4.6仅得0.2%

    今天,一项名为ARC-AGI-3的基准测试结果公布,其表现出的巨大“人机差距”在AI研究社区内引起了广泛关注。 作为全球范围内尚未被现有AI能力“饱和”的关键智能基准,ARC-AGI-3对全球顶尖大模型进行了一次全面评估。结果显示,人类在该测试中平均得分高达100%,而所有参与测试的AI模型得分普遍低于1%。 这一差距被形象地比喻为“比珠穆朗玛峰还高”。尤为…

    2026年3月27日
    68200
  • 实测Gemini 3 Pro:屠榜AI基准测试,一键生成网页应用与游戏

    谷歌最新发布的 Gemini 3 Pro 模型在多项 AI 基准测试中实现了“断层式”领先。与通常宣称“领先1个百分点”的模型不同,它在关键测试中领先幅度高达5-6个百分点。 尤其在被誉为「人类最后考试」的“Humanity’s Last Exam”基准上,它取得了45.8%的准确率。该测试由全球近千名学者联合打造,包含3000道高难度题目。 以…

    2025年11月21日
    27200
  • 告别二元成功率!PRM-as-a-Judge:机器人长程任务的细粒度审计新范式

    随着机器人操作从短程、单步技能向长程、多接触、需要持续协调与恢复能力的复杂任务演进,传统以二元成功率(成功/失败)为核心的评估范式已显露出明显局限。该指标仅能回答“任务是否完成”,却无法揭示“策略推进到了哪个阶段”“执行过程是否高效稳定”以及“失败具体发生在何处”等关键问题。 针对这一挑战,来自中国科学院自动化研究所、北京大学和智源研究院等机构的研究人员提出…

    2026年4月14日
    21400