• DeepSeek颠覆多模态推理:7056倍压缩视觉Token,性能媲美GPT-5.4

    “Seeing is not Reasoning.” 当 DeepSeek 团队在其最新论文《Thinking with Visual Primitives》中写下这句简短有力的论断时,他们实际上戳破了当前多模态大模型领域一个被普遍忽视却致命的泡沫——我们一直以为让模型看得更清楚就能推理得更好,但真相却是:即便为模型配备显微镜级别的视觉感知能力,其在复杂空间…

    6小时前
    2800
  • AI先驱Karpathy警告:你的编程技能正在过时,LLM正在蒸发整个软件层

    硅谷向来擅长创造新词汇,也擅长迅速将它们抛弃。 去年,人们还在热议“vibe coding”——一种近乎即兴的编程方式:与模型对话、描述需求、快速生成代码。它代表着软件生产门槛的骤降,也象征着一种轻盈乐观的技术气质。 但在今年的 Sequoia Ascent 峰会上,曾推动这一说法流行的 AI 先驱 Andrej Karpathy(以下简称 AK),却抛出一…

    6小时前
    3300
  • 硬件Bug修复,AI智能体为何“水土不服”?北大HWE-Bench基准揭示残酷真相

    “硬件任务暴露了软件基准所压缩的性能差异——在 SWE-bench 上,所有模型挤在 73%到 81%的窄带内,而在 HWE-Bench 上,同样的模型从 47.7%散落至 70.7%,差距从不足 8%骤然拉大到超过 23%。” 2023 年,SWE-bench 的问世,为大语言模型在真实软件工程任务中的表现,提供了一把可量化、可复现的标尺。 两年过去,当 …

    大模型评测 6小时前
    2700
  • GPT-5.6与Jupiter同日曝光!OpenAI和Anthropic的下一代模型军备竞赛加速

    GPT-5.6与Jupiter同日曝光!OpenAI和Anthropic的下一代模型军备竞赛加速 新智元报道 编辑:Aeneas 【新智元导读】 GPT-5.5发布没几天,后台日志里就冒出了GPT-5.6;Anthropic的一个从未见过的代号——Jupiter也炸出来了!两天之内,两家巨头的下一代模型同时浮出水面。新一轮模型军备竞赛,比我们想的都要快! G…

    6小时前
    7000
  • 北大联合快手可灵推出OpenWorldLib:统一世界模型推理框架,破解多任务接口割裂难题

    北大联合快手可灵发布OpenWorldLib:统一世界模型推理框架,破解多任务接口割裂难题 世界模型(World Model)已成为当前AI领域最受瞩目的研究方向之一,其核心目标是构建一个能够对真实世界进行感知、理解、交互与预测的统一智能系统。 然而,在现有研究实践中,不同任务(如交互式视频生成、3D场景建模、视觉-语言-动作(VLA)控制及多模态推理)之间…

    7小时前
    4500
  • iPhone 17 Pro跑400B大模型!Flash-MoE让端侧AI突破物理极限

    编辑|冷猫 有时候看到一些大模型项目,总会怀疑是不是真的有外星人在干预地球科技。 就比如今天这个。 刚看到这个 Demo 时确实有点想笑,已经很久没见过吐词如此缓慢的大模型了。观感上就像“闪电”老师。 尽管每秒只有 0.6 个 tokens 的输出速度,这依然是一项令人难以置信的成果。因为这是一个运行在 iPhone 17 Pro 上的 400B 大模型! …

    7小时前
    3900
  • 苹果自用Claude Code意外泄露,AI开发秘密曝光

    苹果出现重大失误:将内部使用的 Claude.md 文件打包进了官方 App。 这直接证实了一件事——苹果内部正在利用 Claude Code 构建生产级应用。 难道连这家巨头也在搞“Vibe Coding”? 项目级别的 Claude.md 通常用来向 AI 说明项目内容、构建方法、需遵循的规则以及需要避免的雷区…… 这家全球最注重保密的科技公司,最终还是…

    7小时前
    6700
  • 马斯克与奥特曼庭审互撕:承认蒸馏OpenAI,日记曝光10亿身家计划

    听雨 发自 凹非寺量子位 | 公众号 QbitAI 马斯克与奥特曼的这场世纪庭审,爆出的猛料实在太多,连续吃了三天都消化不完。 在马斯克这边,他公开承认xAI通过蒸馏技术使用了OpenAI的模型来训练Grok。 上午刚说“我不对人大喊”,下午就在法庭上高声争执。 律师Savitt追问捐款细节:承诺捐款10亿美元,实际到账3800万,兑现率不足4%。 马斯克急…

    7小时前
    5800
  • AI思考的1分钟,人类摸鱼的黄金时代:从拨号到赛博宠物,等待为何变得如此快乐?

    如果有人问,当今互联网上最神秘、最玄学、连量子力学都解释不清的“时空裂缝”在哪里?答案不在百慕大,也不在诺兰的电影里,而是在 DeepSeek、Claude 或 ChatGPT 思考的那个瞬间。无论是期末周的大学生、Vibe Coding 的程序员,还是熬夜肝方案的游戏策划,大家几乎都在同一件事上达成共识:等待 AI 回复的那一分钟,是全天玩手机最快乐、最理…

    AI产业动态 7小时前
    3200
  • 开源24小时狂揽3.5万Star!Rust打造AI终端Warp,重新定义开发者工作流

    开源仅24小时便斩获3.5万Star。 如今总Star数已突破5万,这个名为Warp的项目,是用Rust语言从零构建的AI终端。 准确来说,它已超越传统终端的范畴,官方将其定位为Agentic Development Environment(智能体开发环境)。 它还被《时代》周刊评为2025年最佳发明之一,OpenAI则是该开源仓库的创始赞助商。 01 开源…

    7小时前
    2200
点击查看更多