• 会聊天的AI小猫入驻桌面,SentiCat实测:写报告做PPT,国产自研能力亮眼

    这么可爱的AI小猫,现在住我电脑桌面上了! 能陪聊,能干活,还能提供情绪价值。 上班累了就找她摸摸鱼,真的感觉心都化了…… 这个抱着AI小猫的女孩叫SUSU,她们都来自AI初创公司SentiPulse思维光谱自主研发的AI Agent产品——SentiCat。 SentiCat拥有三大核心能力:办公自动化、深度研究、代码开发。不管是写报告、做PPT,还是帮你…

    2小时前
    2200
  • 谷歌DeepMind发布Vision Banana:图像生成预训练统一视觉感知任务

    谷歌DeepMind以Nano Banana Pro为底座,最新发布通用多模态视觉大模型Vision Banana —— 何恺明、谢赛宁 参与,证明图像生成预训练,可以成为通用视觉学习的统一范式 。 一个通用模型,零样本迁移下,击败SAM 3、Depth Anything 3等专用模型,分割、深度、法线核心任务刷新多项SOTA。 就像LLM用文本生成统一所有…

    大模型工程 2小时前
    2300
  • DeepSeek-V4预览版发布:百万上下文、Agent能力领先,同步开源

    刚刚,DeepSeek 在官方公众号发文宣布,全新系列模型 DeepSeek-V4 的预览版本正式上线,并同步开源! DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能三大维度上均实现了国内与开源领域的领先。 秉承 DeepSeek 一贯的开放精神,本次发布的模型按大小分为两个版本,欢迎开发者、研究者和企业用户前往体验和下…

    3小时前
    6000
  • 夜间第一人称视觉AI集体失明?EgoNight基准揭示大模型夜晚理解力大幅下降

    人类在夜里走路,即便光线昏暗也能认出熟人、避开障碍。 但AI的第一人称视觉模型到了晚上基本等于“瞎了”。 昏暗光照、反光、噪声、运动模糊,再加上佩戴式设备的抖动和遮挡…让视觉理解这道题,夜间难度直接翻倍。 来自INSAIT、华东师范大学、港科大(广州)、南开大学、复旦大学等机构的研究者提出EgoNight 基准,系统聚焦夜间第一人称视觉理解 这一长期被忽视的…

    3小时前
    1900
  • 华人工程师葛小川将任AppLovin CTO,从Meta离职到硅谷千亿市值公司仅用三年

    硅谷,即将迎来一名新的华人CTO。 毕业于中科大少年班的80后葛小川,将在今年7月1日,任职一家硅谷上市公司的下一任首席技术官。 公司已正式发布了公告,葛小川的老板、公司创始人&CEO Adam Foroughi都在里面激动发言: 我们很高兴能从内部提拔继任者。这次任命充分印证了我们对人才培养的重视,以及在继任计划上的深思熟虑…… 从离职Meta的工…

    AI产业动态 3小时前
    3400
  • 华为openJiuwen推出Team Skills:业界首个多Agent协作标准化规范

    AI工程范式的演进,正从单智能体的“驾驭与治理”,大步迈向多智能体的“协同与进化”。 前不久,华为支持的openJiuwen社区 发布的最新版JiuwenClaw,率先提出了Coordination Engineering。 其凭借Agent Team实现了多智能体自主分工、高效沟通与无缝协作,完成了从“单兵作战”到“精锐团队”的关键跨越。 但一个新的命题随…

    3小时前
    2500
  • 复旦团队提出MacTok:64个Token实现图像生成SOTA,CVPR 2026 Highlight

    在视觉生成领域,提升扩散模型或自回归模型的推理效率,关键在于将图像压缩为更少量的 token。当前主流的图像分词器分为离散(如 VQ-VAE、VQ-GAN)与连续(如 KL-VAE)两派。离散分词器虽然应用广泛,但其不可求导的量化过程需要进行梯度近似,容易引入量化误差。相比之下,连续分词器摒弃了硬性的离散码本,保留了连续平滑的潜在空间,原生支持梯度优化并能容…

    3小时前
    1800
  • GPT-5.5理性算力工程:GB200 NVL72与推理效率的全栈创新

    在 AI 模型迭代趋于渐进的 2026 年,GPT-5.5 的发布试图打破这一僵局。 OpenAI 于 4 月 23 日正式推出 GPT-5.5 及 GPT-5.5 Pro 模型。与此前单纯追求文本生成精度的路线不同,这款新模型将重心放在了“真实工作流”的完成度与推理经济学上。最引发工程界关注的是,GPT-5.5 在实现极高复杂任务处理能力的同时,成功将每 …

    AI产业动态 3小时前
    2900
  • DeepSeek V4正式发布:1.6T参数模型性能对标顶级闭源,Agent能力成最大亮点

    星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。一上来就是王炸级别,而且双双标配百万 token 上下文: 参数量达 1.6T 的 DeepSeek-V4-Pro(49B 激活参数)284B 参数的 DeepSeek-V4-Flash(13B 激活参数)即日起可在官网 chat.deepse…

    5小时前
    63400
  • OpenAI发布GPT-5.5:智能体式工作模型,性能超越对手

    OpenAI 今天发布了 GPT-5.5,称其为公司迄今“最聪明、最直觉化”的模型,也是面向真实工作的全新智能形态。相比上一代,GPT-5.5 的重点是进一步承担复杂任务中的规划、工具调用、结果检查和跨工具执行,被 OpenAI 定位为推动“用 AI 在电脑上完成工作”的关键一步。 赢了 Opus 4.7 和 Mythos? 在与 Anthropic 矛盾日…

    6小时前
    9400
点击查看更多