• DeepSeek识图模式实测:推理4分钟却秒错,但HTML复原和OCR惊艳全场

    实测 DeepSeek 识图模式:推理耗时4分钟却秒错,但HTML复原与OCR表现惊艳 今天,你被DeepSeek识图模式灰度测试覆盖了吗? 大家对DeepSeek多模态功能的期待已经持续了相当长的时间。随着V4版本的发布,惊喜接踵而至。在官方尚未披露更多细节之前,各路技术爱好者已从不同角度挖掘出关于“识图”能力的诸多线索。 确实有不少发现。 例如,Deep…

    19小时前
    7800
  • DeepSeek多模态模型发布:用坐标“锚定”视觉推理,破解大模型“指代鸿沟”

    五一假期将至,DeepSeek 选择在这个时间点公开一项新技术,引发了广泛关注。 昨天,DeepSeek 的陈小康在 X 平台上发布了一条消息,让人们开始聚焦 DeepSeek 在多模态领域的最新进展。 随后,部分用户已能在 DeepSeek 的网页端和 App 中体验到其多模态能力。 就在刚刚,DeepSeek 在 Github 上正式发布了多模态模型,并…

    19小时前
    21400
  • 1931年前出生的AI,竟写出Python代码?跨越百年的模型震惊学界

    活久见! 一位生活在1931年之前、训练数据里从未接触过任何计算机的AI,跨越了将近一个世纪的时光—— 竟然写出了Python代码?!! 家人们,这真不是科幻小说…… 模型名为 talkie-1930-13b。 操盘手是AI研究员Nick Levine、多伦多大学副教授David Duvenaud,以及大家熟悉的那位——真·GPT系列之父 Alec Radf…

    20小时前
    4500
  • 奥赛奖牌得主去向大揭秘:成为亿万富翁的概率是普通人1500倍

    奥赛奖牌得主去向大揭秘:成为亿万富翁的概率是普通人1500倍 全!部!暴!露! 知名X平台博主Deedy,通过自研爬虫,利用Exa数据抓取工具,成功挖掘了过去25年间18000名IMO、IOI、IPhO奖牌得主的职业去向,并追溯到了其中约50% 的人。 结论只有两行字,但每个数字都狠狠戳在了我的心巴上!!! 这群人成为亿万富翁的概率,是普通人的1500倍。 …

    20小时前
    3800
  • 3款AI画图神器,一句话生成专业技术图,GitHub星数均超3.6K

    01 一句话生成可直接发布的技术图 最近在 GitHub 上发现了一个名为 fireworks-tech-graph 的绘图工具,目前已经积累了 3.6k 的 Star 数。 这个项目的核心功能很简单:你只需用自然语言描述你想要的图表,它就能自动生成 SVG 文件,然后导出为高清 PNG 格式,直接用于博客或 PPT 中。 我查看了它的能力矩阵,确实相当强大…

    20小时前
    5400
  • 美团万亿参数大模型LongCat-2.0发布,完全基于国产算力训练,挑战英伟达生态

    同一天,AI领域迎来两件重大事件正面交锋。 一方面,DeepSeek于2026年4月24日正式发布新一代模型DeepSeek-V4系列预览版,并同步开源。该模型总参数规模达到万亿级别,支持百万字超长上下文。 另一方面,美团低调完成了一项壮举——利用全国产算力集群,训练出万亿参数大模型LongCat-2.0系列预览版(LongCat-2.0-Preview)。…

    20小时前
    10200
  • DeepSeek V4视觉功能灰度测试:真实图像理解能力上线,多模态拼图补齐

    DeepSeek V4 视觉功能灰度测试:真实图像理解能力上线,多模态拼图补齐 DeepSeek 的视觉能力终于来了! 研究员陈小康在社交媒体上发布了一条消息——“Now, we see you.” 随后,另一位研究员陈德里也跟进确认,V4 的视觉模式已开始灰度测试。 看来,那条小鲸鱼的多模态拼图,即将完整。 已经具备真实图像理解能力 过去,用户上传图片后,…

    AI产品库 1天前
    16000
  • 无需训练!开源Web Agent Avenir-Web刷新纪录,成功率53.7%逼近OpenAI Operator

    告别“网页操作翻车”:开源Web Agent Avenir-Web 刷新纪录,成功率飙至53.7% 伦敦大学学院(UCL)、普林斯顿大学与爱丁堡大学的联合研究团队,近日推出了名为 Avenir-Web 的开源框架。它让现有的多模态模型具备了像人类一样操作网页的能力,无需任何额外训练即可投入使用。 现有的Web Agent在处理复杂网页结构(例如 iframe…

    1天前
    12700
  • 商汤SenseNova U1开源模型:本地部署的连续图文生成新霸主

    最近GPT Image 2走红后,网络上充斥着大量足以乱真的AI生成图像。大模型在视觉领域的探索不断深入,既令人感到兴奋,也让人心生敬畏。在当前的AI图像生成领域,GPT Image 2几乎毫无争议地占据着领先地位。然而,如果说云端闭源且收费的最强模型是GPT Image 2,那么能够部署在本地、免费且开源的模型,或许就是SenseNova U1。 由Sen…

    开源项目 1天前
    19400
  • 苹果AI修图终上线,iOS 27全面拥抱AI功能

    今年的 iOS 27,将会弥漫着浓厚的 AI 气息。 根据彭博社的报道,苹果公司计划在今年的 WWDC 开发者大会上,推出一套全新的 AI 修图工具,它将集成于 iPhone、iPad 和 Mac 的照片应用中。沉寂了一年的 Apple 智能,将随着 iOS 27 的发布,再次成为焦点。 两年前,苹果曾公开表示不会涉足 AI 修图功能,但在竞争对手的步步紧逼…

    1天前
    9400
点击查看更多