GUI Agent

  • Mac本地AI新突破:4B模型实现476 tokens/s,数据不上云也能操控桌面

    《Mac本地AI新突破:4B模型实现476 tokens/s,数据不上云也能操控桌面》 前段时间,一个名为 Skill 的开源项目引起了关注,它能让 Agent 控制你的 Mac。这个工具通过纯视觉方式理解桌面上的任何软件界面,像人类一样进行操作,并且所有处理都在你自己的电脑上完成,数据不会上传到云端。 继 Skill 开源之后,该团队最近终于开源了其端侧模…

    5天前
    18300
  • 从TNT到AutoGLM:开源GUI Agent如何重塑人机交互与隐私边界

    在科技发展的长河中,某些超前的构想往往因时代局限而被视为激进的赌博,却在未来某个节点以更成熟的形式重新定义行业。七年前,锤子科技推出的TNT(Touch & Talk)系统,试图通过触控与语音结合的方式“重新定义个人电脑”,却因当时AI技术的不成熟而沦为科技圈的“永生梗”。然而,在2025年的今天,随着大模型与智能体技术的爆发,我们惊讶地发现:TNT…

    2025年12月10日
    40400
  • AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮

    12月1日 【开源】阶跃星辰开源GELab-Zero阶跃星辰开源了GELab-Zero,首次将GUI Agent模型与完整的配套基础设施同步开放,支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录,取得了SOTA成绩。此外,阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily,旨…

    2025年12月8日
    56100
  • GUI Agent技术深度解析:中兴通讯如何突破手机端AI交互瓶颈

    随着移动智能技术的快速发展,手机端AI交互正迎来革命性变革。GUI Agent(图形用户界面智能体)作为新一代人机交互范式,正在重塑流量分发格局,催生千亿级市场机遇。苹果、华为、字节跳动、美团、智谱AI等科技巨头纷纷布局这一赛道,而中兴通讯凭借其自研技术框架,在这一领域取得了突破性进展。 2025年9月,美团率先推出支持平台内“一句话点餐”的AI Agent…

    2025年11月4日
    59200