AI智能体
-
AI周报:智谱GLM-4.6V革新视觉Agent,谷歌Gemini 2.5与OpenAI GPT-5.2齐发,多模态与智能体技术迎来爆发期
12月8日 【开源】 智谱AI发布GLM-4.6V系列多模态大模型,包含GLM-4.6V(106B)云端版和GLM-4.6V-Flash(9B)轻量版。该系列模型支持128k超长上下文,在同参数规模下实现了视觉理解SOTA性能。其最大亮点在于首次将Function Call能力原生融入视觉模型架构,打通了从“视觉感知”到“可执行行动”的完整链路,为多模态Ag…
-
实战指南:基于LangChain与FastAPI构建实时多工具AI智能体
构建一个可用于生产的、工具增强型 LLM Agent,使其具备 Token 流式输出、代码执行、搜索能力,并利用 FastAPI 实现高性能 API 服务。 ChatGPT 的出现带来了震撼的体验,但开发者很快开始思考:如何超越“聊天”本身?我们能否构建一个能够实时推理、联网搜索、执行代码、查询数据,并像人类打字一样流式响应的智能体? 答案是肯定的。通过结合…
-
VitaBench评测揭示AI智能体真实应用瓶颈:跨场景成功率仅30%,三大维度量化任务复杂性
点外卖时想让 AI 帮你筛选出符合口味、价格合适、配送及时的餐厅;规划旅行时希望它能一站式搞定机票、酒店、餐厅预订——这些看似简单的需求,对当前的大模型智能体而言,却是一道难以逾越的门槛。 美团 LongCat 团队近日发布的 VitaBench(Versatile Interactive Tasks Benchmark)评测基准,给出了一组值得深思的数据:…
-
交错思维链:AI智能体突破长程规划瓶颈的关键机制
在当今人工智能领域,大模型智能体(AI Agent)的长程规划能力已成为衡量其实际应用价值的重要标尺。然而,一个普遍存在的技术瓶颈——状态漂移(State Drift),严重制约了智能体在复杂多步任务中的表现。当用户要求大模型规划一个为期七天的家庭旅行时,智能体可能在初始阶段表现出色,精准把握用户需求,但随着对话轮次增加和环境信息复杂化,它往往会“遗忘”关键…
-
AI智能体重塑学术评审:从审稿辅助到研究范式变革的深度剖析
在人工智能技术飞速发展的当下,学术论文评审体系正面临前所未有的挑战与机遇。随着全球顶级学术会议如ICLR、CVPR等陆续出台关于大模型使用的审稿规范,AI在学术评审中的角色已从理论探讨进入实践应用阶段。然而,规范与现实之间存在着显著差距——即使在ICLR 2026这样实施“最严管控规则”的会议上,仍有高达五分之一的审稿意见被证实由大模型一键生成。这一现象不仅…
-
MCP Apps提案:从文本交互到可视化界面的范式跃迁,如何重塑AI智能体生态
作为连接AI模型与数字生态的“神经中枢”,MCP(Model Context Protocol)协议已成为智能体(AI Agent)基础设施的核心组件。然而,长期以来,MCP的交互仅局限于文本和结构化数据交换,这种“盲人摸象”般的体验严重制约了复杂应用场景的落地。近日,MCP社区正式提出MCP Apps提案(SEP-1865),旨在填补这一关键空白:通过规范…
-
三大前沿AI智能体开源项目深度解析:从工作流编排到交易决策与视频创作
AI 智能体平台 Astron Agent 是科大讯飞开源的一款实用性较高的 AI 智能体平台。 与 Coze、n8n 等平台类似,Astron Agent 集成了 AI 工作流编排、模型管理、工具集成、RPA 自动化和团队协作功能,但整体设计更为轻量。 它继承了科大讯飞 Astron 平台的核心技术,不仅支持智能体开发的全流程,还创新性地集成了智能 RPA…
-
AI黑客团队Strix:一周狂揽8K星,用多智能体协同渗透测试颠覆传统安全扫描
AI黑客团队Strix:一周狂揽8K星,用多智能体协同渗透测试颠覆传统安全扫描 近日,一个名为 Strix 的开源项目在 GitHub 上迅速走红,凭借其创新的理念在一周内就获得了近 8K 的 Star。 Strix 的理念与传统安全扫描工具有本质区别。它并非一个简单的规则匹配引擎,而是通过模拟真实黑客的思考和行为方式,让 AI 在网站或应用中主动寻找漏洞。…
-
EverMemOS:为AI智能体注入“时间灵魂”的长期记忆操作系统深度解析
在人工智能技术快速演进的当下,长期记忆能力正成为区分普通AI工具与高级智能体的关键分水岭。近日,EverMind团队正式发布其旗舰产品EverMemOS,这款面向人工智能智能体的世界级长期记忆操作系统,旨在成为未来智能体的数据基础设施,为AI赋予持久、连贯、可进化的“灵魂”。本文将从技术架构、行业意义、应用场景三个维度,对这一突破性系统进行深入分析。 **一…
-
GitHub热门项目盘点:从AI智能体记忆系统到轻量级Linux虚拟机,13个YYDS开源工具解析
01 AI 智能体记忆系统:Cognee Cognee 是一个专为 AI 智能体设计的内存管理系统,旨在解决 AI 应用中的知识管理与记忆持久化问题。该项目采用创新的 ECL 流水线架构,包含提取、认知化、加载三个核心阶段,已获得超过 8K Star。 在技术实现上,Cognee 通过将文档内容转化为知识图谱与向量表示相结合的方式,构建了一个动态记忆系统。相…
