ICLR 2026

AutoBio：VLA模型在生物实验室的“图灵测试”——ICLR 2026新基准揭示科研自动化挑战

现有视觉-语言-动作模型的研究和基准测试多集中于家庭场景，缺乏对专业科学场景的适配。生物实验室具有实验流程结构化、操作精度要求高、多模态交互复杂等特点，是评估VLA模型精准操作、视觉推理和指令遵循能力的理想场景。近期，来自香港大学MMLAB与上海交通大学的研究团队提出了AutoBio，一个面向数字化生物实验室的机器人仿真系统与基准测试平台。该工作已被ICL…

2026年2月20日

350000

AI产业动态

自适应视觉推理新突破：MoVT范式让AI学会“看图说话”与“文字思考”的智能切换

本文介绍了复旦大学与阿里巴巴未来生活实验室的研究成果，该工作已被 ICLR 2026 接收。当前，视觉推理方法主要衍生出两种思考模式：一种是与大型语言模型一致的纯文本思考模式；另一种是更贴近图像本身的视觉化思考模式。这两种模式在不同任务领域各有优势，但现有工作通常只专注于单一模式，未能充分利用二者之间的互补性。为此，本文提出了 Mixture-of-Vi…

2026年2月5日

293000

AI产业动态

港科团队突破AI学术博弈：RebuttalAgent用心智理论解码审稿人意图，让反驳回复直击痛点

面对同行评审，许多作者都有过这样的经历：明明回答了审稿人的每一个问题，态度也足够谦卑，为什么最终还是没能打动对方？现有的通用大模型在处理这类任务时，往往陷入一种“表面礼貌”的陷阱：它们擅长生成流畅、委婉的“Thank you for your insightful comment”，却缺乏对审稿人言外之意的深度洞察，导致回复虽然客气，但缺乏直击痛点的说服力…

2026年2月3日

332000

AI产业动态

SIM-CoT：隐式推理新突破，零开销实现可解释的AI内部思考

魏熙林是本文的第一作者，复旦大学博士生，师从林达华教授，研究方向主要为多模态大语言模型与高效人工智能。他目前在上海人工智能实验室实习，指导老师为臧宇航与王佳琦。本文介绍隐式思维链（Implicit Chain-of-Thought）的最新进展——SIM-CoT（Supervised Implicit Chain-of-Thought）。该方法直击了隐式Co…

2026年2月1日

689000