近期,浏览器市场正经历一场由AI驱动的深刻变革。从Comet到Atlas,各大厂商纷纷将AI能力深度集成至浏览器中,试图在智能化浪潮中抢占先机。然而,这些尝试往往受限于网络环境、系统兼容性或付费门槛,用户体验参差不齐。在此背景下,Flowith推出的FlowithOS——全球首款专为AI Agent打造的操作系统,以其独特的定位吸引了广泛关注。它虽外观类似浏览器,但核心功能聚焦于让Agent自主执行任务,如自动操作鼠标、运行流程等,并兼容Windows系统,打破了Mac的独占局面。

FlowithOS的最大亮点在于其执行能力。用户Andrew Boils曾演示让Agent自动汇总资讯文档,展示了其自动化潜力。这引发了一个关键问题:FlowithOS能否真正替代人工,实现高效的任务执行?为深入探究,本文从检索执行、信息整合和语义理解三个维度进行系统评测。

首先,需明确AI浏览器的能力范畴。当前市场产品大致分为三类:一是传统浏览器加AI插件(如Chrome、Edge的扩展),功能限于摘要、翻译等基础辅助;二是代理型浏览器(如Comet基础版),AI在侧边栏提供资料查询、信息整理等支持;三是Agent主导型(如Atlas),智能体可直接操作网页、填写表单、执行任务。FlowithOS则独辟蹊径,作为操作系统,它兼具浏览器的检索查看能力和Agent的自主执行功能,旨在让Agent“下地干活”。

评测聚焦两条主线:Agent的检索执行能力,以及AI浏览器的信息整理与语义理解能力。检索执行方面,优秀的标准不仅是点击网页或搜索关键词,而是能否串联完整任务链并交付结果。例如,在测试中,FlowithOS成功执行了“在闲鱼上寻找低于2200元的Pocket3并联系卖家询价”的指令,耗时约10分钟,最终锁定一台砍价至1750元的设备。

这一过程涉及打开平台、关键词检索、价格筛选、详情页访问、发起对话及等待回应等多个环节,显示FlowithOS具备从目标理解到页面操作再到互动的完整行为链执行力。然而,问题同样突出:响应速度较慢,多步骤任务易导致电脑发热卡顿;购买逻辑存在缺陷,如在京东看到合适商品后急于催促下单,而非全面比价,这反映了Agent在任务优先级和用户意图理解上的不足。


为测试多条件任务拆解能力,我们指令FlowithOS“整理安居客上鹤岗市总价低于3万、面积大于45平、朝南户型的房源信息”。任务要求识别价格、面积、朝向三个并列条件,并在执行中逐一落实。FlowithOS耗时5分多钟,返回一套面积45平、售价2.5万的房源,但朝向为东,而非要求的朝南。

系统解释为“未找到朝南房源”,但手动验证在安居客平台轻松发现多套符合条件选项。调取执行路径后,问题根源显现:FlowithOS未勾选“朝向”筛选项,导致结果偏差。这暴露了Agent在结构化处理多目标任务时的弱点——将“全满足”意图误解为“尽量满足”,缺乏严谨的逻辑拆解能力,影响执行准确性。


信息整合能力是AI Agent的另一核心价值。我们测试了FlowithOS对B站UP主“食贫道”视频的分析能力,指令为“分析视频脚本逻辑及可借鉴的叙事技巧”。输出结果结构完整,涵盖了内容主线、讲法分析和表达方式等维度,显示其具备一定的信息提炼和总结能力。

然而,细节处仍存疑点:分析结尾的表述可能暗示依赖预设模板,而非深度语义解析。这提醒我们,FlowithOS在复杂内容理解和创造性归纳方面尚有提升空间。

总体而言,FlowithOS作为专为AI Agent设计的操作系统,在检索执行和信息整合上展现了初步潜力,尤其在线性任务链执行上表现可靠。但其问题不容忽视:执行效率受硬件和优化限制,多条件任务拆解易出错,语义理解深度不足。这些短板使其距离“真正省事”的智能化目标仍有差距。未来,FlowithOS需在算法优化、逻辑严谨性和用户体验上持续迭代,方能在激烈的AI浏览器竞争中脱颖而出。
— 图片补充 —









关注“鲸栖”小程序,掌握最新AI资讯
本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/7323
