2025年10月29日 • 周三
14:18

亚马逊万人大裁员为AI让路,人力成“可替代生产要素”?

亚马逊日前正式启动大规模裁员,约1.4万名员工被解雇,其中管理层与核心零售业务成为重灾区。与此形成鲜明对比的是,公司正加速部署AI与机器人,并明确表示未来将依靠技术提升效率。此次裁员并非因业绩不佳,而是被解读为一场面向AI未来的战略性资源重组,标志着一种新型的“人力为AI让路”的替代模式正在上演。 [原文链接]

2025年10月28日 • 周二
13:53

中科院&字节联合推出GAR模型,实现精准区域理解新突破!

核心创新:GAR(Grasp Any Region)突破传统MLLMs局限,既能精准描述用户指定区域,又能建模区域间关系,支持复杂组合推理

技术亮点:通过RoI-Aligned特征回放技术,兼顾局部细节与全局上下文,在GAR-Bench测试中表现超越GPT-4o,直逼最强推理模型

应用前景:为构建自然图像Dense Caption提供新路径,可助力多模态预训练、AIGC数据生成,并可作为Reward Model使用

开源信息:论文、代码、模型已全面开源,支持gradio本地部署

GAR展现了强大的区域理解能力,甚至能zero-shot迁移至视频任务,为多模态理解开辟了新方向!

2025年10月27日 • 周一
15:16

美团开源视频生成模型LongCat-Video,支持生成5分钟长视频

美团发布开源视频模型LongCat-Video,参数规模13.6B,支持文生视频、图生视频及视频延长功能,可生成720p高清视频,时长稳定达数分钟。在多项评测中,其文生视频能力超越多数开源模型,部分维度接近谷歌Veo3,且物理常识理解表现突出。模型采用MIT协议,允许商用,目前已开源。

2025年10月25日 • 周六
12:26

Yoshua Bengio成全球首位百万引用学者,AI发展迎来里程碑

深度学习“三巨头”之一Yoshua Bengio成为Google Scholar上首位引用量突破100万的科学家,标志着AI领域发展的一个里程碑。其引用增长曲线与AI技术爆发的轨迹高度重合,多篇开创性论文如生成对抗网络和《Deep learning》是其主要贡献。他在推动技术突破的同时,也积极投身于AI伦理与安全的倡导工作。

2025年10月24日 • 周五
12:09

斯坦福推出AgentFlow,7B小模型性能超越GPT-4o

斯坦福团队最新提出的AgentFlow框架,通过在线强化学习技术,让仅7B参数的小模型在多项任务表现上超越GPT-4o等超大模型。

该框架采用四智能体协作设计,核心创新Flow-GRPO算法可实现“边做边学”的实时优化。实验显示,基于Qwen-2.5-7B的AgentFlow在搜索、数学、智能体等任务上提升显著,部分任务表现甚至优于大50倍的模型。

研究证明:合理系统设计比单纯扩大参数更有效。

2025年10月23日 • 周四
11:58

10月22日AI领域重要进展

百川发布了Baichuan-M2Plus医疗大模型,以创新的六源循证推理范式和极低的幻觉率,被称为“医生版ChatGPT”并在USMLE测试中取得高分;腾讯混元世界模型1.1版本开源,新增支持多视图及视频输入,实现单卡秒级创造3D世界;国内AI应用公司LiblibAI完成1.3亿美元B轮融资,创下国内AI应用赛道最大单笔融资记录;同时,Anthropic正式发布Claude桌面端以提升用户工作效率;AI智能体平台LangChain完成新一轮融资,投后估值达到12.5亿美元;此外,多名用户投诉ChatGPT引发妄想和偏执等心理创伤,敦促FTC介入,OpenAI则回应称将通过新模型和安全措施加强防护。

2025年10月22日 • 周三
19:24

全球首款万元内人形机器人Bumi正式发布,家用具身智能时代正式开启

该产品由清华团队松延动力研发,具备行走、奔跑、跳跃等完整运动能力,重量仅12kg,并集成图形化编程与语音交互功能,支持儿童在玩中学。

团队此前多次在国际机器人赛事中获奖,技术实力扎实。Bumi成功将人形机器人价格拉至万元以内,是具身智能走向日常生活的关键突破。

2025年10月21日 • 周二
07:49

DeepSeek开源OCR模型引爆硅谷:视觉压缩文本突破长文本处理瓶颈

DeepSeek最新开源模型DeepSeek-OCR引发广泛关注,以创新性的“视觉压缩文本”思路解决长文本算力难题。

核心突破:

将文本压缩为图像处理,大幅减少token使用

3B参数实现SOTA性能,单GPU可运行

压缩率10倍时准确率仍达97%

技术亮点:

编码器实现高压缩比视觉token

支持复杂文档解析

为无限长上下文处理提供新思路

该项目已在GitHub获3.3K星,HuggingFace热榜第二,被业内誉为“AI的JPEG时刻”。

项目地址:GitHub & HuggingFace搜索DeepSeek-OCR

2025年10月20日 • 周一
18:47

OpenAI自曝陷入“算力饥荒”,内部争夺GPU已到“痛苦煎熬”程度

OpenAI总裁Greg Brockman近日承认,公司正面临严重的算力短缺,内部GPU争夺激烈到“令人痛苦”。由于计算资源有限,多项“惊人产品”研发受阻,连ChatGPT Pulse个性化推荐功能也仅向Pro用户开放。

为分配稀缺算力,OpenAI建立分层决策机制:CEO奥特曼与应用CEO划分研究与应用侧资源,首席科学家与研究主管主导研究内部分配,另有专项小组动态调度闲置GPU。Brockman坦言,平衡各团队算力需求“极其艰难”。

与此同时,OpenAI加速布局算力基建,已启动自建数据中心并达成近万亿算力交易。行业共识凸显:AI未来竞赛,算力已成为决定性筹码。

12:45

宇树发布1.8米人形机器人H2,仿生面容引发“恐怖谷”热议

宇树科技新一代人形机器人Unitree H2正式亮相,身高180cm、体重70kg,全身31个自由度,动作灵活度显著提升。H2现场展示舞蹈、功夫与走秀能力,挥拳踢腿稳健协调,但新增的仿生人脸被网友调侃“颜值诡异”,引发恐怖谷效应。尽管形态接近真人,网友更关注其何时能落地洗衣、家务等实用场景。官方称H2旨在“为每个人安全友好地服务”,未来应用方向仍受期待。

点击加载更多