模型对比 - 鲸林向海

开源项目

一张图看懂主流大模型架构！AI研究者整理「LLM Architecture Gallery」在线图谱

近年来，大模型领域发展迅速，新模型层出不穷。从 GPT、Llama、Gemma、Mistral，到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等，几乎每周都有新架构发布。然而，随着架构创新日益增多，理解它们却变得愈发困难。不同论文中的模型结构图风格各异，模块命名也不统一，即便是研究者，也很难快速把握一个模型的关键改动之处。纵观过去几年…

2026年3月16日

952000

大模型评测

通义 Qwen3.5-Flash 测评：开源新锐的剑之所及

核心结论：开源新锐的剑之所及基本情况：通义千问近期发布了Qwen3.5-Flash模型。该模型是开源Qwen3.5-35B-A3B的增强版本。官方宣称此代Flash模型的能力可媲美前代Qwen3-235B。在推理模式下，其表现确实大幅领先于235B；但在新模式下的稳定性仍需打磨，综合中位表现与235B基本持平。考虑到235B的参数量级更大，这一结果仍显…

2026年2月26日

665000

大模型推理

成本与性能的完美平衡：字节豆包Seed 2.0 Lite深度评测，73.9%准确率仅需5.4元/千次调用

春节前夕，字节跳动正式发布了 Seed 2.0 系列大模型。在先前的评测中，我们已经对该系列的旗舰版本 Doubao-Seed-2.0-pro 进行了详细分析。在实际的商业落地与开发场景中，模型的成本控制往往与性能表现同等重要。与 Doubao-Seed-2.0-pro 版本同期发布的，还有定位更加轻量、普惠的 Doubao-Seed-2.0-lite 模…

2026年2月24日

3.8K000

AI产业动态

字节Seed-2.0-pro深度评测：挑战GPT与Gemini，多模态推理新标杆

短的结论：通往下一个时代的钥匙基本情况：字节跳动推出的多模态大模型 Seed-2.0-pro，是其技术序列中的关键升级。此前，Doubao 1.8 版本已展现出接近国际领先水平的潜力，而如今经过全面打磨的 Seed-2.0-pro 旨在确立其顶尖地位。综合来看，Seed-2.0-pro 无愧于“Pro”的定位，在核心能力上与 Gemini 3 Pro …

2026年2月14日

1.2K000