DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

DeepSeek连续两日大幅降价编程成本骤降83%,AI价格战再升级

DeepSeek在短短两天内连续两次宣布降价!

在输入输出价格已降至2.5折的基础上,若命中缓存,输入费用还能再享受一折优惠。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

需要特别注意的是,输入缓存折扣没有设置任何时间限制。

DeepSeek研究员陈德里也确认,这一缓存折扣为永久性政策,并贴上了“AGIforEveryone”的标签。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

有学者评论称,此举将彻底重塑人们处理AI记忆的方式。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

原来当初发布时所说的“迈入百万上下文普惠时代”,指的就是这个意思?

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

那么,降价后究竟能节省多少成本呢?

只能说,实际省下的钱比表面数字还要多得多。

实测编程总成本节省83%

首先,在Agent编程任务场景中,输入token的比例远高于输出。

而且DeepSeek的缓存优化本就出色:V4-Pro的输入缓存命中率约为95%,V4-Flash约为91%。

这意味着,实际花费中绝大部分token都是按输入(命中缓存)计费的。

在这一前提下,V4-Pro每百万token仅比V4-Flash贵了0.5分钱。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

此前,量子位曾测试消耗约3500万token,实际花费31.73元。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

将数据交给DeepSeek重新计算,结果与真实花费几乎一致。

但是!

按照降价后的新价格计算,仅需花费5.34元。

整体成本节省约83%,只需支付降价前17%的费用,就能获得相同的产出。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

实际测试中,降价后消耗了1300万V4-Pro token。

缓存命中率略有提升,达到约96%,输出token占比与降价前测试结果相近。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

实际使用1300万token,花费2.36元,与计算结果基本吻合。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

AI价格屠夫强势回归

此次降价引发行业震动,而这并非DeepSeek第一次采取类似策略。

这种商业打法与其技术理念高度契合:通过底层架构和算法的持续创新压低模型推理成本,并将成本优势迅速转化为市场竞争力。

早在2024年8月,DeepSeek就曾对V3进行降价,引发阿里云、字节等大厂跟进,掀起了第一轮token价格战。

R1发布后,又通过夜间空闲时段额外打折的方式,进一步加剧了价格竞争。

如今V4再次挑起价格战,对海外用户的心理冲击更为显著。

若以美元标价,小数点后的位数几乎让人数不清楚。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

有网友总结,学生、AI初学者以及小型企业都将从中受益。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

最后,别忘了那行小字。

DeepSeek又降价!编程成本狂省83%,AI价格屠夫杀回来了

期待下半年,DeepSeek大规模部署华为算力后,价格还能带来怎样的惊喜。

参考链接:
[1]https://x.com/deepseek_ai/status/2048440764368347611?s=20
[2]https://x.com/victor207755822/status/2048442362800804159


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32355

(0)
上一篇 2天前
下一篇 2天前

相关推荐

  • 智谱华章登陆港交所:全球大模型第一股,市值528亿港元开启AGI新纪元

    「全球大模型第一股」来了! 2026年1月8日,北京智谱华章科技股份有限公司(02513.HK)正式在香港联合交易所挂牌上市。 至此,全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司花落中国。 智谱首日开盘价120港元/股,市值528.28亿港元。 在本次IPO发行中,智谱香港公开发售获1159.46倍认购,国际发售获15.28倍认购。以每股11…

    2026年1月8日
    38000
  • 解码新范式:北大团队提出Language Ranker框架,用推荐系统思维重塑LLM生成过程

    在大语言模型(LLM)的快速发展浪潮中,学术界和工业界的研究焦点普遍集中于模型架构优化、参数规模扩展、训练数据增强以及奖励信号强化等方向,这些努力本质上都是在优化模型的输出概率分布。然而,一个长期被相对忽视的关键环节是:如何将这些复杂的概率分布高效、精准地转化为高质量的文本生成结果——即解码(decoding)阶段。传统的解码策略,如贪婪解码、束搜索(Bea…

    2025年11月30日
    34600
  • 蚂蚁灵波开源最强具身智能大脑LingBot-VLA:20000小时真实数据验证Scaling Law,实现“一个大脑,多个身体”

    从3000小时到20000小时:真实数据验证Scaling Law 从3000小时到整整20000小时。 真实世界数据中的Scaling Law,直接催生了一个强大的VLA(视觉-语言-动作)基座模型! 这就是蚂蚁灵波最新开源的具身智能基座模型——LingBot-VLA。 为何称其为当前最强?首先看数据。 仅从“20000小时”这个规模来看,LingBot-…

    2026年1月28日
    65300
  • 魔珐星云:突破“不可能三角”,开启具身智能3D数字人交互新纪元

    在人工智能技术快速演进的浪潮中,具身智能正从实验室概念加速走向商业化落地。近日,魔珐科技发布的全球首个面向开发者的具身智能基础设施——「魔珐星云」具身智能3D数字人开放平台,标志着这一领域迈出了关键一步。该平台不仅将大语言模型与实体机器人连接起来,更通过创新的技术架构,实现了高质量、低延迟、高并发与低成本之间的平衡,为数字人交互体验带来了革命性突破。 魔珐星…

    2025年10月29日
    31400
  • 美团LongCat-Flash-Omni:全模态实时交互开源模型的架构突破与产业影响

    在AI模型竞争日趋白热化的当下,美团最新开源的LongCat-Flash-Omni模型以“全模态实时交互”为核心卖点,不仅刷新了开源多模态模型的性能基准,更在架构设计层面展现了独特的技术路径。这款总参数560B、激活参数仅27B的MoE架构模型,成功实现了多模态能力与推理效率的平衡,标志着开源大模型在实用化道路上迈出了关键一步。 从性能表现来看,LongCa…

    2025年11月3日
    28000