准备好做Agent基模,价格战可能下半年到来。

文|陈梅希

编|园长

没有开声势浩大的全球发布会,没有安排老板录制一档视频博客,DeepSeek-V4预览版就这么默默更新了,一如它过去所做的那样。时间选在了周五上午,作为自媒体从业者也万分感谢,没有让我们在周末的北影节观影现场突然离场去研究一个大模型的全新版本。

公告里说的和没说的

更新通知发布在DeepSeek的官方公众号,全文只有1087个字。同步公开的,DeepSeek-V4 模型的开源链接和技术报告。纵览这些公开信息,有以下几件事值得关注:

1.官网、App、API调用全部上线新模型,分为DeepSeek-v4-pro和DeepSeek-v4-flash两种,可自行切换调用。两种模型均为开源模型。

性能上,开源的DeepSeek-V4-Pro能比肩顶级闭源模型。Agent能力大幅提高,其中Coding能力在其公司内部的评测体验中“优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距”;文档和PPT生成能力均大幅提升。(第二部分我们将对其代码能力和PPT生成能力进行横向测评。)

DeepSeek内部已将员工使用的Agentic Coding 模型切换为DeepSeek-V4,证明其在实际研发场景中已具备生产力价值。

2.技术革新方面,这个版本在上下文问题上最值得关注的是超高的上下文效率,而非上下文规模。

DeepSeek-V4通过全新的混合注意力机制,在实现超长上下文能力的同时,降低了对计算和显存的需求,根据官方文档:“从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。”

阅读其技术文档可以发现,全新的注意力机制结合了CSA (Compressed Sparse Attention,压缩稀疏注意力)和HCA (Heavily Compressed Attention,重度压缩注意力),其中CSA搭配DeepSeek自研的稀疏注意力算法,而HCA对键值缓存采用更高的压缩倍率,但保留了Transformer架构里的稠密注意力算法。粗浅理解一下,就是压缩得少的跳着看,已经被猛猛压缩过的那就每个都看。

To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

这种混合注意力机制的核心理念,是在超长上下文中,并不是所有键值都需要全注意力和稠密计算。其实带入人类自己的阅读体验也是如此,我们看论文时总是聚精会神地先看摘要、导语和结论,而在文献综述环节意识模糊。本科选修网络文学课,老师在第一节课就告诉我们这学期要至少读完两千万字的网文,并介绍了一种“扫文”方式:对角线阅读法,每页书只看左上角、正中间、右下角,现在想想,这何尝不是一种稀疏注意力算法。

注意力的压缩,是为了减少计算量,最终目标是提升超长上下文的效率。根据技术报告,“在一百万tokens上下文中,V4-Pro的推理计算量仅需V3.2的27%,KV缓存占用仅为10%。”

In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.

3.按理说,token压缩结合稀疏注意力机制提高计算效率后,厂商的计算成本和显存成本(同等token规模下)都会大幅减少,最终会反映到token定价上。DeepSeek-V4在今天也公布了定价,每百万tokens的定价如下:

这个价格,和海外头部大模型相比,有很大的优势。以DeepSeek-V4自称交付质量接近的Opus 4.6 非思考模型为例,命中缓存的输入单价为0.5美元/百万token,未命中缓存的输入单价为5美元/百万token,输出单价为25美元/百万token。按4月24日当日汇率计算,DeepSeek-V4-pro的三项单价,分别是Opus 4.6的24%、35%和14%。

海外头部大模型API调用计价(截至2026.4.24),刺猬公社手动统计,仅供参考;数据来源:各平台官网

但和国内竞品相比,DeepSeek-V4暂时还没有对着价格大砍一刀的架势。

国内模型中同样有百万上下文能力的是阿里在本月初发布的Qwen3.6-plus,对单次输入的token数进行分层计价,当单次输入小于256K时,Qwen3.6-plus的输入和输出单价均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之间。

国内头部大模型API调用计价(截至2026.4.24),刺猬公社手动统计,仅供参考;数据来源:各平台官网、公告

4.准备好做Agent基模,价格战可能下半年到来

华为昇腾芯片在DeepSeek 官方公告中被提及,虽然只是以出现在图片注释中的低调形式。在更新公告的定价说明截图下,有一行注释小字:“受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”

这条注释,也许在宣告一种可能性:在DeepSeek-V4 使用大幅降低计算成本的新注意力机制后,V4-Pro没有大幅降价,是因为高端算力稀缺,而不是成本不允许降价。换言之,一旦国产高端算力在下半年顺利接棒,DeepSeek就有空间大幅下调token定价。

DeepSeek也做好了充足的、充当Agent 基模的准备,毕竟在更新公告里特意写道自己“针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化”。除了三位耳熟能详的Agent选手,CodeBuddy是腾讯云开发的代码助手。

超高效上下文,更像是token价格战的一页序章。也有从业者提供了另一种视角:当DeepSeek已经公开宣布下半年会大幅下调V4-Pro价格后,DeepSeek的模型能力线和价格线,将成为闭源模型的“斩杀线”。

实测DeepSeek-V4-Pro

因为更新公告里重点提及了代码能力、PPT生成能力,刺猬公社基于这两个领域,对DeepSeek-V4预览版进行了简单的横向测试,对照的是近期发布/更新的,分别以这两项能力为卖点的产品。

1.代码能力VS阿里秒悟

秒悟是阿里巴巴ATH事业群于将近10天前发布的AI开发平台,让0代码能力的用户能使用自然语言完成自己的产品开发。刚上线时,我让秒悟做了一个《作家推荐器》,通过给用户做8道选择题判断TA可能喜欢的作家,题库一共30道,覆盖100位作家。经过大概1个小时的调试后,这个测试小网页上线了:

虽然不知道为什么秒悟在配色上唯爱清华紫,而且在出文本选择题的时候像吃了50吨张嘉佳(然而它自己建构的作家库里没有张嘉佳),但作为和朋友自娱自乐的小玩具,可用度还是非常高的。我自己做了测试,竟然真的测出了我喜欢的作家。

DeepSeek-V4-Pro正式上线后,我用同样的提示词,测试它做网页的能力。大概5分钟后,测试网页完成了。

第一次生成,点击跳转逻辑并未生效,DeepSeek选择重写数千行代码,先提供了一个只包含10个作家的简化版。等简化版运行成功,它确认自己代码结构没有问题后,我让它把作家库恢复到100个,它依然选择了把代码全部重写,而不是让我替换若干个代码模块。

DeepSeek给出的解决方式,让我恍惚觉得自己拥有无限的token火力,在对这个小小的网页需求进行过饱和攻击,而在此过程中,我其实完全没有付费。

横向测评之后,秒悟的优势在于0操作门槛,最终的交付结果是一个用户可以打开的网页,用户可以直接分享给朋友或是互联网上的任何人。劣势在于价格,做一个作家推荐器大概花掉了40000积分,按照积分的零售价格是40块,如果不想花钱,按每天登录赠送2000积分的速度,大概连续登录20天可以做一个玩具网页。最终我斥39元巨资订购了每月100000积分的套餐。

DeepSeek-V4-Pro的最大优势当然是免费,几千行代码说写就写;另一个优势是快速,虽然没有左拉一个助手,右拉一个设计师,建构若干项蜂群工程,但不到10分钟就做完了。劣势则是只能生成一份代码,让我打包成html格式再去浏览器打开,如果想直接分享到线上,还需要自己完成部署。另外,如果说使用qwen的秒悟像吃了五十吨张嘉佳老师,那么DeepSeek做出来的作家推荐器就像是吃了五十吨DeepSeek。

2.PPT生成能力VS MaxHermes

测试PPT生成能力时,我直接选择了使用DeepSeek-V4的技术文档,共59页pdf,要求是生成一个给大学生做讲座用的PPT。

MaxHermes很快完成了一个可以直接下载的PPT文件,结构和美化都做得不错。劣势是要花钱,为了使用MaxHermes,我需要花39元买一个基础版会员,再花49元订购一个token plan包月。

DeepSeek则生成了代码,需要在本地用Python运行,没有那些Agent方便,而且样式有些过于朴素了。最大优点依然是完全免费,留了图片的占位符,需要用户自己做一些图片替换工作。题外话,为什么不管写网站还是做PPT,大模型们都不约而同地默认选择了紫色系?

如果用Claude Code 、OpenClaw等Agent产品搭配DeepSeek 4.0的API,应该能获得更便捷的体验,但就要走DeepSeek的API计费逻辑了,无法像现在这样完全免费。

更何况,现在是周五晚上9点半国产大模型的更新固然重要使我从早到晚坐在电脑前兴奋地敲了一天字但是周五晚上跟朋友约好去五道营喝酒听歌同样重要我将在关注AI进展的同时保卫我的线下生活那正是我在开头就感谢DeepSeek 在周五上午发布更新的原因。

(点击阅读原文可以试用我的小小作家推荐器。)