DeepSeek又崩了，年内18次异常，大模型C端免费模式走到十字路口

5 月 28 日，DeepSeek 再次出现服务异常。

公司服务状态页面显示，DeepSeek 网页对话及 API 服务于上午 10 时 21 分出现中断，并于 10 时 50 分恢复服务。根据官网状态页数据，这已经是 DeepSeek 自 2026 年以来出现的第 18 次部分性能异常，也是本月的第 5 次。

5 月 28 日 DeepSeek 服务状态（图源：DeepSeek 官网截图）

业内共识认为，频繁异常的直接原因是算力供需失衡、系统弹性不足。更深层的矛盾在于，互联网 " 免费获客—后期变现 " 的经典路径，在推理成本高企的大模型 C 端市场，已难持续。

纯免费模式很难持久

在互联网时代，许多免费产品的边际成本趋近于零。但对于大模型，尤其是推理模型而言，每一次对话都需消耗实实在在的算力、显存带宽。用户越活跃，边际成本越发刚性，这与传统互联网模式下成本随规模扩大而逐渐摊薄的逻辑截然不同。

然而，C 端需求十分旺盛。根据 OpenRouter 监测数据显示，上周（5 月 18 日至 5 月 24 日）全球 AI 大模型总调用量攀升至 28.9 万亿 Token，连续五周上涨；其中，中国大模型周调用量达 9.22 万亿 Token，环比激增 19.89%，连续四周超越美国（4.93 万亿 Token，环比增长 16.27%）。DeepSeek-V4-Flash 更以单周 3.43 万亿 Token、环比暴涨 66% 的成绩登顶全球榜首。

旺盛用户需求与刚性算力成本的矛盾，成为 DeepSeek 稳定运营的最大阻碍。

那么，C 端纯免费模式还能否持续？

专注研究 AIGC、媒介大数据的中央民族大学新闻与传播学院副教授向安玲对时代周报记者表示，从商业逻辑上看，如果有良好的商业闭环，比如通过用户对话获取高价值数据，结合广告或 B 端买单的方式，理论上也能维持运营，但这往往会影响用户体验。如果不考虑卖数据或卖广告等方式，纯免费模式确实很难持久，因为模型能力、服务成本与用户体验三者相互约束：用户规模增长需要平台持续扩容，导致成本上升，否则就只能让用户排队或降级到小模型，体验会急剧下降。

降价抢占 API 市场份额

向安玲认为，对大模型可持续发展而言，比较现实的方案有两种：一是分层收费，基础版免费，用于日常问答和轻量任务以实现获客；深度推理、长上下文等增强功能则收费，或采用按量收费，设定免费阈值，超出后按 Token 计费；二是 B 端反哺 C 端的路径，B 端企业的付费意愿更成熟，可通过私有化部署、定制化方案或售卖算力和 API 获得收入，再用这笔收入补贴 C 端的免费服务，同时将 C 端沉淀的脱敏使用数据包装成产品卖给 B 端。

DeepSeek 已经出手，进一步吸纳 API 付费用户。

5 月 22 日晚间，DeepSeek 官方宣布，DeepSeek-V4-Pro 模型 API 价格将于 2026 年 5 月 31 日结束限时优惠后将不再恢复原价，而是正式调整为原定价的 1/4。这意味着此前 2.5 折的折扣将永久保留。

据官方披露，DeepSeek-V4 采用自研稀疏注意力机制与混合专家模型，在处理百万级 Token 长上下文时，算力消耗仅为上代产品的 27%，大幅减少了单位推理成本。同时，V4 兼容华为昇腾等国产芯片，大幅摆脱对海外高端算力的依赖，有效降低了硬件采购与运维成本。

2026 年以来，由于 HBM（‌ 高带宽内存 ‌）价格半年暴涨超 500%，高端 GPU（图形处理器）供不应求，加上推理端调用量激增，亚马逊、微软及国内主流云厂商纷纷上调 API 定价。DeepSeek 和小米是其中的两个异类。5 月 27 日，小米旗下 MiMo 团队宣布，MiMo-V2.5 系列大模型 API 永久降价，最高降幅达到 99%。

向安玲认为，API 降价意味着大幅降低中小开发者与企业用户的 AI 应用门槛，扩大用户付费群体，在 " 付费已成共识 " 的 API 市场抢占份额。

若此番降价成功抢占市场份额，未来 DeepSeek 或有望通过 B 端规模化收入，为 C 端免费模式的持续运转提供资金支撑。