开云app官方在线 20万字不到1分钱，梁文锋把token价钱打骨折了

你的位置：开云app官方在线入口 > 现金捕鱼 > 开云app官方在线 20万字不到1分钱，梁文锋把token价钱打骨折了

发布日期：2026-05-01 03:56 点击次数：161

开云app官方在线 20万字不到1分钱，梁文锋把token价钱打骨折了

梁文锋又入手了，而且如故二连降价。

4 月 25 日，DeepSeek-V4-Pro 开启限时 2.5 折优惠，输入价钱（缓存掷中）降至 0.25 元 / 百万 tokens。

业内还没响应过来呢，服从 4 月 26 日晚间，DeepSeek 就再次降价。

全系 API 输入缓存掷中价钱平直降至首发价的 1/10。

叠加限时扣头后，V4-Pro 的缓存输入低至 0.025 元 / 百万 tokens， V4-Flash 降至 0.02 元 / 百万 tokens，创下全球大模子价钱新低。

这是个什么见识呢？

上海译文出书的《挪威的丛林》，全书约 20 万字。将整本书掷中缓存后喂给 DeepSeek-V4-Pro，那么其总老本不到 1 分钱。

DeepSeek 此次降的，不仅仅 token 的单价。它是把"长文本、长代码、长常识库"这些原来最烧钱的 AI 诓骗场景，完全打入了价钱的谷底。

摸着 DeepSeek 过河

DeepSeek 两天两降，这不是浮浅的价钱战。

先用限时扣头测试市集承受力和管事器负载，紧接着对缓存掷中这一高频场景扩充永远性降价。尤其是关于 RAG 常识库、智能客服、文档分析等缓存掷中率向上 60% 的诓骗场景，老本不错平直着落 90% 以上。

DeepSeek 商榷员陈德里在酬酢媒体上说明，输入缓存降价是永远性的，并打上了" AGI for Everyone "的标签。

天然说国内悉数 AI 公司，简直皆是摸着 DeepSeek 过河，但 DeepSeek 这波降价之后，却并非悉数东谈主皆牵挂。

尤其是大厂，他们根底不在乎 DeepSeek 降价。

这是因为，大厂卖 API 的现实，是卖背后的一整套管事。大模子 API 仅仅用来引流的，实在成绩的是背后的推测、存储、数据库等云管事。

以阿里云为例，4 月 15 日算力卡涨 5%-34%、存储涨 30%，但同期又答允代理 DeepSeek。要津点就在于，即即是客户使用 DeepSeek，他们依然离不开阿里云的算力和存储。

阿里、腾讯、字节这些 AI 大厂，他们靠的是生态和平台成绩。

实在难受的是智谱、MiniMax 和月之暗面这样的中间层。

智谱 AI 在 4 个月里照旧贯串三次加价。2 月代码订阅套餐上调 30%，3 月旗舰 API 上调 20%，4 月 8 日再次上调 10%，累计涨幅 83%。调价后，GLM 系列编程场景缓存掷中 Token 单价已接近 Claude Sonnet 4.6 的水平。

智谱 CEO 张鹏的解释只好一句话："瓶颈在算力，不在客户。"

在首份财报中，智谱公开了我方的交易逻辑公式：AGI 交易价值 = 智能上限 ×Token 耗损范畴。

关于智谱这个上市公司来说，算力是稀缺资源。智谱的 API 年化收入（ARR）在往时 12 个月暴涨 60 倍至 17 亿元，Token 调用量在价钱高涨 83% 的布景下仍增长 400%。

问题不是客户不肯意付钱，而是现存算力照旧接近满载，赓续廉价只会让管事质地着落。与其通过价钱战抢来遍及廉价值客户，不如擢升价钱筛选出高价值客户，把有限的算力用在刀刃上。

月之暗面和 MiniMax 的特质是量大低廉，当 DeepSeek 把 API 价钱打到这样低，这两家或多或少皆会有些窘态。

但月之暗面的 K 2.6 以及 MiniMax 行将发布的 M3 模子，性能皆要高于 DeepSeek-V4-Pro。他们在客户群体上可能会和 DeepSeek 有交加，但很难造周全面冲破。

促使 DeepSeek 降价的原因大概来自于融资，此前 DeepSeek 曾传出 100 亿好意思元估值，如今跟着阿里、腾讯入局，估值进一步拉高至 200 亿好意思元。

估值拉高以后，融的金额也就多了，同期梁文锋也需要用市集、收入来说明 DeepSeek 达到估值所对应的高度。

是以即便 DeepSeek 是在蚀本赚吆喝，也并不会让东谈主感到荒芜无意。

关于上市公司来说，API 就是中枢收入，压低 API 价钱就等于缩小毛利。

更要津的是，若是承认"咱们也要降价技艺竞争"，就等于承认"咱们莫得时期护城河"。但若是宝石高价，又必须拿出充足有劝服力的各别化价值。

DeepSeek 降价的现实是他们找到了对应的客户。

梁文锋不需要 DeepSeek 有最强的性能。

不管是企业客户如故个东谈主客户，模子的性能和使用体验之间有全部边界。模子的性能跑分是它的上限，然而咱们只需要咱们能用到的部分。

只消有充足多的开发者和企业知谈"还有这样低廉的选拔"，悉数这个词行业的订价体系就会被重构。就像当年小米手机对智高手机市集的冲击相同，不是销量第一，但更动了悉数东谈主对"合理价钱"的预期。

而且梁文锋也意志到一个问题，那就是 AI 就是基础标准，就和衣食住行是相同的，那么价钱战就变得在所不免，最终，AI 也会像云推测相同走向"范畴经济 + 薄利多销"。

在这个逻辑下，谁的老本结构更优、谁的时期迭代更快、谁能更早达成范畴效应，谁就能活到终末。

DeepSeek 给国产 AI 芯片替代讲故事

更要津的是，DeepSeek 照旧适配华为昇腾生态。

DeepSeek 官方显现，现在 Pro 版块的管事蒙胧受限于高端算力，瞻望下半年昇腾 950 超节点批量上市后，Pro 的价钱还将大幅下调。

是以此次价钱着落，还仅仅预报辛劳。

昇腾 950 超节点通过集群决议弥补了单卡制程差距。

单颗昇腾 910C 芯片的 BF16 性能仅为英伟达 Blackwell 单芯片的约三分之一，但通过超节点集群样貌，单个 CloudMatrix 384 集群的 BF16 总性能反而是 NVL72 的 1.7 倍，总内存容量为后者 3.6 倍，总内存带宽为后者 2.1 倍。

这还仅仅算力的方面，磋议硬件老本，事情就会更有道理。

华为昇腾 950PR 的订价约 7 万元东谈主民币，英伟达同级别 H200 约合东谈主民币 25 万元。左证英伟达 AI 在 X 上发布的信息，DeepSeek 果然不错部署在英伟达 Blackwell 架构芯片上，不外这个老本更高，约为 40 万元东谈主民币。

若是咱们按 FP8 精度来算，昇腾 950PR 是 7 万元 /PFLOPS，开云app官方在线英伟达 H200 是 6.31 万元 /PFLOPS。昇腾 950PR 毕竟是一张推理卡，若是咱们按照推理专用的 FP4 精度来算，昇腾 950PR 是 4.49 万元 /PFLOPS，英伟达 B200 是 4.44 万元 /PFLOPS。

DeepSeek 此次降价，砍在了缓存掷中的价钱上。

这个场景的特质是，模子不必每次重新理会全部迂回文，遍及相通输入不错复用，压力主要鸠集在推理蒙胧、显存 / 内存带宽、调理柔和存处分上。

换句话说，它不是最依赖"单卡旁观峰值"的场景，而是更妥贴通过国产芯片集群、工程优化和范畴化调理来摊薄老本的场景。

那么咱们若是把单卡的性价比上风放到大范畴集群部署里，服从又会奈何呢？

以 100 卡集群为例，国内常用的英伟达 H20 决议裸卡老本为 1000 万，13 台管事器主机 286 万，加上机柜等，总价约为不到 1500 万元。同范畴华为昇腾 950PR 的决议约为 1000 万露面。

昇腾 950PR 的单卡功耗（600W）比 H20（350W）高，但单元算力功耗低 65%，交流算力下对电力和制冷的需求大幅缩小，基建插足权贵减少。

况兼，1 张昇腾 950PR 的推理蒙胧量约等于 2.2-2.8 张 H20。这就导致现实上昇腾决议可能要比英伟达 H20 的决议简略 60% 到 70%。

而大模子的 API 价钱，很猛进度上取决于硬件老本。那么 DeepSeek 打折，也很可能带动一波国产 AI 芯片销量。

连 DeepSeek 皆运行大范畴使用国产芯片，悉数这个词产业链就会被激活。云厂商会加多国产芯片的采购，芯片厂商会加大研发插足，开发者会适配国产生态。

华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯 8 家国产 AI 芯片品牌在 DeepSeek-V4 发布今日就完成了适配。

在 DeepSeek-V4 发布今日，AI 算力芯片板块股价大涨。在 A 股，海光信息以 8.2% 的增幅领涨、寒武纪增幅为 2.23%，在港股，天数智芯的涨幅达到 9.54%。

这是一个正向轮回。

天然，这并不虞味着国产算力照旧全面替代英伟达。旁观侧仍然更依赖高端 GPU、造就软件栈和大范畴集群教养 DeepSeek 实在走通的旅途，可能不是"今夜之间替代英伟达"，而是先在推理侧、缓存场景、长文本诓骗里，把国产算力的性价比上风开释出来。

芯片仅仅第一层。

实在决定国产算力能不可吃下这波需求的，是软件生态。模子能不可踏实跑在昇腾上，推理框架能不可适配，算子有莫得优化，开发者移动老本有多高，才决定了这条路是"能演示"，如故"能交易化"。

DeepSeek 的价值在于，它不是一家旯旮模子厂商作念适配，而是一个头部模子切身把流量和需求带进国产算力生态。

梁文锋仍然需要给 DeepSeek 找交易款式

梁文锋实在的杀招不在于"低廉"，而在于"订价"。

梁文锋在用 DeepSeek 的影响力，让市集造成一个新的领路："若是 DeepSeek 这个级别的模子照旧能作念到这个价，别家为什么还要卖这样贵？"

一朝这个锚点造成，其他厂商就堕入了两难。跟价，利润空间被压缩；不跟，就必须向客户解释"我贵在那儿"。

梁文锋曾在 2024 年暗示："咱们仅仅按照我方的行径来作念事，然后核算老本订价。咱们的原则是不贴钱，也不赚取暴利。这个价钱亦然在老本之上略略有点利润。咱们降价一方面是因为咱们在探索下一代模子的结构中，老本先降下来了，另一方面也以为不管 API，如故 AI，皆应该是普惠的、东谈主东谈主不错用得起的东西。"

他认为，只好让 AI 实在普惠，技艺引发出充足大的诓骗市集。也只好诓骗市集充足大，时期迭代的飞轮技艺实在转起来。

低廉不错开放市集，但低廉自己不是交易款式。

DeepSeek 不可一辈子靠超低 API 价钱在世。

API 价钱打到这个进度，短期内不错制造影响力，诱骗客户，不外它很难成为一家历久公司的全部收入开端。

尤其是大模子推理自己仍然耗损算力、电力、带宽和运维，价钱越低，调用量越大，对基础标准的压力也越大。

廉价不错是进口，却不应该成为绝顶。

DeepSeek 的主义，是成为中国 AI 开发者的"默许底座"。

只消充足多的诓骗和 agent 以 DeepSeek 行为基座模子开发，那么 DeepSeek 就掌捏了进口。

API 收入仅仅第一层，模子圭臬、开发者生态、企业部署、算力适配、云厂商配合，才是梁文锋思要的交易化空间。

DeepSeek 更大的交易化契机，可能在企业独有化部署。

关于金融、政务、制造、动力这些行业来说，价钱不是惟一问题，数据安全可控才是中枢问题。

它们随契机历久使用全球 API，但会答允为一套能部署在我方机房、我方云环境里的模子系统付费。

梁文锋不错把开源模子行为进口，把企业级部署、调优、运维、安全、权限处分、常识库接入变成实在的收费管事。

若是 DeepSeek 历久只停留在模子层，它仍然会被卷入无停止的价钱战。模子智商会被追逐，API 价钱会赓续着落，开发者也会在不同模子之间切换。

实在能擢升交易化上限的，是诓骗层居品，比如 agent 和 CLI。

是以我历久认为，DeepSeek 的廉价 API，应该不是梁文锋心里所思的交易化谜底，更像是一个进口。

它先用价钱打穿市集，再用开源斥地生态，再用企业管事、独有化部署、云厂商配合和诓骗居品去赓续价值。

这技艺把"底座"的价值最大化开云app官方在线。

滚球app中国官网下载入口