开云app官方在线 20万字不到1分钱,梁文锋把token价钱打骨折了

你的位置:开云app官方在线入口 > 现金捕鱼 > 开云app官方在线 20万字不到1分钱,梁文锋把token价钱打骨折了
开云app官方在线 20万字不到1分钱,梁文锋把token价钱打骨折了
发布日期:2026-05-01 03:56    点击次数:161

开云app官方在线 20万字不到1分钱,梁文锋把token价钱打骨折了

梁文锋又入手了,而且如故二连降价。

4 月 25 日,DeepSeek-V4-Pro 开启限时 2.5 折优惠,输入价钱(缓存掷中)降至 0.25 元 / 百万 tokens。

业内还没响应过来呢,服从 4 月 26 日晚间,DeepSeek 就再次降价。

全系 API 输入缓存掷中价钱平直降至首发价的 1/10。

叠加限时扣头后,V4-Pro 的缓存输入低至 0.025 元 / 百万 tokens, V4-Flash 降至 0.02 元 / 百万 tokens,创下全球大模子价钱新低。

这是个什么见识呢?

上海译文出书的《挪威的丛林》,全书约 20 万字。将整本书掷中缓存后喂给 DeepSeek-V4-Pro,那么其总老本不到 1 分钱。

DeepSeek 此次降的,不仅仅 token 的单价。它是把"长文本、长代码、长常识库"这些原来最烧钱的 AI 诓骗场景,完全打入了价钱的谷底。

01

摸着 DeepSeek 过河

DeepSeek 两天两降,这不是浮浅的价钱战。

先用限时扣头测试市集承受力和管事器负载,紧接着对缓存掷中这一高频场景扩充永远性降价。尤其是关于 RAG 常识库、智能客服、文档分析等缓存掷中率向上 60% 的诓骗场景,老本不错平直着落 90% 以上。

DeepSeek 商榷员陈德里在酬酢媒体上说明,输入缓存降价是永远性的,并打上了" AGI for Everyone "的标签。

天然说国内悉数 AI 公司,简直皆是摸着 DeepSeek 过河,但 DeepSeek 这波降价之后,却并非悉数东谈主皆牵挂。

尤其是大厂,他们根底不在乎 DeepSeek 降价。

这是因为,大厂卖 API 的现实,是卖背后的一整套管事。大模子 API 仅仅用来引流的,实在成绩的是背后的推测、存储、数据库等云管事。

以阿里云为例,4 月 15 日算力卡涨 5%-34%、存储涨 30%,但同期又答允代理 DeepSeek。要津点就在于,即即是客户使用 DeepSeek,他们依然离不开阿里云的算力和存储。

阿里、腾讯、字节这些 AI 大厂,他们靠的是生态和平台成绩。

实在难受的是智谱、MiniMax 和月之暗面这样的中间层。

智谱 AI 在 4 个月里照旧贯串三次加价。2 月代码订阅套餐上调 30%,3 月旗舰 API 上调 20%,4 月 8 日再次上调 10%,累计涨幅 83%。调价后,GLM 系列编程场景缓存掷中 Token 单价已接近 Claude Sonnet 4.6 的水平。

智谱 CEO 张鹏的解释只好一句话:"瓶颈在算力,不在客户。"

在首份财报中,智谱公开了我方的交易逻辑公式:AGI 交易价值 = 智能上限 ×Token 耗损范畴。

关于智谱这个上市公司来说,算力是稀缺资源。智谱的 API 年化收入(ARR)在往时 12 个月暴涨 60 倍至 17 亿元,Token 调用量在价钱高涨 83% 的布景下仍增长 400%。

问题不是客户不肯意付钱,而是现存算力照旧接近满载,赓续廉价只会让管事质地着落。与其通过价钱战抢来遍及廉价值客户,不如擢升价钱筛选出高价值客户,把有限的算力用在刀刃上。

月之暗面和 MiniMax 的特质是量大低廉,当 DeepSeek 把 API 价钱打到这样低,这两家或多或少皆会有些窘态。

但月之暗面的 K 2.6 以及 MiniMax 行将发布的 M3 模子,性能皆要高于 DeepSeek-V4-Pro。他们在客户群体上可能会和 DeepSeek 有交加,但很难造周全面冲破。

促使 DeepSeek 降价的原因大概来自于融资,此前 DeepSeek 曾传出 100 亿好意思元估值,如今跟着阿里、腾讯入局,估值进一步拉高至 200 亿好意思元。

估值拉高以后,融的金额也就多了,同期梁文锋也需要用市集、收入来说明 DeepSeek 达到估值所对应的高度。

是以即便 DeepSeek 是在蚀本赚吆喝,也并不会让东谈主感到荒芜无意。

关于上市公司来说,API 就是中枢收入,压低 API 价钱就等于缩小毛利。

更要津的是,若是承认"咱们也要降价技艺竞争",就等于承认"咱们莫得时期护城河"。但若是宝石高价,又必须拿出充足有劝服力的各别化价值。

DeepSeek 降价的现实是他们找到了对应的客户。

梁文锋不需要 DeepSeek 有最强的性能。

不管是企业客户如故个东谈主客户,模子的性能和使用体验之间有全部边界。模子的性能跑分是它的上限,然而咱们只需要咱们能用到的部分。

只消有充足多的开发者和企业知谈"还有这样低廉的选拔",悉数这个词行业的订价体系就会被重构。就像当年小米手机对智高手机市集的冲击相同,不是销量第一,但更动了悉数东谈主对"合理价钱"的预期。

而且梁文锋也意志到一个问题,那就是 AI 就是基础标准,就和衣食住行是相同的,那么价钱战就变得在所不免,最终,AI 也会像云推测相同走向"范畴经济 + 薄利多销"。

在这个逻辑下,谁的老本结构更优、谁的时期迭代更快、谁能更早达成范畴效应,谁就能活到终末。

02

DeepSeek 给国产 AI 芯片替代讲故事

更要津的是,DeepSeek 照旧适配华为昇腾生态。

DeepSeek 官方显现,现在 Pro 版块的管事蒙胧受限于高端算力,瞻望下半年昇腾 950 超节点批量上市后,Pro 的价钱还将大幅下调。

是以此次价钱着落,还仅仅预报辛劳。

昇腾 950 超节点通过集群决议弥补了单卡制程差距。

单颗昇腾 910C 芯片的 BF16 性能仅为英伟达 Blackwell 单芯片的约三分之一,但通过超节点集群样貌,单个 CloudMatrix 384 集群的 BF16 总性能反而是 NVL72 的 1.7 倍,总内存容量为后者 3.6 倍,总内存带宽为后者 2.1 倍。

这还仅仅算力的方面,磋议硬件老本,事情就会更有道理。

华为昇腾 950PR 的订价约 7 万元东谈主民币,英伟达同级别 H200 约合东谈主民币 25 万元。左证英伟达 AI 在 X 上发布的信息,DeepSeek 果然不错部署在英伟达 Blackwell 架构芯片上,不外这个老本更高,约为 40 万元东谈主民币。

若是咱们按 FP8 精度来算,昇腾 950PR 是 7 万元 /PFLOPS,开云app官方在线英伟达 H200 是 6.31 万元 /PFLOPS。昇腾 950PR 毕竟是一张推理卡,若是咱们按照推理专用的 FP4 精度来算,昇腾 950PR 是 4.49 万元 /PFLOPS,英伟达 B200 是 4.44 万元 /PFLOPS。

DeepSeek 此次降价,砍在了缓存掷中的价钱上。

这个场景的特质是,模子不必每次重新理会全部迂回文,遍及相通输入不错复用,压力主要鸠集在推理蒙胧、显存 / 内存带宽、调理柔和存处分上。

换句话说,它不是最依赖"单卡旁观峰值"的场景,而是更妥贴通过国产芯片集群、工程优化和范畴化调理来摊薄老本的场景。

那么咱们若是把单卡的性价比上风放到大范畴集群部署里,服从又会奈何呢?

以 100 卡集群为例,国内常用的英伟达 H20 决议裸卡老本为 1000 万,13 台管事器主机 286 万,加上机柜等,总价约为不到 1500 万元。同范畴华为昇腾 950PR 的决议约为 1000 万露面。

昇腾 950PR 的单卡功耗(600W)比 H20(350W)高,但单元算力功耗低 65%,交流算力下对电力和制冷的需求大幅缩小,基建插足权贵减少。

况兼,1 张昇腾 950PR 的推理蒙胧量约等于 2.2-2.8 张 H20。这就导致现实上昇腾决议可能要比英伟达 H20 的决议简略 60% 到 70%。

而大模子的 API 价钱,很猛进度上取决于硬件老本。那么 DeepSeek 打折,也很可能带动一波国产 AI 芯片销量。

连 DeepSeek 皆运行大范畴使用国产芯片,悉数这个词产业链就会被激活。云厂商会加多国产芯片的采购,芯片厂商会加大研发插足,开发者会适配国产生态。

华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯 8 家国产 AI 芯片品牌在 DeepSeek-V4 发布今日就完成了适配。

在 DeepSeek-V4 发布今日,AI 算力芯片板块股价大涨。在 A 股,海光信息以 8.2% 的增幅领涨、寒武纪增幅为 2.23%,在港股,天数智芯的涨幅达到 9.54%。

这是一个正向轮回。

天然,这并不虞味着国产算力照旧全面替代英伟达。旁观侧仍然更依赖高端 GPU、造就软件栈和大范畴集群教养 DeepSeek 实在走通的旅途,可能不是"今夜之间替代英伟达",而是先在推理侧、缓存场景、长文本诓骗里,把国产算力的性价比上风开释出来。

芯片仅仅第一层。

实在决定国产算力能不可吃下这波需求的,是软件生态。模子能不可踏实跑在昇腾上,推理框架能不可适配,算子有莫得优化,开发者移动老本有多高,才决定了这条路是"能演示",如故"能交易化"。

DeepSeek 的价值在于,它不是一家旯旮模子厂商作念适配,而是一个头部模子切身把流量和需求带进国产算力生态。

03

梁文锋仍然需要给 DeepSeek 找交易款式

梁文锋实在的杀招不在于"低廉",而在于"订价"。

梁文锋在用 DeepSeek 的影响力,让市集造成一个新的领路:"若是 DeepSeek 这个级别的模子照旧能作念到这个价,别家为什么还要卖这样贵?"

一朝这个锚点造成,其他厂商就堕入了两难。跟价,利润空间被压缩;不跟,就必须向客户解释"我贵在那儿"。

梁文锋曾在 2024 年暗示:"咱们仅仅按照我方的行径来作念事,然后核算老本订价。咱们的原则是不贴钱,也不赚取暴利。这个价钱亦然在老本之上略略有点利润。咱们降价一方面是因为咱们在探索下一代模子的结构中,老本先降下来了,另一方面也以为不管 API,如故 AI,皆应该是普惠的、东谈主东谈主不错用得起的东西。"

他认为,只好让 AI 实在普惠,技艺引发出充足大的诓骗市集。也只好诓骗市集充足大,时期迭代的飞轮技艺实在转起来。

低廉不错开放市集,但低廉自己不是交易款式。

DeepSeek 不可一辈子靠超低 API 价钱在世。

API 价钱打到这个进度,短期内不错制造影响力,诱骗客户,不外它很难成为一家历久公司的全部收入开端。

尤其是大模子推理自己仍然耗损算力、电力、带宽和运维,价钱越低,调用量越大,对基础标准的压力也越大。

廉价不错是进口,却不应该成为绝顶。

DeepSeek 的主义,是成为中国 AI 开发者的"默许底座"。

只消充足多的诓骗和 agent 以 DeepSeek 行为基座模子开发,那么 DeepSeek 就掌捏了进口。

API 收入仅仅第一层,模子圭臬、开发者生态、企业部署、算力适配、云厂商配合,才是梁文锋思要的交易化空间。

DeepSeek 更大的交易化契机,可能在企业独有化部署。

关于金融、政务、制造、动力这些行业来说,价钱不是惟一问题,数据安全可控才是中枢问题。

它们随契机历久使用全球 API,但会答允为一套能部署在我方机房、我方云环境里的模子系统付费。

梁文锋不错把开源模子行为进口,把企业级部署、调优、运维、安全、权限处分、常识库接入变成实在的收费管事。

若是 DeepSeek 历久只停留在模子层,它仍然会被卷入无停止的价钱战。模子智商会被追逐,API 价钱会赓续着落,开发者也会在不同模子之间切换。

实在能擢升交易化上限的,是诓骗层居品,比如 agent 和 CLI。

是以我历久认为,DeepSeek 的廉价 API,应该不是梁文锋心里所思的交易化谜底,更像是一个进口。

它先用价钱打穿市集,再用开源斥地生态,再用企业管事、独有化部署、云厂商配合和诓骗居品去赓续价值。

这技艺把"底座"的价值最大化开云app官方在线。

滚球app中国官网下载入口

上一篇:开云 季后赛最新方位:马刺时隔9年进次轮两队出局 湖东说念主魔术差1胜晋级
下一篇:没有了

友情链接: