近期,国内AI领域的一则重磅消息引发广泛关注——DeepSeek被传正在推进一笔高达700亿元的巨额融资,投前估值达450亿美元,有望刷新国内科技初创企业单轮融资纪录。与此同时,这家企业宣布其旗舰模型API永久降价75%,将高端大模型调用成本压至行业低位,这一系列动作让市场目光再次聚焦于它。
在众多科创企业急于向资本市场描绘盈利蓝图时,DeepSeek却展现出与众不同的姿态。它明确表示优先进行底层技术攻坚,暂缓商业化变现进程,全力投入通用人工智能的研发。这一决策背后,有着对行业发展的深刻洞察与长远规划。
对于DeepSeek接受融资这一转变,业内人士有着自己的看法。杜克大学电子与计算机工程系杰出教授陈怡然指出,融资并非是因为企业缺钱,核心目的在于留住人才。在竞争激烈的科技行业,若没有市场公认的估值,员工股权难以体现具体价值,仅靠情怀难以长期留住人才,平衡情怀与现实利益是科技公司发展到一定阶段必须面对的问题。
而关于为何不抬高本轮融资额,洪泰基金合伙人、洪泰智造创始人兼CEO乔会君分析道,百亿美元的估值参考了国内另外三家AI企业(智谱、Minimax、月之暗面),没把首轮融资额抬得更高,是为后续投资人留出空间。这轮融资采用“低额度 + 高门槛 + 强条款”的方式筛选合拍的投资人,排除短视逐利型机构。乔会君还认为,DeepSeek在融资中占据主动权,大多数投资方可能根本没机会参与投资,且其估值很可能在短期内大幅上涨,就像Kimi不到半年估值从40亿美元涨到180亿美元一样。
与融资消息同步的是,5月23日DeepSeek对定价进行了调整。其将V4 - Pro旗舰模型价格永久降至2.5折,输入(缓存命中)低至0.025元/百万tokens,输入(缓存未命中)3元、输出仅6元,价格不足GPT - 4o的十二分之一,相较于智谱GLM、通义千问等国产旗舰也极具性价比。
在当前全球高带宽内存供给紧张、算力成本居高不下的情况下,多数AI厂商谨慎保价守利,DeepSeek却逆势降价。其目的在于通过低价降低开发者使用门槛,吸引更多开发者,从而收集高质量数据反哺模型迭代,在达成正向循环的同时抢占行业话语权。
外界一直好奇,DeepSeek为何不追逐多模态等热门赛道,不选择快速变现的应用路径,而是执着于底层算法并坚持全面开源。原来,DeepSeek的终极目标并非在表层应用领域竞争,而是瞄准了被海外“卡脖子”的AI硬件底层。
DeepSeek的所有架构迭代与算法创新都围绕一个核心——用算法突破大模型对天价内存的依赖,为国产存储、AI芯片等企业创造发展空间。一组关键KV缓存数据足以说明其算法优化的成果:在1M超长上下文场景中,DeepSeek V4仅需4.14GB HBM,而GLM - 5需要102.28GB HBM,Qwen - 3.6 - 27B需要61.04GB HBM。同等上下文场景下,KV缓存占用越小,推理速度越快,单卡能容纳更多对话上下文,稳定性也更好。这背后离不开DeepSeek在MoE混合专家架构、GRPO强化学习算法、MLA/DSA/CSA注意力压缩、mHC流形约束超连接等方面的一系列原创突破。
目前,DeepSeek的MLA、DSA等核心技术已被智谱GLM、月之暗面Kimi等同行采用,并且它坚持技术开源,助力国内AI打破海外生态垄断。其算法优化路径恰好弥补了国内高端芯片生产短板,充分释放了长鑫LPDDR、长江存储3D NAND等国产成熟存储的产能优势,让原本依赖海外高端芯片运行的AI大模型,如今可依托国产内存、SSD闪存完成训练与推理。
业内预判,DeepSeek不排除借鉴OpenAI与AMD的深度绑定模式,与国内硬件巨头深度结盟。如此一来,DeepSeek将不再依赖API服务费获取短期收益,而是以行业标准制定者的身份,赚取产业链的长期红利,有望孵化出十万亿美元规模的全球AI硬件生态,自身估值也有望向万亿美元级别靠拢。在全球AI激烈竞争的格局中,DeepSeek能否实现这一宏伟目标,还有待时间来检验。

