天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

出身商汤的曦望:押注推理GPU赛道 三年构建三代芯片矩阵谋突破

2026-01-23来源:快讯编辑:瑞雪

高性能GPU及多模态推理芯片领域迎来新势力——曦望Sunrise。这家脱胎于商汤科技大芯片部门的创新企业,自2024年底独立运营以来,正以差异化技术路线和豪华阵容引发行业关注。其核心团队由200余名专业人士组成,其中80%为技术研发人员,汇聚了来自AMD、华为海思、百度等科技巨头的精英,硕士及以上学历占比超八成,平均行业经验达15年。

公司管理层阵容堪称"全明星":董事长徐冰作为商汤科技联合创始人,曾主导完成超66亿美元融资并推动港交所上市,创下全球AI领域融资纪录;联席CEO王勇拥有20年芯片研发经验,曾担任AMD dGPU首席架构师,主导多款7nm芯片从设计到量产的全流程;另一位联席CEO王湛则是百度创始团队成员,在百度任职16年间担任资深副总裁,深度参与人工智能战略布局。这个兼具技术深度与商业视野的团队,正带领曦望在GPU赛道开辟新战场。

与传统GPU厂商"训推一体"的路径不同,曦望选择聚焦推理场景的"纯推理"路线。通过在调度机制、缓存架构、片上SRAM等核心环节进行原生优化,结合LPDDR内存技术,实现了单位Token推理成本的大幅降低。公司宣称,其技术方案可使推理成本下降90%,同时提供更稳定的服务质量。"我们要重写中国AI产业的成本结构,"王湛在接受采访时表示,"当推理算力变得像水电一样普惠,AGI的潜力才能真正释放。"

这种技术自信源于持续的研发投入和产品迭代。据披露,曦望已累计投入20亿元研发资金,构建起三代芯片产品矩阵:2020年量产的S1芯片作为国内首款视觉推理芯片,已适配超千种计算机视觉模型,获得索尼、小米等头部企业IP授权;2024年推出的S2芯片实现对主流GPU生态的兼容,支持DeepSeek、Qwen等主流大模型运行;计划2026年发布的S3芯片更将目标设定为"推理性价比之王",通过FP8/FP4低精度推理技术,力争实现"百万Token一分钱"的行业新基准,在能耗和成本上形成数量级优势。

在生态建设方面,曦望展现出开放姿态。S2芯片通过兼容CUDA生态,降低了开发者迁移成本,同时针对国产大模型进行深度优化。这种"双轨并行"的策略,既保证了技术兼容性,又为本土AI应用提供了定制化解决方案。随着所筹资金逐步投入下一代GPU研发和规模化量产,这家成立仅数年的企业,正在重塑高性能计算领域的竞争格局。

宇树科技官宣2025年成绩单:人形机器人出货超5500台,量产突破6500台
1月22日,宇树科技在官方微信公众号发布《关于宇树2025年销量数据的澄清》,披露了2025年实际出货量数据。 宇树指出,过去一个月,网上流传着很多关于宇树科技2025年出货数量的不实信息,宇树此前从未对外告…

2026-01-23

马斯克达沃斯首秀:AI或明年超越人类智能,机器人时代与经济新图景将至
他预测,到2026年底甚至最迟2027年底,AI将出现比任何单个人类都更聪明的系统;而在5年内,AI有可能超越全人类的集体智能。 随着AI、机器人和能源议题主导2026年全球议程,马斯克的表态为未来5–10年…

2026-01-23

苹果计划推出新聊天机器人Campos,或取代Siri与竞品争锋,成本或推收费模式
这一波被谷歌的Gemini“注入灵魂”之后,在AI方面沦为差等生的苹果开始变得自信起来了。 在功能上,它可以帮忙搜索网络信息、创建内容、生成图像、总结信息并分析上传的文件,ChatGPT等产品能做的它都能做,…

2026-01-22