天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

DeepSeek-R1跻身前三引硅谷热议,梁文峰开源理念受全球瞩目

2025-01-25来源:天脉网编辑:瑞雪

在科技界引发广泛关注的DeepSeek,正以其卓越的表现和独特的开源理念,在硅谷乃至全球范围内掀起波澜。

近日,DeepSeek的R1模型在大模型竞技榜上大放异彩,不仅跻身前三,还与ChatGPT-4(2024年11月20日版本)并列,而它的开源身份和相比之下便宜20倍的价格,更是让人眼前一亮。

在复杂提示词/风格控制榜单上,R1更是独占鳌头,展现出其在多个维度上的领先地位。

在衡量模型编程开发能力的WebDev分榜上,R1同样表现出色,仅次于闭源的Claude 3.5 Sonnet,差距不到40分。网友们通过实测体验,纷纷表示R1在多次对决中只输了寥寥几次。

硅谷对DeepSeek的好奇心丝毫未减,这个原本作为“副业”的项目,如今却成为了众人瞩目的焦点。DeepSeek的创始人梁文峰,在接受中文采访时的观点,也被翻译成英文,被硅谷的科技人士逐字阅读,甚至总结成箴言在互联网上流传。

图灵奖得主LeCun也对DeepSeek给予了高度评价,认为它代表了开源的力量,预示着开源模型正在超越专有模型。

DeepSeek的成功并非偶然。作为控股方的幻方量化,拥有一批顶级科学家和充裕的算力资源。DeepSeek的诞生,可以说是幻方量化在AI领域深耕多年的“副产物”。幻方量化自2015年成立以来,就致力于将AI应用于量化交易,并在2018年确立了AI为主要发展方向。多年的技术积累和算力基建,为DeepSeek的快速奔跑提供了底层支撑。

梁文峰在采访中提到的创新第一性原则、革命性架构、独特的公司文化和人才战略、致力于开源以及面临的底层计算挑战,都是DeepSeek能够成功的重要因素。他强调,创新不完全是商业驱动的,还需要好奇心和创造欲。DeepSeek采用的MLA架构,大幅降低了显存占用和推理成本,使得模型能够在保持高性能的同时,实现成本的大幅优化。

DeepSeek的成功,也引发了业界的广泛讨论。有人认为,DeepSeek展现出的理想主义和创新能力,让人看到了通用人工智能(AGI)的希望。也有人担忧,DeepSeek在商业化上的“自断后路”,可能会让其未来的道路充满挑战。但无论如何,DeepSeek已经用自己的行动,证明了开源和创新的力量。

梁文峰的故事,也是一个从程序员到科技领袖的传奇。他在搅动中国量化市场后,选择回到AI领域,组建起年轻蓬勃的团队,用他们的智慧和热情,为全球科技界带来了新的惊喜和启示。

游戏ETF资金净流入垫底,七日累计流出近2亿,市场风向何变?
来源:有连云 2025年2月5日,游戏ETF(516010.SH)收涨6.61%,成交1.72亿元。 资金流出也带来了份额的减少,该基金最新份额较前一日减少6600.00万份,跌破16.00亿份。与此同时,该…

2025-02-06

迅游科技股价大涨超10%,滚动市盈率却高达171倍,市值36亿表现如何?
2月6日,迅游科技今日收盘18.1元,上涨10.37%,滚动市盈率PE(当前股价与前四季度每股收益总和的比值)达到171.31倍,创28天以来新低,总市值36.78亿元。 从行业市盈率排名来看,公司所处的游戏…

2025-02-06

冰川网络股价上扬5.83%,市净率创新高5.14,总市值稳居54.83亿
消息面上,冰川网络4月30日接待线上参与公司2023年度网上业绩说明会的投资者等1家机构调研,上市公司接待人员包括董事长、总经理刘和国,董事会秘书、副总经理梅薇红,财务总监董嘉翌,独立董事刘胤宏。 最新一期…

2025-02-06