天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

17岁高三生领衔Kimi团队创新架构,马斯克点赞,AI界迎来新星力量

2026-03-23来源:快讯编辑:瑞雪

中国人工智能领域迎来突破性进展——月之暗面(Moonshot AI)团队提出的"注意力残差"(Attention Residuals)架构引发全球关注。这项发表于GitHub的技术成果,通过重构Transformer模型的信息流动机制,使480亿参数模型训练效率提升1.25倍,被特斯拉CEO埃隆·马斯克评价为"令人印象深刻的工作"。该研究的核心创新在于引入动态注意力机制,取代传统残差连接中固定的权重累加方式,使神经网络能够根据输入内容选择性聚合历史层信息。

论文第一作者陈广宇的履历同样引发震动。这位来自深圳国际学校的17岁高三学生,在加入月之暗面仅5个月后,便以核心成员身份参与这项颠覆性研究。其社交媒体显示,这位同时拥有美国计算机奥林匹克竞赛铂金组经历和Kimi内部黑客马拉松冠军的少年,目前担任机器学习研究员,直接参与中国顶尖开源大模型的核心架构开发。研究团队特别澄清,论文前三位作者贡献相当,陈广宇强调这是集体智慧的结晶。

这项被命名为AttnRes的新架构,通过引入输入依赖的softmax注意力机制,实现了深度维度上的范式转变。传统模型采用线性累加方式处理各层输出,而新方法允许每层动态检索历史信息,形成类似自注意力的聚合模式。技术验证显示,该架构在Kimi Linear模型中表现优异,特别在处理长序列依赖时展现出显著优势。行业分析师指出,这项突破可能重新定义大模型的基础架构标准。

月之暗面作为2023年成立的AI新锐,由清华大学校友杨植麟领衔创立,其开发的Kimi大模型已在国际基准测试中多次比肩GPT-4等头部模型,被业界誉为中国"AI四小虎"之一。陈广宇的双重身份——在校学生与顶尖研究员——创造了AI领域的新纪录。这位预计今年毕业的天才少年,此前已入选罗德信托全球未来领袖计划,并在美国Tilde Research实验室完成AI研究项目,其成长轨迹引发教育界对人才培养模式的重新思考。

研究团队公布的实验数据显示,采用AttnRes架构的模型在保持精度的同时,显著降低了计算资源消耗。这种效率提升在训练超大规模模型时尤为重要,可能为AI基础设施建设提供新的优化路径。目前,相关代码已在GitHub开源,全球开发者可自由访问技术细节。陈广宇表示,团队正在探索该架构在多模态学习等领域的应用潜力,期待与全球研究者共同推进技术边界。

3D打印重塑商业航天格局:铂力特与华曙高科,谁将引领未来?
从下游应用来看,2023年至2025年上半年,它俩的航空航天收入占比大多在40%-60%,主要用于航空航天零部件制造环节的提质降本。 而且华曙高科野心不止于此,2025年12月它和关联方一起成立了合资公司,…

2026-03-23

华为云AI战略再进阶:聚焦行业智能体,携手伙伴共筑企业级AI新生态
邮储银行软件研发中心处长李佳斌表示,从“邮储大脑1.0”聚焦感知智能,到“2.0”聚焦执行、生成、交易的能力升级,邮储银行坚持“发展与安全并重”,通过“业务提意向、技术先预研、试点再推广”的研发模式,重点推进…

2026-03-22

从展厅到日常,“成都造”机器人落地社区开启服务新篇章
记者了解到,在这一闭环中,越凡创新旗下“轻量化社区配送机器人——享递Ultra”、“楼宇室内配送机器人——享递”、“室内外一体化配送机器人——越凡路宝”等产品承担起社区末端配送任务,切入的是外卖、快递等居民…

2026-03-22