在电影《天下无贼》的经典台词中,人才被喻为二十一世纪最宝贵的资源。近日,这一观念在科技界得到了生动体现,一位95后的AI“天才少女”罗福莉成为了焦点。
据报道,小米创始人雷军亲自出手,以千万年薪招揽了DeepSeek开源大模型的关键开发者之一罗福莉,旨在领导小米的AI大模型团队。这一举动无疑显示了小米在AI领域的雄心壮志。
罗福莉的学术背景令人瞩目。她本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。在读硕士期间,她已在人工智能领域的顶级国际会议ACL上发表了8篇论文,其中2篇为第一作者,这一成就让她在学术界声名鹊起。
硕士毕业后,罗福莉的职业生涯同样精彩纷呈。她先在阿里达摩院从事人工智能研究,负责预训练语言模型相关工作,主导开发了多语言预训练模型VECO。后来,她加入幻方量化,从事深度学习相关策略建模和算法研究,并最终跳槽到DeepSeek担任深度学习研究员,参与了MoE大模型DeepSeek-V2的研发。
DeepSeek-V2的发布,让罗福莉的才华得到了更广泛的认可。她在知乎上表示,DeepSeek-V2的中文水平处于国内外闭源模型的第一梯队,且性价比极高。这一评价无疑为DeepSeek-V2的市场表现增添了光彩。
罗福莉的加入,只是小米全面发力AI大模型的一个缩影。近年来,小米在AI领域的投入不断加大。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势。今年11月,小米更是成立了专门的AI平台部,由元老级技术大牛张铎负责。
除了招募人才,小米还在算力方面进行了大量投入。据报道,小米正在搭建GPU万卡集群,规模较之前大幅增加。这一计划由雷军亲自领导,显示了小米在AI领域的决心和实力。同时,小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年将攀升至300亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
在二级市场上,小米近期股价创新高,这与加码AI算力等举措密切相关。小米汽车也宣布提前完成全年交付目标,为小米的业绩增添了新的亮点。雷军在公开演讲中曾表示,小米做大模型的思路与众不同,选择主力突破的是轻量化和本地部署。这一策略或许正是小米在烧钱的大模型业务中平衡成本的关键。