阿里巴巴内部近日因一则人事变动引发外界关注。据社交媒体消息,阿里千问大模型核心研发者林俊旸于3月4日发布动态称:“me stepping down. bye my beloved qwen.”(我卸任了。再见了,我亲爱的千问。)这位被业界称为“Qwen之父”的技术领军人物的离开,迅速成为科技圈热议话题。
公开资料显示,1993年出生的林俊旸拥有北京大学计算机科学与外国语言文学双背景,在自然语言处理和多模态学习领域成果斐然,其研究成果多次入选NeurIPS、ICML等国际顶级学术会议。2022年加入阿里巴巴达摩院后,他迅速成为通义实验室核心成员,同年年底被破格提拔为通义千问系列大模型技术负责人,以29岁之龄成为阿里最年轻的P10级技术高管。
在林俊旸主导下,通义千问团队构建了覆盖7亿至720亿参数的全尺寸开源模型体系,相关成果通过Hugging Face等平台向全球开发者开放。其打造的Qwen系列模型凭借多语言支持与高效推理能力,在GitHub收获超5万星标,被开发者社区誉为“中国版Llama”。这种技术影响力使林俊旸在入职仅两年后便获得“Qwen之父”的称号。
针对此次人事变动,阿里巴巴CEO吴泳铭在内部邮件中强调,公司将持续深化开源战略,并宣布成立基础模型支持小组。该小组由吴泳铭与阿里云CTO范禹共同牵头,整合集团技术中台、算力资源与生态合作部门,旨在为AI大模型研发提供跨业务线支持。邮件特别指出,阿里对AI领域的投入力度不会因个别人员变动而改变。
市场观察人士注意到,近期阿里AI业务品牌呈现简化趋势,“通义千问”逐步简化为“千问”,此次核心团队调整或与集团AI战略整合有关。有接近阿里的人士透露,公司正在探索将大模型能力与电商、物流等核心业务深度融合的新路径,这可能涉及技术架构的重大调整。
林俊旸的学术背景与职业轨迹颇具代表性。这位北大才子在硕士阶段将计算机科学与语言学结合,其关于多语言预训练模型的研究为Qwen系列奠定了理论基础。入职阿里后,他带领团队在6个月内完成千问大模型从闭源到开源的转型,这种技术决策使阿里在开源社区的影响力显著提升。据GitHub数据,Qwen系列模型累计下载量已突破3000万次,成为亚洲地区最受欢迎的开源大模型之一。
