在长沙这座充满活力与创新的城市,一首《长沙星上数星星》伴随着一项科技突破的诞生——国内首个基于国产算力预训练的视觉基座大模型“橘洲”V1端侧版正式上线。这一成果不仅标志着我国在AI领域的又一重大进展,也展现了长沙年轻科技团队的无限潜力。
“橘洲”大模型由湖南汇视威智能科技有限公司自主研发,依托中科曙光的强大算力,在短时间内完成了近4000万张图片的训练,成功实现了在国产算力上的整体训练和推理过程,并突破性地实现了移动端部署。这一创新使得用户在手机端就能享受到高质量、快速的图像生成服务,分辨率高达1024×1024,且无需联网。
汇视威团队平均年龄不到30岁,其中不乏21岁的年轻算力工程师李诗佳。她负责大模型的数据预处理和模型转换工作,每天与海量数据打交道,确保大模型的“食粮”精纯。李诗佳表示,她已自主处理超过2000万张图像数据,剔除杂质,为模型提供了高质量的训练素材。在模型转换环节,她如同一位精细的工匠,将PC端模型“瘦身”轻量化,以适应手机端的需求。
团队中还有一位见习数据工程师彭英麒,他负责大模型数据的归纳、整理、存储工作。彭英麒形容自己的工作就像给食材分类装盒,既要新鲜又要方便拿取。他连续几周对数十个公开数据集进行筛查,为每个图像集打上评分标签,确保了数据集的高质量和多样性。
作为团队的核心人物,首席技术官王聪睿肩负起了攻克大模型落地“最后一公里”的重任。他带领团队不断调试、创新,终于找到了适配国产硬件的部署方案,使得大模型得以在手机上正常运行。王聪睿表示,这一过程充满了挑战和不确定性,但团队的坚持和创新精神让他们最终取得了成功。
汇视威的创始人顾善植是一位富有远见和魄力的领导者。他带领团队从To B端业务转向大模型赛道,尽管当时业内对此并不看好。顾善植表示,团队的年轻和活力是他们的最大优势,而长沙作为坚强后盾也给了他们更多底气去闯去拼。如今,“橘洲”大模型的成功发布不仅为公司赢得了声誉,也为长沙的科技创新事业增添了光彩。
在汇视威的办公间里,挂着两张特别的地图:一张标记着团队品尝过的57家长沙米粉店,另一张则记录着算法在十二大领域上百个落地场景。这两张地图不仅见证了团队的成长和奋斗历程,也展现了他们与长沙这座城市的深厚情感。从岳麓山客流预警到社区独居老人守护,从车企生产线瑕疵检测到化工燃气作业风险预判,“橘洲”大模型的应用已经融入了长沙的城市血脉,为市民的生活带来了实实在在的便利。