在人工智能领域,一场关于大模型预训练成本与效益的深刻讨论正悄然进行。自ChatGPT于2023年引领风潮以来,是否从零开始预训练一个千亿级大模型成为了行业热议的焦点。然而,高昂的预训练成本让不少企业望而却步,甚至有“大模型六虎”中的两家宣布放弃预训练,转向AI应用。然而,零一万物却逆流而上,以惊人的成绩打破了这一僵局。
近日,零一万物发布了其最新的预训练旗舰模型——Yi-Lightning,这一模型在国际权威盲测榜单LMSYS上表现卓越,超越了OpenAI的GPT-4o及Anthropic的Claude 3.5 Sonnet,跃居世界第六,中国第一。这一成就不仅标志着中国大模型在全球舞台上的首次重大突破,也彰显了零一万物在AI技术上的深厚积累。
Yi-Lightning不仅在模型性能上实现了飞跃,其推理速度同样令人瞩目。相较于上半年发布的Yi-Large,Yi-Lightning的首包时间减少了一半,最高生成速度提升近四成,真正实现了“极速”推理。同时,该模型在保持高性能的同时,将每百万token的推理成本降至0.99元,性价比之高直逼行业最低价。
零一万物之所以能取得如此成就,得益于其“模基共建”的战略布局。公司自创立之初便坚持“模型+Infra+应用”的三体合一模式,不仅追求模型的极致性能,还注重推理成本的优化。据透露,Yi-Lightning在训练过程中仅使用了2000张GPU,耗时一个半月,成本仅为xAI训练Grok模型的2%左右,展现了极高的效率与成本控制能力。
在LMSYS Chatbot Arena的评测中,Yi-Lightning的表现同样出色。在总榜及多个分榜上,Yi-Lightning均名列前茅,特别是在中文处理、多轮对话、数学及代码能力等方面展现出强大的实力。这一成绩不仅验证了Yi-Lightning的卓越性能,也彰显了其解决真实世界问题的能力。
Yi-Lightning在翻译场景中的表现同样令人印象深刻。通过与Qwen2.5-72b-Instruct、DeepSeek-V2.5等模型的对比,Yi-Lightning在语言理解和生成、跨语言能力、上下文感知等方面均展现出显著优势。
在商业化应用方面,Yi-Lightning已正式上线Yi大模型开放平台(https://platform.lingyiwanwu.com/),为开发者与企业客户提供高性价比的SOTA大模型服务。同时,零一万物还发布了基于Yi-Lightning的AI 2.0数字人产品,聚焦零售和电商等场景,实现了模型能力的快速落地。
零一万物的成功不仅是中国大模型技术实力的体现,也为整个行业树立了新的标杆。在算力受限的情况下,中国大模型公司正通过技术创新和战略布局不断追赶并超越国际顶尖水平。未来,随着AGI时代的到来,零一万物将继续坚持“模型+AI Infra+应用”的全栈式布局,推动大模型能力在更多领域实现落地应用,为人工智能的普及和发展贡献力量。