在科技界的一次重要盛会中,字节跳动旗下的火山引擎Force原动力大会于近日成功召开,会上发布了一系列技术创新成果,包括豆包大模型1.6版本、视频生成模型Seedance 1.0 pro等,并对Agent开发平台等AI云原生服务进行了全面升级。
字节跳动CEO梁汝波在会上发表了讲话,他强调:“字节跳动致力于成为一家以创新为驱动力的科技公司,我们将坚定不移地进行长期投入,不断探索智能科技的边界,并将这些前沿技术应用于各行各业。通过火山引擎平台,我们将持续向企业客户开放我们的新模型和新技术。”
在大会的焦点之一——豆包大模型方面,豆包1.6凭借其卓越的性能在全球科技领域脱颖而出。据悉,在复杂推理、数学竞赛、多轮对话以及指令遵循等多个权威测试集上,豆包1.6-thinking的表现均已达到世界领先水平。
火山引擎总裁谭待介绍称,豆包1.6系列模型不仅支持多模态理解和图形界面操作,还能够准确理解和处理现实世界中的复杂问题。此前,豆包1.5的多模态能力已在多个公开评测中取得优异成绩,并广泛应用于电商、自动驾驶、门店巡检等多个领域。而图形界面操作能力的加入,则让豆包1.6具备了更强的“行动力”。现场演示显示,豆包1.6可以自动操作浏览器完成酒店预订,识别购物小票并整理成Excel表格等任务。
豆包视频生成模型Seedance 1.0 pro也在大会上惊艳亮相。该模型支持文字和图片输入,能够生成高品质、多镜头无缝切换的1080P视频,且主体运动稳定性和画面自然度极高。在国际知名评测榜单Artificial Analysis上,Seedance在文生视频和图生视频两项任务中均位列榜首,超越了Veo3、可灵2.0等一众优秀模型。
目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等多个领域,全方位推动智能科技的进步和应用落地。在行业应用方面,豆包大模型已服务于全球TOP10手机厂商中的9家、八成主流汽车品牌、70%的系统重要性银行以及超过五成的985高校。数据显示,豆包大模型的日均tokens使用量已超过16.4万亿,较首次发布时增长了137倍。同时,根据IDC报告,豆包大模型在中国公有云大模型市场份额中排名第一,占比高达46.4%。
谭待表示,深度思考、多模态和工具调用等模型能力的提升是构建Agent的关键。同时,为了推动Agent的规模化应用,还需要降低模型使用成本。为此,豆包1.6创新性地采用了按“输入长度”区间定价的方式,将深度思考、多模态能力与基础语言模型的价格统一。在企业使用量最大的0-32K输入区间内,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一。而Seedance 1.0 pro模型的价格更是低至每千tokens仅0.015元,生成一条5秒的1080P视频只需3.67元,创下了行业最低价。
为了更好地支持Agent的开发与应用,火山引擎对AI云原生全栈服务进行了全面升级,发布了包括火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等一系列新产品。同时,还推出了多模态数据湖、AICC私密计算、大模型应用防火墙以及一系列AI Infra套件,为企业客户提供了更加全面、高效的AI解决方案。
字节跳动技术副总裁洪定坤认为,随着模型能力的不断进步,AI有望成为软件开发中的调度者,通过调用不同的Agent和工具,实现“all in one”的开发模式,进一步降低开发门槛,提升开发效率。他透露,豆包1.6模型在编程能力方面取得了显著进步,并已接入字节的AI编程产品TRAE进行内测,新模型将很快推送给用户。在字节内部,超过80%的工程师都在使用TRAE辅助开发,而TRAE的整体月活用户也已超过了100万。
谭待在总结发言中表示,技术主体经历了从PC时代的Web、移动时代的App到AI时代的Agent的变革。Agent能够自主感知、规划和反思,完成复杂任务,从被动工具转变为主动执行者。他强调,豆包大模型和AI云原生将持续迭代升级,助力企业构建和大规模应用Agent,推动AI时代的全面到来。