在近期举办的FORCE原动力大会上,火山引擎震撼发布了多项AI技术新成果,进一步推动了人工智能技术的发展边界。会上,豆包大模型家族迎来了全面升级,其中豆包大模型1.6、视频生成模型Seedance 1.0 pro、语音播客模型以及实时语音模型等一系列新品悉数亮相,展现了火山引擎在AI领域的深厚积累与创新能力。
字节跳动CEO梁汝波在大会上强调,火山引擎对于字节跳动而言,不仅是技术实力的重要体现,更是保持公司竞争力、迈向优秀科技企业的关键一步。他表示,字节跳动将持续加大长期投入,致力于智能技术的突破,以更好地服务于产业应用。
在价格策略上,豆包大模型1.6采取了创新的统一定价模式,首次根据“输入长度”区间进行定价。在企业最常用的0-32K输入区间内,该模型的价格为输入0.8元/百万tokens、输出8元/百万tokens,相比之前的版本,综合成本降低了63%。而Seedance 1.0 pro模型的价格更是低至每千tokens 0.015元,这意味着生成一条5秒的1080P视频仅需3.67元,创下了行业新低。
随着AI技术的不断发展,能够自主思考、规划并完成任务的Agent正在逐步走进企业的生产场景。这要求模型不仅具备强大的推理能力和多模态处理能力,还需要低成本的运行以及AI云原生全栈服务的支持。大会上,火山引擎发布了12款面向Agent开发和应用的工具产品,旨在帮助企业更好地构建和应用Agent。
针对Agent的开发,火山引擎升级了AI IDE“TRAE”,并发布了MCP服务、Prompt优化工具“PromptPilot”、开源的veRL强化学习框架以及AI知识管理产品等。在大数据服务方面,多模态数据湖和AI数字专家“Data Agent”的发布,进一步提升了企业对数据的智能化处理能力。在AI基础设施上,火山引擎推出了AgentKit、TrainingKit和Servingkit,分别针对Agent的开发、模型训练和推理进行了全面优化。
火山引擎总裁谭待在会上表示,AI时代的到来,使得开发范式、大数据、计算和安全等方面都发生了翻天覆地的变化。这些变化构成了全新的“AI云原生”技术栈,成为企业构建优秀Agent、推动创新发展的关键所在。
此次发布的豆包大模型1.6系列由三个模型组成,分别为doubao-seed-1.6、doubao-seed-1.6-thinking和doubao-seed-1.6-flash,为企业提供多样化的选择。其中,doubao-seed-1.6是国内首个支持256K上下文的思考模型,具备深度思考、多模态理解和图形界面操作等多项能力。而doubao-seed-1.6-thinking则在深度思考方面进行了强化,支持更复杂的逻辑推理和代码编写。doubao-seed-1.6-flash则以极低的延迟和强大的视觉理解能力著称。
在权威测评中,豆包大模型1.6展现了卓越的性能,其推理能力、多模态理解能力和GUI操作能力均处于国际领先水平。例如,在针对高考数学科目的测评中,豆包大模型1.6取得了144分的高分,位居全国前列。豆包大模型1.6还具备“边想边搜”和DeepResearch深度研究能力,能够大幅提升研究报告的生成效率。
在性价比方面,豆包大模型1.6同样表现出色。其统一定价模式使得无论是否开启深度思考模式,无论是文本还是视觉处理,tokens价格均保持一致。在大部分企业常用的输入区间内,其综合成本相比之前的版本降低了63%,相当于只需原来三分之一的价格就能享受到更强大、更多模态的新模型。
火山引擎还发布了全新的视频生成模型Seedance 1.0 pro。该模型具备无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感等特性,在电商、影视、游戏等行业具有广阔的应用前景。根据第三方权威榜单的最新结果,Seedance 1.0 pro在文生视频和图生视频两个维度上都超越了业界主流模型,登顶全球竞技场第一。
在语音处理方面,火山引擎同样推出了两款新品。豆包·实时语音模型已全量上线火山方舟,并对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,能够大幅提升人机交互的拟人感和流畅度。同时发布的豆包·语音播客模型则能够快速生成高质量的播客内容,支持双人对话式创作,效果自然且富有节奏感。
火山引擎此次发布的AI云原生全栈服务,旨在帮助企业加速Agent的落地和应用。从Agent开发到数据基础设施再到AI基础设施,火山引擎提供了一系列全面而强大的工具和服务,助力企业构建高效、智能、安全的Agent系统。这些创新成果的发布,不仅展现了火山引擎在AI领域的深厚积累,更为企业的数字化转型和智能化升级提供了有力的支持。