在2024年11月12日的上海世博中心,百度创始人李彦宏携带着他对人工智能的最新洞见及两项突破性AI技术,亮相“百度世界2024”大会。自ChatGPT于两年前问世以来,大模型风潮席卷全球,引领了AI发展的多种趋势。李彦宏,这位长期倡导AI投资的领袖,去年被《时代》周刊评为全球AI领袖之一,与特斯拉CEO埃隆·马斯克、英伟达CEO黄仁勋等科技巨擘齐名。在中国,百度无疑是AI浪潮中的领航者。
尽管近一年来,李彦宏在大模型领域成为了某种“异议者”,在“百模大战”打得火热之时,他频频呼吁行业应关注AI原生应用生态的构建,而非重复开发基础大模型。他强调,大模型对ToB业务的改造潜力,远超互联网时代的变革力度。这些言论一度被视作“泼冷水”,但随着时间的推移,他的观点逐渐被行业所接受。大模型“超级应用”的缺失、行业泡沫的显现,以及AI应用重要性的提升,都验证了李彦宏的预见性。百度文心大模型的日均调用量已突破15亿次,这一数据无疑证明了百度路径的正确性。
在百度主场,李彦宏带来了两项令人瞩目的新技术。首先,他介绍了检索增强的文生图技术(iRAG),旨在解决大模型在图片生成上的“幻觉”问题。通过将百度的亿级图片资源与强大的基础模型结合,该技术能生成超真实的图片,效果远超原生文生图系统。李彦宏现场展示了一幅由文心大模型生成的写实风格图片,图中大众揽巡汽车飞越长城,无论是车型、车标还是长城背景,均栩栩如生,几乎可以直接用于品牌宣传,成本几乎为零。文心iRAG在影视、漫画、海报制作等领域具有广泛应用前景。
李彦宏认为,智能体将成为AI应用的主流形态,爆发点即将到来。他以公司类智能体为例,展示了其如何根据顾客需求推荐产品,提供快速响应服务,大幅提升互动营销效率。比亚迪官方智能体上线后,销售转化率提升了119%。李彦宏还展示了角色、工具和行业等多类智能体的特色功能及应用场景,包括直播数字人、工具类智能体“自由画布”和法律智能体“法行宝”等。
另一项重磅发布的AI技术是“秒哒”——一款无需编写代码即可实现任意想法的多智能体协作工具。李彦宏称其为“人类历史上最复杂的多智能体协作工具”,具备无代码编程、多智能体协作和规模化调用各种工具的能力。他现场通过“秒哒”搭建了一个活动报名系统,展示了五个智能体如何协同完成策划、内容和开发等工作,自动识别bug并调用各种工具。这一工具将极大提升人类工作效率,标志着“只靠想法就能赚钱”的时代即将到来。
在谈及百度的AI历程时,李彦宏回忆了与“深度学习之父”Geoffrey Hinton的渊源。虽然Hinton最终选择了Google,但百度对AI的远见、对人才的尊重及投入并未因此减少。百度深度学习研究院的成立、吴恩达的加入,都彰显了百度在AI领域的坚定布局。李彦宏表示,百度更关注如何让更多人、更多企业受益于AI,而非仅仅追求技术上的突破。百度希望推出更多“超级有用”的应用,而非单一的“超级应用”,以推动生产力的无限扩张。