在人工智能领域的一次重大发声中,商汤科技CEO徐立在世界人工智能大会(WAIC)上,以《人工智能的十年演进》为主题,深刻剖析了AI技术的三次重大飞跃。
徐立首先回顾了AI技术的首个突破点——感知智能。这一阶段的标志性事件是深度学习技术,特别是CNN和ResNet等算法,结合ImageNet数据集中的1400万张标注图片,推动了视觉应用在多个垂直领域的快速发展。这些技术突破,使得AI能够“学习”并理解现实世界中的图像和视频信息。
紧接着,徐立将话题转向了2017至2018年间,Transformer模型的诞生。这一创新引领了生成式智能的新纪元。Transformer模型通过海量文本数据的学习,显著提升了模型的泛化能力和通用性。从ChatGPT到多模态大模型、智能体,乃至具身智能和世界模型的兴起,AI技术不仅推动了行业的快速发展,也让大众对AI的认知达到了前所未有的高度。
为了跨越虚拟世界与现实世界之间的鸿沟,商汤科技推出了“开悟”世界模型,并在此基础上打造了“开悟”平台。该平台能够生成符合3D真实情况和物理规律的多视角视频,为自动驾驶等场景提供AI自举与自学的能力。徐立通过实例展示了“开悟”平台在自动驾驶场景中的应用,如通过自然语言描述生成不同视角的加塞视频,从而帮助AI学习并应对复杂的驾驶场景。
徐立总结道,人工智能正沿着“感知世界—理解世界—生成世界”的路径不断前行。通过不断学习和理解现实世界,AI最终将与现实硬件交互,从而改变我们的世界。这一观点不仅揭示了AI技术的未来发展趋势,也为我们理解AI技术的本质和价值提供了新的视角。