在全球AI芯片竞争日益激烈的背景下,一款名为DeepSeek的国产大模型横空出世,正悄然改变技术演进的底层逻辑。凭借其迅猛的发展势头,DeepSeek迅速积累了超过3000万的日活跃用户,成为业界关注的焦点。
近日,一场聚焦于“DeepSeek如何重塑AI格局?AGI门槛正逐渐消失?”的沙龙活动成功举办,该活动由新网银行与西南财经大学管理科学与工程学院携手呈现。活动现场,新网银行副行长李秀生、西南财经大学管理科学与工程学院计算金融系主任王俊教授、新网银行风控科学部负责人卫浩,共同探讨了DeepSeek背后的技术秘密及其在银行业的应用潜力。
卫浩、李秀生、王俊、主持人任帅(自右向左)于沙龙直播现场
在OpenAI与微软携手引发“生态垄断”争议,以及英伟达面临美国史上最严格的AI芯片出口管制之际,DeepSeek的开源策略如同一股清流,为企业提供了以较低成本应用先进大模型的新途径,从而增强了多场景智能助手的功能。
李秀生以Linux和安卓为例,阐述了开源与闭源两种模式在软件行业的并存现象及其各自的成功案例。他指出,尽管苹果作为闭源模式的代表,在高端手机应用领域保持领先,但开源模式通过汇聚全球智慧,同样推动了操作系统的显著发展。李秀生表示:“我个人更倾向于看好开源模式,未来,开源与闭源或将继续并行,但开源的潜力巨大。”
王俊则分析了开源与闭源之间的相互作用。他认为,开源技术因其公开性吸引了大量开发人员参与,促进了技术的快速迭代,但盈利模式和商业模式尚不明朗。相反,闭源模式注重构建自身壁垒,投入巨大,商业模式独特但多样性受限。因此,在实践中,两者可能会相互借鉴、融合,并在特定领域形成竞争。
DeepSeek作为一种开源、低成本且高效的大模型,对市场上的头部科技公司构成了显著挑战。王俊指出,DeepSeek的定价策略迫使OpenAI等闭源大模型公司重新审视其商业模式和技术优化方向,同时促使英伟达等芯片公司重新思考AI基础设施的投资逻辑和发展模式。
然而,卫浩强调,尽管大模型具备广泛能力,但在风控这一垂直领域,其表现并不理想。原因在于大模型的训练主要基于公开的互联网数据和代码,缺乏针对风控领域的专门数据训练,因此其逻辑可能与风控实际需求不完全契合。
据浙商证券研报,DeepSeek-V3的训练成本远低于传统大模型。与传统模型动辄数千万乃至上亿的投入相比,DeepSeek的本地化部署成本可控制在百万元以下。目前,包括银行、基金、证券在内的多家金融机构正积极部署DeepSeek。自2024年5月起,新网银行已在系统研发场景中应用DeepSeek大模型,显著缩短了工程师查阅技术资料的时间。
李秀生认为,DeepSeek的出现带来了两大理念变革:一是打破了“算力至上”的迷思,证明了通过优化算法和模型,可以在较低算力下实现高效性能;二是加剧了开源与闭源之争,降低了技术门槛,使更多机构能够应用大模型,对银行业等金融机构产生了深远影响。
卫浩分享了DeepSeek在银行业数字化风控领域的应用前景。他指出,DeepSeek等大模型能够增强语义理解和文本处理能力,从更广泛的数据中获取信息,提高客户评估准确性,从而做出更明智的决策。DeepSeek R1的深度思考能力在处理长上下文和复杂意图时表现出色。
面对大模型时代的到来,李秀生强调,银行需要从战略层面思考如何重塑经营管理流程,构建应用,同时考虑算力、数据、算法及应用等多方面因素。新网银行已在客服领域成功应用大模型,并正在探索其在营销、贷后管理等领域的应用。
王俊预测,在制造业、气候风险预测、计算机、教育、媒体娱乐等领域,大模型相关智能应用都将有显著提升。例如,在制造业中,大模型能监测零件可靠性,预测寿命;在教育领域,可以构建个性化大模型辅助学生学习;在媒体娱乐领域,大模型能用于内容生成、模型构建和场景搭建等。
随着AI大模型在银行业的广泛应用,对科技人员的技能要求也相应提高。李秀生认为,人工智能时代需要具备人工智能思维的金融和科技复合型人才。新网银行正在融入人工智能思维,评估并培养适应未来银行发展所需的人才。
卫浩指出,动手实践是掌握人工智能的关键,特别是在风控领域,需要对技术原理有深入了解,同时充分认识模型的优势、能力边界和风险。王俊也表示,高校正在致力于培养AI+专业领域的复合型人才,通过优化课程设置、增加实训项目和实验课程,以及加强产学研合作,以满足业界需求。