天脉资讯
产业经济 科技数码 汽车出行 科学科普 娱乐红人 时尚出圈 文化艺术 家居美学 妈咪宝贝 宠物小乖 教育学习 职场提升 大燕公益

周鸿祎解析AI大模型“翻车”事件:潜力无限 但需专项训练

2024-07-18来源:天脉网编辑:星辉

【天脉网】7月18日消息,近期科技界掀起轩然大波,多款顶尖AI大模型如ChatGPT 4o、谷歌Gemini Advanced及Claude 3.5 Sonnet,在解答简单数学比较题“9.9和9.11哪个数值更大”时集体“栽跟头”,引发广泛讨论,人工智能的智能程度再次成为公众热议的焦点。

面对这一风波,360公司创始人周鸿祎发表独到见解,他谨慎地指出:“我们既要看到大模型未来发展的无限潜力,也不应盲目高估其当前的能力。”他进一步强调,“这次事件非但未应削弱我们对大模型的信心,反而深刻揭示了其与人脑相似的不完美性,提醒我们大模型远非无所不能。”

据天脉网了解,周鸿祎详细剖析了大模型在识别数字并进行简单比较时出错的原因。他指出,大模型本质上是大语言模型,首要任务是理解自然语言,而非直接处理数学逻辑。因此,在缺乏特定数学训练的情况下,它们倾向于将数字视为文本序列的组成部分,而非进行数值计算。他形象地比喻道:“这就像一个人只学了文学,却未涉足数学,面对简单的算术题自然会感到困惑。”

为解决这一问题,周鸿祎提出了多项策略。他建议对大模型进行专门的数学训练,以提升其处理数值问题的能力,这类似于学生在学习过程中逐步掌握不同学科的知识。其次,他倡导将搜索功能与AI大模型相结合,利用互联网上的广泛资源来辅助大模型进行更准确的判断,实现知识推理与搜索增强的双重优势。此外,他还提到了利用API接口和外部工具如编程语言Python来增强大模型的能力,使其能够调用外部资源解决特定问题。

在总结时,周鸿祎重申了大模型在自然语言理解方面的优势,并指出其在专业领域知识的局限性。他鼓励业界正视这些不足,通过技术创新和跨领域合作来不断完善大模型的功能。同时,他强调了大模型与人类智慧之间的相似性,指出人类同样依赖工具和外部资源来应对复杂任务,因此不应因一时的挫折而否定人工智能的发展前景。

“此次事件是对大模型能力的一次重要检验,也是推动我们不断探索和进步的契机。”周鸿祎最后强调,“让我们保持对人工智能的信心,相信通过不懈的努力和创新,大模型将在未来发挥更加重要的作用。”

通义千问开源数学模型Qwen2-Math,数学能力超越GPT-4o
8月9日消息,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几

2024-08-09

OpenAI积极自研AI芯片 意图领跑行业成为“AI界的苹果”
【天脉网】7月19日消息,据科技媒体The Information最新报道,知名人工智能公司OpenAI正与包括博通(Broadcom)在内的多家顶级芯片设计企业进行深度接触,意在联合研发新型AI芯片。OpenAI此举旨在通过自研AI芯片,进一步整合软硬件资源,以提升其AI技术的整体效能,致力于成为AI行业的领军者,类似于科技巨头苹果在消费电子领

2024-07-19

Meta新模型遇欧盟监管难题 多模态Llama模型无缘欧盟市场
【天脉网】7月18日消息,据Axios报道,科技巨头Meta在一份官方公告中透露,他们计划推出一款全新的多模态Llama模型。然而,由于当前监管环境的不明朗,这款先进的模型将不会在欧盟地区发布。Meta的这一决策意味着,即便该模型在开放许可下发布,欧盟地区的用户和企业也将无法体验到这一多模态模型的功能。作为替代,Meta将

2024-07-18

OpenAI的Sora工具成创意工作者新宠 助力创作而非取代人类
【天脉网】5月6日消息,OpenAI的文生视频工具Sora的早期测试反馈已出炉,测试者们似乎对此工具颇为满意。他们普遍反映,Sora并未给他们带来职业危机感,反而成为了他们工作的得力助手。Sora,这款由人工智能初创公司OpenAI于今年2月正式推出的工具,被设计为能够“深入理解和模拟变化中的现实世界”。它独特的文本到视频转

2024-05-06