天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

马斯克Grok挑战AI幻觉测试,国产AI表现如何?

2025-06-24来源:天脉网编辑:瑞雪

马斯克愤怒发声:AI大模型训练数据垃圾过多,计划重写人类知识语料库

近日,OpenAI联合创始人马斯克在X平台上愤怒发文,直指当前AI大模型训练中使用的数据存在大量垃圾信息,严重影响AI生成内容的准确性。作为汽车与航天领域的巨头,马斯克同时也在AI领域深耕多年,其旗下的xAI公司更是开发出了备受瞩目的人工智能助手Grok。

据财联社报道,xAI公司正在进行一笔高达3亿美元的股权交易,此次交易对xAI的估值达到了惊人的1130亿美元。手握如此庞大资源的马斯克,对于AI大模型训练数据的质量问题显然无法容忍。他在发文中表示,将使用具有高级推理能力的Grok 3.5(或命名为Grok 4)来重写人类知识语料库,旨在添加缺失信息并删除错误内容,从而构建一个更为可靠、可信的知识基础。

AI幻觉现象频发,行业普遍寻求解决方案

马斯克之所以如此愤怒,很大程度上源于当前AI大模型中普遍存在的“AI幻觉”现象。所谓AI幻觉,即AI在生成内容时由于训练数据中的错误或偏差,导致生成的内容存在事实性错误或偏差。这不仅让用户对AI生成的内容产生怀疑,也限制了AI在更多领域的应用。

为了应对这一问题,行业普遍采取了多种方案,如通过RAG框架、外部知识库结合、精细化训练与评估工具等,以减少AI幻觉的产生。然而,马斯克显然认为这些方案并不足以从根本上解决问题,因此才提出了重写人类知识语料库的计划。

雷科技评测:AI大模型进步显著,但仍需努力

为了更直观地了解当前AI大模型在AI幻觉方面的表现,雷科技近期对多款AI大模型进行了评测。参与评测的AI大模型包括豆包、通义、文心、Kimi、DeepSeek以及马斯克旗下xAI公司开发的Grok。评测结果显示,尽管AI大模型在整体能力上有了显著提升,但在面对某些特定问题时,仍会出现AI幻觉现象。

例如,在回答“Strawberry一词中有多少个字母‘r’”这一简单问题时,仍有部分AI大模型给出了错误答案。而在面对更为复杂的问题时,如“法拉第未来为什么能够成为2024年全球新能源汽车销量冠军”,部分AI大模型则出现了捏造数据或分析不准确的情况。不过,值得注意的是,Grok在此次评测中表现尤为出色,不仅准确回答了所有问题,还展现出了强大的推理能力。

重写知识库争议不断,AI幻觉或有其价值

尽管马斯克计划重写人类知识语料库的决心坚定,但这一计划也引发了不少争议。有行业专家指出,重写知识库不仅需要消耗大量资源,还可能掺入xAI的观点,从而影响语料的客观性。随着新数据的不断加入,对知识库进行频繁重写也会影响Grok的开发进度。

另一方面,也有学者认为AI幻觉在抽象创作、自动驾驶、科学研究等领域具有一定的价值。例如,David Baker团队就利用AI“错误折叠”启发新型蛋白质结构,并因此获得了2024诺贝尔化学奖。这表明,在一定程度上保留AI幻觉,或许能够为科学研究和创作带来新的灵感和突破。

尽管AI大模型在整体能力上有了显著提升,但仍需努力减少AI幻觉现象的发生。而马斯克计划重写人类知识语料库的举动,虽然引发了不少争议,但也无疑为AI领域的发展带来了新的思考和探索。

元宇宙平台公司Muse Spark模型亮相:强化多模态感知,新功能即将全球铺开
新华社旧金山4月8日电(记者吴晓凌)美国元宇宙平台公司8日宣布推出新一代人工智能模型Muse Spark,称这是其“超级智能实验室”推出的首个模型,也是该公司目前功能最强的模型,现已为该公司旗下的人工智能应用…

2026-04-11

智元酷拓COO邱恒:四足机器人将迎爆发,要做有“脑子”的生产力工具
邱恒反复强调一个核心概念,智元酷拓做的不是机器狗,是四足机器"人"。邱恒:暂时不会做融资,因为我们不想稀释股份,老大说这个市场很大很大,值很多很多的钱,你不要现在就卖掉了。 邱恒:大家比的时候不能光看四足…

2026-04-11

众擎机器人B轮融资2亿美元,多家机构领投跟投估值破百亿
4月9日,众擎机器人正式完成总额2亿美元的B轮融资。本轮融资由河南投资集团汇融基金领投B轮,产业资本立讯精密战略入局、联合领投。此外,中创智领战投、基石资本、龙岗金控、金谷资本、财通资本、多伦科技战投、能量守…

2026-04-11

翔城新材料“加纸制袋装置”获专利,实现纸张材料表面灰尘高效自动收集
专利摘要显示,本实用新型适用于纸袋加工生产技术领域,尤其涉及一种加纸制袋装置,包括若干个传动轮,且若干个传动轮的外侧共同套接有运输带,所述传动轮的一侧设置有支撑腿,且支撑腿的表面搭载有安装板,所述安装板的表…

2026-04-11