天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

DeepSeek-R1再创佳绩,全球风格控制类大模型登顶!

2025-01-29来源:天脉网编辑:瑞雪

近期,国内AI大模型领域传来振奋人心的消息,DeepSeek-R1在国际大模型排名Arena上取得了显著进展。自1月24日发布以来,这款深度求索推理大模型在短时间内便迅速攀升至全类别大模型排名的第三位。

在Arena的全类别大模型排名中,DeepSeek-R1以其卓越的性能脱颖而出。这一成就不仅展示了DeepSeek团队在AI技术研发上的深厚实力,也标志着国内AI大模型在全球舞台上的竞争力日益增强。DeepSeek-R1在风格控制类模型(StyleCtrl)分类中更是与OpenAI的o1模型并列第一,其Arena得分高达1357分,略高于o1的1352分。

在Arena的排名中,还出现了一个令人意外的现象。小红书这一社交平台在全球大模型排名中的位置,竟然超过了Twitter、Discord、Blog、GitHub、Paper、Dataset等众多常用链接。这一排名结果或许反映了小红书在内容生成和互动方面的独特优势,也引发了人们对社交平台在AI时代角色的新思考。

在全球大模型的激烈竞争中,DeepSeek系列模型无疑成为了国内AI领域的佼佼者。除了DeepSeek-R1之外,DeepSeek-V3也成功跻身全球大模型排名前十名。这两款模型的出色表现,不仅为DeepSeek团队赢得了广泛的赞誉,也为国内AI技术的发展注入了新的活力。

关于Chatbot Arena(前身为LMSYS)的排名机制,其采用了一种盲测的方式。用户可以向两个匿名的AI聊天机器人提问,并选择他们认为最好的回答。这一过程将持续进行,直到确定优胜者。为了确保排名的公平性,如果AI的身份在盲测过程中被揭露,那么该用户的投票将被视为无效。Chatbot Arena还推出了上传图片并与AI互动的新功能,以及使用文本生成图像模型(如DALL-E 3、Flux、Ideogram)来创建图像的功能。用户还可以通过RepoChat标签与Github仓库进行互动聊天,进一步拓宽了AI的应用场景。

《荒野大镖客 2》再夺Steam周销冠,国区热卖榜单揭晓!
根据 Steam 公布的最新一周销量榜(1月21日至1月28日),《荒野大镖客 2》成功登顶全球及国区榜单。此次榜单排除了 Steam Deck游戏机和免费游戏,展示了多款热门作品。紧随其后的是《最终幻想 …

2025-01-29

DeepSeek梁文锋谦逊回应:愿做AI火种,中国开发者共筑未来栈桥
DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持,说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙子啃烧烤一一他们给四足机器人装的那…

2025-01-29

荣耀中国区掌舵人更迭,王元琳接替倪嘉悦领航新篇章
每经AI快讯,荣耀人事调整还在继续,记者了解到,近日荣耀在内部发布多项人事调整,其中中国地区部总裁一职发生变动,王元琳接任中国地区部总裁职务,倪嘉悦新任新商业模式拓展部总裁。(21财经)…

2025-01-29