近期,人工智能领域迎来了多项重大进展,谷歌与OpenAI两大巨头相继发布新技术,引发业界广泛关注。
谷歌最新推出的Gemini 2.5 Pro模型,在上线之初便震惊业界,创下了历史上最大的分数飞跃纪录。这款专为复杂任务设计的“思考”模型,凭借其强大的推理能力,横扫各大榜单,夺得多个TOP 1的位置。谷歌强调,这里的“推理”能力远不止于简单的分类和预测,而是涵盖了系统分析信息、逻辑结论推导、上下文及细微差别融入,以及明智决策制定等多方面能力。Gemini 2.5 Pro不仅继承了前代模型的多模态能力和超长上下文长度优势,还进一步升级,支持高达100万token的上下文窗口(未来还将推出200万token版本),性能显著提升。目前,该模型已在Google AI Studio和Gemini应用中向高级用户开放,并将很快登陆Vertex AI平台。
与此同时,OpenAI也在凌晨宣布了GPT-4o多模态生图功能的正式上线。用户现在只需在GPT-4o这一多模态模型中通过语音或上传图片,就能生成精确、逼真的图像。据OpenAI官方博客介绍,GPT-4o在图像生成方面表现出色,能够准确渲染文本、遵循提示,并利用其固有的知识库和聊天上下文进行创作,包括转换上传的图像或将其作为视觉灵感。这一功能使得图像创建变得更加容易和准确。此前,GPT-4o作为原生多模态模型,已支持端到端的语音输入输出,现在又增加了图片的端到端输入输出功能。
在AI数据中心领域,苹果公司也传来新动向。据消息透露,苹果正在向英伟达订购价值约10亿美元的GB300 NVL72系统,以构建大型服务器集群,支持生成式人工智能应用。这一举动标志着苹果正式进军AI数据中心领域,加入大型科技公司在这一领域的竞争。苹果正与戴尔科技和超微电脑合作,预计这将显著提升其AI应用的性能。
在社交媒体和汽车行业,也有重大人事变动消息传出。TikTok内部备忘录显示,负责全球广告销售及市场营销的Blake Chandlee因公司重组转任顾问,这是TikTok剥离美国业务最后期限前的最新管理层变动。而在哪吒汽车方面,首席技术官戴大力已离职加入奇瑞,智驾负责人王俊平则加入了商汤绝影。哪吒汽车官方证实了这一消息。
OpenAI也进行了领导层改组,首席执行官山姆·奥特曼将更专注于研究和产品开发,首席运营官布拉德·莱特凯普将扩大职权范围,负责日常运营和全球扩张,而马克·陈则担任首席研究官一职。这一变动旨在进一步优化公司结构,推动技术创新。
在硬件方面,苹果iPhone 17 Air的最新机模曝光,其极致轻薄的5.5毫米厚度引发关注。与iPhone 17 Pro相比,Air的厚度约为Pro的一半。新机型的摄像头布局也采用了类似谷歌Pixel的“横向相机条”设计,打破历代iPhone的圆角矩形布局。据称,iPhone 17 Air将配备6.6英寸120Hz ProMotion灵动岛屏幕,搭载标准版A19芯片,并配备自研C1基带芯片。
英伟达也带来了一项有趣的新功能——G-Assist AI助手。这款曾在2017年作为愚人节玩笑亮相的技术演示,如今已转变为真正为RTX GPU用户服务的AI助手。G-Assist集成在英伟达应用中,用户可以通过语音或文字与其交互,获取游戏与系统性能优化建议。它还能控制来自罗技、海盗船、微星等品牌的兼容设备灯光效果,为用户带来更加便捷的游戏体验。
最后,小米创办人雷军也回到了母校武汉大学,为即将上市的YU7汽车拍摄宣传内容。同时,他还为武汉大学学生颁发了“雷军卓越奖学金”,每人10万元,共计10名学生获奖。雷军表示,这段时间是武汉大学最美的时刻,他特意选择在凌晨五点多到校园,为拍摄做准备。