文/VR陀螺万里
今日上午,英伟达CEO黄仁勋发表了CES2025活动演讲。
除了黄仁勋标配的皮衣外,演讲现场一口气丢出了RTX50系列显卡、AIPC、自动驾驶系统、世界基础模型Cosmos等多个新品/解决方案。
从这场发布会来看,英伟达的AI雄心,其实远不止芯片制造商。
50系显卡公布,还有一款超强性能的AIPC
- GTX50系列显卡
50系显卡全系采用Blackwell架构,升级为PCle5.0接口、并支持DLSS4等新特性。现场具体介绍了RTX5090显卡,它相较4090更贵但也更强了:售价:1999美元,国内建议零售价为16499元。
具体参数方面,RTX5090拥有920亿个晶体管、21760个CUDA核心、配备32GBDDR7内存,AI算力最高可达2375TOPS。得益于架构的改进,新款显卡GPU性能基本是上一代显卡的2倍。
此外,发布会中提到,RTX5070显卡性能可以比肩4090,但售价只有549美元,新一代真香卡预定。
据了解,对于桌面显卡,RTX5090、RTX5080GPU(8299元)将于1月底上市;RTX5070Ti、RTX5070将于2月份上市。对于笔记本产品,搭载GeForceRTX5090、RTX5080和RTX5070Ti笔记本电脑将于3月上市,RTX5070系列笔记本将于今年4月上市。
RTX50系列具体规格信息,图源:网络
- 服务器互联技术NVLink72
文章开头黄仁勋所举着的这个类似盾牌一样的东西是为了展示企业最新的AI服务器互联技术NVLink72。
基于NVLink72,可以将总计72个BlackwellGPU和36个GraceCPU集中在一块硅基芯片上面,如果按照传统的架构构建同类型产品,那么它的体积可能会跟一个衣柜大小相当。
NVLink72的主要参数特性如下:基于Blackwell框架;可以双向提供1.8TB/秒的总带宽,是上一代产品的两倍;NVLink72的总带宽比PCIeGen5高出14倍以上;可以通过NVLinkSwitch连接多个NVLink72。
- 超强性能AIPC
ProjectDigits是英伟达打造的首个AI超级计算主机,该产品作为会上的Onemorething推出。
ProjectDigits外观类似于Macmini,极为小巧便携,但是里面却配备了一颗GB10GraceBlackwell超级芯片,AI算力高达1petaflop,单台设备便可运行包含200B参数AI模型。据悉联发科也参与了GB10的芯片设计工作。
此外,ProjectDigits配备了128GBRAM,ROM达到了4TB。主机搭载GraceCPU,其由20个Arm核心构成,并配备了Connectivity、ConnectXNIC等组件。
ProjectDigits运行NvidiaDGXOS,系统基于Linux构建,里面集成了英伟达的系列AI软件库。产品售价3000美元,并计划于今年5月上市。会上黄仁勋表示,产品适用于“每一位数据科学家、人工智能研究人员和学生,将使他们能够参与和塑造人工智能时代。”
从AI模型到自动驾驶、具身智能,英伟达最新AI蓝图
- 大语言与世界模型
会上推出了两款全新AI模型,其中NVIDIALlamaNemotron是一款大语言模型,它基于Llama基础模型构建而成,使用英伟达的最新技术和高质量数据集进行修剪和训练,以增强代理能力。它们擅长指令遵循、聊天、函数调用、编码和数学,同时经过尺寸优化,可以在各种英伟达加速计算资源上运行。
LlamaNemotron包含了Nano、Super、Ultra三个版本。其中Nano版本针对低延迟的实时应用进行了优化,非常适合部署在PC和边缘设备上。该模型即将免费对外开放下载,或可通过NVIDIANIM进行调用。
除了大语言模型外,英伟达还首度公布了NVIDIACosmos,这是一个由先进的生成式世界基础模型(WFM)、tokenizer、护栏和加速视频处理管线组成的平台,旨在加速自动驾驶汽车(AV)和机器人等物理AI系统的开发。
所谓世界基础模型,即一个能理解世界语言、物理特性、空间位置以及因果关系的模型,它是加速智能汽车、具身智能等AI终端普及的关键所在。相较于LLM的蓬勃发展,世界模型仍处于较为早期的阶段。在开发方面,世界模型背后的开发同样涉及到海量的基于现实世界数据的捕获以及训练工作,因而开发成本不菲。
而现在,Cosmos模型采用了开放模型许可证的方式对外提供,可通过NVIDIAAPI、NVIDIANGC目录或HuggingFace下载使用,这对于机器人等领域的开发者而言无疑是一个重要的利好消息。
英伟达CosmosWFM接受了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据。CosmosWFM为开发人员提供了一种简单的方法来生成大量基于物理的真实照片合成数据,以训练和评估他们现有的模型。开发人员还可以通过微调CosmosWFM来构建自定义模型。
黄仁勋表示:“机器人技术的ChatGPT时刻即将到来。与大语言模型一样,世界基础模型是推动机器人和自动驾驶汽车开发的基础,但并非所有开发者都拥有自主训练模型所需的专业知识和资源。我们创建Cosmos是为了普及物理AI,让每一位开发者都能接触到通用机器人技术。”
据悉,NVIDIACosmos的合作伙伴包含了1X、AgileRobots、Agility、FigureAI、Foretellix、小鹏汽车、Uber等机器人及智驾企业。
基于NVIDIACosmos,黄仁勋还在会上展示了更多令人眼前一亮的用例,如将它与自家数字孪生平台Omniverse相结合,从而打造出合成数据倍增引擎,开发者可轻松生成大量可控、照片级逼真的合成数据。开发者可以在Omniverse中编写3D场景,并将图像或视频渲染为输出。然后,这些场景可以与文本提示结合使用,以调整Cosmos模型,从而生成无数合成虚拟环境,用于物理AI训练。
- 自动驾驶与具身智能
对于自动驾驶以及机器人,黄仁勋表示,未来的企业实际上需要用到三套计算系统,其中DGX用于AI模型训练、Omniverse则用于模拟、合成、强化数据,而DGX则是应用于终端的AI芯片。(实际上,这也很好概括了英伟达当前以及后续所聚焦的核心业务)
提到自动驾驶,黄仁勋指出“这可能是第一个价值数万亿美元的机器人产业”,今日他宣布的重磅新闻之一是英伟达将与丰田合作开发自动驾驶汽车。
此外,会上还推出了新一代智驾芯片DRIVEAGXThor,芯片基于Blackwell架构,算力相较上一代提升20倍。今日极氪宣布将首发该芯片。
NVIDIADRIVEHyperion是一个汽车自动驾驶系统,今日黄仁勋宣布系统已经通过TÜVSÜD和TÜVRheinland的行业安全评估,这是业界首个也是唯一一个端到端自动驾驶平台,目前合作客户包括奔驰、路虎、沃尔沃等。
除汽车外,黄仁勋还公布了面向类人机器人的NVIDIAIsaacGR00T合成运动生成蓝图。目前类人机器人的一个重要领域是模仿学习,即通过观察和模仿人类行为来获得相应的技能。其背后同样涉及到大量繁琐的数据采集工作。
NVIDIAIsaacGR00T分为了三大板块:其中GR00T-Teleop工作流程可以基于VisionPro在数字孪生中捕捉人类运动数据;而GR00T-Mimic工作流程将捕获的人类演示用以构建更大的合成运动数据集。最后,基于NVIDIAOmniverse和NVIDIACosmos平台构建的GR00T-Gen工作流程通过域随机化和3D升级成倍地扩展该数据集。
结语
英伟达成立于1993年,2006年推出CUDA,这可视为当前企业AI芯片帝国的重要奠基石。
现如今,英伟达除了显卡以及AI芯片业务外,触角显然延伸到了更远,如正在攻坚的自动驾驶系统,以及具有很强想象空间的Cosmos。
另外我们从黄仁勋在活动现场的频频整活也不难看出,今日的英伟达,依旧朝气蓬勃。