文/VR陀螺 林德
AI,最近在互联网上的讨论度再次高涨,与此同时,业界公认含AI量极高的又一年英伟达秋季GTC大会结束。
“机器人开发将掀起新一波AI浪潮。”与四月的GTC的愿景相同,英伟达仍将机器人开发视作下一波AI浪潮的推手。相比四月份着重于Omniverse的升级,在本次GTC 2022黄仁勋的主题演讲中,除了Omniverse的升级更新之外,更是有硬核产品面市。
硬件全面升级
英伟达加固AI基建
“推动计算技术发展这枚火箭的引擎是加速计算,而燃料则是AI。”作为AI背后的关键技术支持,GPU在AI的发展中已成AI计算的标配。
在GTC 2022主题演讲中,英伟达CEO黄仁勋在开场就为大家端上一道硬菜,基于全新Ada Lovelace架构的新一代显卡RTX 6000,这是专门为内容创作者和企业级而设计的“工作站”系列的最新显卡。据了解,RTX 6000将于今年12月开始供货。
Ada Lovelace架构(图源:英伟达)
英伟达官方将RTX 6000描述为与英伟达Omniverse企业一起为元宇宙创造内容的完美工具。与不久前发布的消费级GeForce RTX 4090相比,RTX 6000有18176个CUDA核心,而RTX 4090的是16,384个,并将配备48GB GDDR6 ECC内存,是RTX 4090的24GB GDDR6X的两倍。
据其官方介绍,RTX 6000融合了最新的渲染、AI和着色器技术,拥有568个Tensor Core和142个RT Core,相比上一代“工作站”系列的A6000,在性能上提高了2-4倍。
RTX 6000(图源:英伟达)
Ada架构光线追踪性能是上一代的2倍以上,这些新内核还引入了“Opacity Micro-Map Engines”和“Micro-Mesh Engines”,这两个新的硬件功能可以加速某些光线追踪工作负载。使用光线追踪时,着色器执行重新排序可将着色器性能提高多达2倍,帧速率提高25%。
图源:英伟达
RTX 6000其他特点包括:
第三代RT Core:吞吐量是上一代的2倍,能够同时运行具有着色或去噪功能的光线追踪技术。
第四代Tensor Core:相比上一代AI训练性能提升近2倍,扩展支持FP8数据格式。
CUDA core:单精度浮点吞吐量最高达到上一代的2倍。
GPU内存:具有48GB GDDR6内存,可处理大规模的3D模型、图像渲染、模拟和AI数据集。
虚拟化:将支持用于多个高性能虚拟工作站实例的NVIDIA虚拟GPU(vGPU)软件,使远程用户能够共享资源并驱动高端设计、AI和计算工作负载。
XR(扩展现实):视频编码性能相比上一代产品提升近3倍,可使用NVIDIA CloudXR流式传输实现多个XR会话同步。
除了专业版,英伟达还宣布了面向消费者的旗舰显卡,基于Ada架构的RTX 4090和RTX 4080。RTX 4090拥有16384个CUDA核心和24GB VRAM,达到了83 Teraflop的算力,是目前最强的游戏GPU。英伟达表示即便是12GB版本也要略强于上一代旗舰产品RTX 3090 Ti,此外,16GB版本的速度为RTX 3080 Ti的两倍,但功耗相同。
参数规格对比(图源:UploadVR)
RTX 4090将于10月12日上市,价格为1599美元。RTX 4080系列将在11月份上市。
图源:英伟达
在游戏领域,AI图像计算能力十分关键,新的显卡带来硬件支持的同时也带来了技术的升级,针对游戏领域,英伟达宣布了一项全新技术NVIDIA DLSS 3。
据介绍,DLSS 3能够将低分辨率的输入转化为高分辨率的输出,在画面质感上带来极大的提升的同时,不会影响响应速度,对于一些受到CPU限制的大型游戏友好。相较于单纯的渲染,游戏的性能在DLSS 3的加持下最高可提升4倍。
图源:英伟达
目前,DLSS技术可用于200多个游戏和应用程序,DLSS 3支持的游戏和应用超过30款,包括《赛博朋克2077》、《黑神话:悟空》等。
《赛博朋克2077》渲染对比(图源:英伟达)
自动驾驶领域,是芯片与AI技术迭代的关键领域。黄仁勋就曾表示,未来汽车是可编程的,英伟达也一直在不断尝试进军未来汽车领域。基于Hopper GPU架构,搭配NVIDIA Grace CPU,英伟达在大会上宣布推出下一代超级芯片NVIDIA Drive Thor。
据官方介绍,NVIDIA Drive Thor是第一个使用集成推理Transformer引擎的自动驾驶汽车平台,借助Transformer引擎,DRIVE Thor可将 Transformer 深度神经网络的推理性能提升高达 9 倍。DRIVE Thor将可用于汽车制造商2025年的车型,并且将作为Drive Orin的真正继任者取代去年发布的Drvie Atlan。
图源:英伟达
在DRIVE Thor的加持下,可实现最高 2000 TOPS AI 算力以及 2000 TFLOPS 浮点算力,可以将包括自动驾驶和辅助驾驶、泊车、驾乘人员监控、数字仪表板、车载信息娱乐(IVI)、后座娱乐功能等智能功能,统一整合到单个架构中,从而提高效率并降低整体系统的运行能耗。
图源:英伟达
“机器人开发将掀起新一波AI浪潮。”英伟达正在构建多个机器人平台——用于自动驾驶汽车的DRIVE,用于操纵和控制系统的Isaac、用于自主式基础架构的Metropolis,以及用于机器人医疗器械的Holoscan。”这是今年4月黄仁勋在GTC演讲时的一番话.
在机器人领域,英伟达宣布推出Jetson Orin Nano模块,这将是Jetson系列微型计算机的最新成员,旨在加速AI进程和机器人技术。据介绍,Jetson Orin Nano模块将带来高达每秒40万亿次操作(TOPS)的AI性能,是上一代Orin NX模块性能的80倍。Jetson Orin Nano模块将于明年1月开始供货。
图源:英伟达
Omniverse重要更新
发布Saas云端产品
在GPU硬件的革新下,英伟达的解决方案一直在全球人工智能领域重要的占据着重要位置,Omniverse计算平台成为数据中心、数字孪生、自动驾驶等场景和应用的标配。
图源:英伟达
硬件与软件的更新迭代需要场景来佐证其必要性,不论是Charter(特许通讯)和Heavy.AI制作蜂窝网络基建数字世界,以模拟射频传播和观察网络性能,还是百事公司的虚实流水线,亦或是美国零售商Lowe's的交互式商店数字孪生系统的案例,都是在Omniverse环境中创建的。
百事公司数字孪生生产线(图源:英伟达)
“正如互联网连接了2D世界,Omniverse连接了3D世界。未来所有制造的东西都将拥有‘数字双胞胎’”黄仁勋说道。而由此也可以看出,英伟达仍将数字孪生视作Omniverse平台的重要应用。
为了实现Omniverse平台的协作性,英伟达宣布推出首款软件加基础设施即服务产品Omniverse Cloud云服务,艺术家、开发者和企业团队可以在任何地点使用这套综合、全面的云服务来设计、发布、运行和体验元宇宙应用。
Omniverse Cloud服务在Omniverse Cloud Computer上运行。该计算系统由用于图形和物理学模拟的NVIDIA OVX、用于高级AI工作负载的NVIDIA HGX以及NVIDIA图形交付网络(GDN)组成。
图源:英伟达
借助Omniverse Cloud,在无需任何本地算力的情况下,一键体验3D工作流的设计与协作能力。机器人专家可以对AI赋能的智能机器进行训练、仿真、测试和部署,并提高可扩展性和可访问性。自动驾驶汽车工程师可通过生成基于物理学的传感器数据并模拟各种交通场景,来测试各种道路和天气状况,推动实现无人驾驶的安全部署。
在演讲中,黄仁勋借助RIMAC Nevera先进的实时3D汽车配置器来演示Omniverse Cloud, RIMAC Nevera是RIMAC Group旗下的BUGATTI RIMAC最近推出的电动超级跑车。
RIMAC团队利用Omniverse Cloud远程协作(图源:英伟达)
相较于今年4月推出的Omniverse Cloud服务,本次更新增加了四项新服务,使得Omniverse Cloud服务增加到7项,包括:Nucleus Cloud,供团队和设计师自由协作并访问USD的共享3D场景和数据,并进行实时编辑、更改、共享;
App Streaming,使没有NVIDIA RTX™ GPU的用户能够流式传输Omniverse参考应用,例如Omniverse Create、Omniverse View和NVIDIA Isaac Sim;
Replicator,使研究者、开发者和企业能够生成物理级精确的3D合成数据并轻松构建自定义合成数据生成工具;
Farm,使用户和企业能够使用多个云实例扩展Omniverse任务,例如渲染、合成数据生成等;
Isaac Sim,这个可扩展的机器人仿真应用与合成数据生成工具可驱动物理级精确的逼真虚拟环境,以便开发、测试和管理AI机器人;
DRIVE Sim,这个端到端仿真平台通过运行大规模、物理级精确的多传感器仿真,支持自动驾驶汽车从概念到部署的开发和验证,可以提高开发者的生产力并加快产品上市时间。
比起着重于实时协作的Omniverse Cloud,NVIDIA OVX系统更加着重于构建3D世界。NVIDIA专业可视化业务副总裁Bob Pette表示:“大规模数字孪生正在重新定义几乎所有行业在物理世界中的规划、设计和构建方式,NVIDIA OVX将为构建工厂、建筑和整座城市等最复杂的数字孪生提供其所需的新一代算力支持。”
在本次大会上,英伟达宣布推出第二代NVIDIA OVX计算系统,该系统采用NVIDIA Ada Lovelace GPU架构和新升级的网络技术,具有开创性的实时图形、AI和数字孪生性能。NVIDIA L40 GPU能够为构建复杂的工业数字孪生提供强大的算力和性能支持。
图源:英伟达
除了这些重大更新之外,NVIDIA还宣布了两种新的大型AI语言模型,分别是用于自然语言AI应用的NeMo API和用于生物学、化学应用的BioNeMo。
图源:英伟达
此外,还包括以下“新动作”:
Lowe's宣布它将为其他Omniverse创作者免费提供其600多个逼真的3D产品资产库。
德国的德国铁路网已经宣布,它正在使用Omniverse中的数字孪生来开发其未来的铁路系统。
Nvidia宣布H100 Tensor Core GPU已进入全面生产阶段,并准备在10月推出其首批基于Hopper的产品。
在医疗领域,Nvidia宣布推出IGX平台,一个软硬件结合的平台,专门为机器人辅助手术和病人监测等用例设计。
Nvidia与麻省理工学院和哈佛大学的Broad研究所之间的合作,将GPU加速的Clara Parabricks软件引入Terra生物医学数据平台,使研究人员能够将基因组测序等任务的速度提高24倍。Nvidia表示将贡献其深度学习模型,以帮助识别与疾病相关的基因变异。
Nvidia和Booz Allen宣布将扩大合作,通过GPU加速其网络安全平台来使用AI,该平台基于Nvidia的Morpheus框架。
比起4月的GTC着重于机器人、自动驾驶等AI重点领域,本届GTC上英伟达用更多的案例、场景和议题,涵盖工业、医疗保健、影视、游戏场景制作、海洋建模等等,告诉着大家,AI已在全球各行各业遍地开花。
从新兴黑科技到未来必需,英伟达GTC在不断向大众证明AI在成为3D互联网基建的地位已然越来越稳固。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息