英伟达放大招：押注生成式AI，光刻计算提速40倍，助力台积 ...

2023-3-22 17:19| 发布者: fuwanbiao| 查看: 246| 评论: 1

摘要: 出品 | 搜狐科技作者 | 梁昌均美国当地时间3月21日，英伟达GTC 2023大会如约而至，英伟达开创人兼CEO黄仁勋一如往常身着黑色皮衣，发表了近80分钟的主题演讲。这次被黄仁勋称为“迄今为止最重要的一次GTC”有超越25 ...

出品 | 搜狐科技

作者 | 梁昌均

美国当地时间3月21日，英伟达GTC 2023大会如约而至，英伟达开创人兼CEO黄仁勋一如往常身着黑色皮衣，发表了近80分钟的主题演讲。

这次被黄仁勋称为“迄今为止最重要的一次GTC”有超越25万人参与。他在演讲中多次提到，AI的“iPhone”时辰曾经到来，而英伟达将在生成式AI范畴中止软硬件全面规划。同时，他还发布了英伟达在加速计算、量子计算、元宇宙等范畴的技术和应用状况。

AI进入“iPhone”时辰，推出专用云效劳

黄仁勋在演讲中数次提到生成式AI，称“ChatGPT是震惊世界的AI”。他以为，这意味着崭新的计算平台的降生，AI的“iPhone”时辰曾经到来，加速计算和AI技术曾经走进理想。

在黄仁勋看来，ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具唤醒了世界对生成式AI的认知，特别是ChatGPT作为迄今历史上用户数量增长最快的应用，生成的文本令人赞扬。

黄仁勋以为，生成式AI是一种新型计算机，一种能够用人类言语中止编程的计算机，每个人都能够命令计算机来处置问题，而这之前是只需程序员才干接触的范畴，往常每个人都能够是程序员。

他同时还称，生成式AI是一种新型计算平台，与PC、互联网、移动设备和云相似。正如此前的互联网一样，生成式AI也将重塑每个行业。

不外，黄仁勋提到，一些专业范畴的公司需求运用专有数据来定制模型，他们需求制定运用规范，并优化模型，契合公司保险、隐私和安保请求。“这个行业需求一个相似台积电的代工厂，来构建自定义的大型言语模型。”

为此英伟达宣布推出AI Foundations，黄仁勋将其称为云效劳和代工厂，其能够让企业运用专有数据中止锻炼、处置特定范畴的任务，构建自定义的言语模型和生成式AI。

英伟达AI Foundations包含言语、视觉和生物学模型三个方面效劳，其中Nemo用于构建定制的言语文本生成模型，经过Nemo能够快速生成文本，最快捷的措施是从英伟达的某项先进的预锻炼基础模型入手，轻松自定义一个模型，并中止参数调优，如汇总财务文档、创建特定品牌内容、个性化写作作风撰写邮件等，将模型链接到专有数据库，可确保响应是精确和最新的，并能够经过指定区域放避免模型呈现意外。

Picasso是一项视觉言语模型制造效劳，能够用于生成式AI赋能的图像、视频和3D应用，企业能够运用自己的数据来部署和锻炼自己的模型，并可将生成的素材导入编辑工具或Omniverse，以构建真切的虚拟世界、元宇宙应用和数字孪生仿真。Getty Images、Shutterstock和Adobe等企业曾经开端运用该项效劳。

黄仁勋还表示，英伟达将和Adobe共同构建一系列新一代AI功用，打造创意范畴的未来，将生成式AI融入营销和创意专业人士的日常工作中，新的生成式AI模型将对图像、视频、3D和动画制造中止优化。同时，为维护艺术家的权益，Adobe正在开发以商业可行性和正确内容归属为重点的计划，由Adobe的“内容真实性倡议”提供支持。

第三个是面向的生物学的BioNeMo，其可辅佐研讨人员运用专有数据创建、微调和提供自定义模型，让研发人员轻松加速药物研发工作流，能够中止蛋白质预测、分子生成、剖析衔接等，俭省药物研发时间和资金成本。

在应用方面，英伟达与三菱分离发布了将用于加速药物研发的日本第一台生成式AI超级计算机Tokyo-1。Tokyo-1经过运用BioNeMo软件，研讨人员能运转高达数十亿参数的先进AI模型，可用于蛋白质结构预测、小分子生成、姿势估量等。

推出DGX Cloud，登阅读器即可访问AI超级计算机

黄仁勋在演讲中还讲述了英伟达是如何踏入生成式AI反动这一波技术浪潮。“英伟达加速计算始于DGX（AI超级计算机），这是大型言语模型完成突破背地的引擎。”

他提到，2016年其亲手将全球首款DGX交给了OpenAI，自此以后《财富》100强企业中有一半装置了DGX AI超级计算机。“DGX已成为AI范畴的必备工具，是现代AI工厂，并正在不时扩展应用范围，能够全天候运转优化数据和处置AI。”

为了让这项才干更简单快捷地访问，英伟达宣布推出DGX Cloud，经过与微软云、谷歌云和甲骨文协作，经过一个阅读器就能够将DGX AI超级计算机即时接入每家公司，其中甲骨文（OCI）将成为首个英伟达DGX Cloud落地企业。

黄仁勋表示，DGX Cloud经过优化，可运转英伟达加速库套件AI Enterprise，从而将英伟达生态系统融入到云效劳提供商。目前，英伟达全球生态系统涵盖400万开发者、4万家公司和1.4万家初创公司。

“生成式AI引发了全球企业制定AI战略的紧迫感，而这种双赢和协作同伴关系为迫切需求运用生成式AI的客户提供了在全球云端即时访问英伟达AI超级计算机的机遇。”黄仁勋说。

据引见，英伟达AI超级计算机DGX H100具有8个H100 GPU模组，在FP8精度下可提供32PetaFLOPS的算力，而H100 配有Transformer引擎，以处置相似惊人惊叹的ChatGPT模型。这8个H100 GPU模组协同工作，就像一个巨型GPU计算网络。

黄仁勋宣布，英伟达AI超级计算机已全面投入消费，很快将面向全球企业。微软宣布Azure将向其H100 AI超级计算机开放私人预览版，谷歌、亚马逊、联想、戴尔等也是协作同伴。

此外，英伟达还宣布推出全新GPU推理平台，包含用于图像生成的L40，它针对图形和AI支持的2D、视频和3D图像生成中止了优化，推理性能是英伟达最受欢送的云推理GPU T4的10倍。

针对AI视频设计的通用GPU L4，可提供比CPU高120倍的AI视频性能，能效进步99%，并优化了视频解码与转码、视频内容审核、视频通话等功用。

同时面向ChatGPT等大型言语模型的大范围部署推出H100 NVL，它配备双GPU NVLink，将两张具有94GB HBM3显存的PCIe H100 GPU拼接在一同，可处置具有1750亿参数的GPT-3大模型，同时支持商用PCIe效劳器轻松扩展。

黄仁勋表示，目前在云上独一能够实践处置ChatGPT的GPU是HGX A100。但与HGX A100相比，一台搭载4对H100及双GPU NVLink的规范效劳器的速度要快10倍，并可将大型言语模型的处置成本降低一个数量级。

计算光刻加速超40倍，可替代4万台CPU效劳器

除了生成式AI，另一大亮点是英伟达面向芯片制造范畴的严重突破——计算光刻库cuLitho。这项突破由英伟达分离全球最大芯片制造商积电、全球最大光刻机制造商ASML和全球最大EDA供给商Synopsys研发四年完成，它将计算光刻加速了40倍以上。

计算光刻模仿了光经过光学元件并与光刻胶相互作用时的行为，应用逆物理算法来预测掩膜板上的图案，以便在晶圆上生成最终图案。

黄仁勋表示，计算光刻是芯片设计和制造范畴中最大的计算工作负载，每年耗费数百亿CPU小时，需求大型数据中心全天候运转，以便创建用于光刻系统的掩膜板，而这些数据中心是芯片制造商每年投资近2000亿美圆的资本支出的一部分。

随着算法越来越复杂，计算光刻技术也在快速展开。英伟达的cuLitho能够助力芯片制造提升效率并减少功耗，抵达事半功倍的效果，也是推进2纳米级以上先进工艺的关键。

黄仁勋在演讲中就提到，目前在CPU上运转时处置单个掩膜版需求两周时间，而在GPU上运转cuLitho只需8小时就能处置完一个掩膜版。

他表示，台积电能够经过在500个DGX H100系统运用cuLitho加速，将功率从35MW降至5MW，从而替代用于计算光刻的4万台CPU效劳器。

借助cuLitho，台积电能够缩短芯片制造周期，进步产量，减少制造过程的碳排放，并为2纳米以上的消费做好准备。黄仁勋表示，台积电将于6月开端对cuLitho中止消费资历认证。

此外，黄仁勋还透露，在涵盖光线追踪和神经渲染、物理、地球和生命科学、量子物理学、化学和计算机视觉、数据处置、机器学习和AI的300个加速库和400个模型中，英伟达今年更新了其中的100个，让正在运用的用户享遭到更高的性能和更多的功用。

推出全球首个GPU加速量子计算系统，为宝马打造虚拟工厂

黄仁勋还透露了英伟达在DPU、量子计算、元宇宙等范畴的新停顿。在数据处置单元（DPU）方面，黄仁勋宣布英伟达BlueField-3 DPU已投入消费，并被百度、CoreWeave、京东、微软Azure、Oracle OCI、腾讯游戏等厂商采用，以加速其云计算平台。

在量子计算方面，英伟达正在与全球量子计算研讨社区协作。要从量子噪声和退相干中恢复数据，需求对大量量子比特中止纠错，英伟达和Quantum Machines协作开发出一个量子控制链路，可将英伟达GPU链接到量子计算机，以极快的速度纠错。

据引见，双方协作研发的全球首个GPU加速量子计算系统英伟达 DGX Quantum平台由库和系统组成，可供研讨人员推进量子编程模型、系统架构和算法，而cuQuantum是一个用于量子电路仿真的加速库。IBMQiskit、Google Cirq、百度量易伏、QMWare、QuEra、Xanadu Pennylane、Agnostig、AWS Bracket已将cuQuantum集成到它们的仿真框架中。

“固然商用量子计算机还有十到二十年的时间才干完成，但很快乐经过英伟达 Quantum为这个充溢生机的大型研讨社区提供支持。”黄仁勋表示。

面向元宇宙范畴，英伟达推出了第三代OVX计算系统和新一代工作站RTX 4000 SFF Ada Generation，为英伟达Omniverse 的大范围数字孪生提供动力。

第三代OVX效劳器经过组合双CPU平台、BlueField-3 DPU、L40 GPU、两个ConnectX-7 SmartNIC和英伟达Spectrum以太网平台，提供了突破性的图形和AI性能，可加速大范围数字孪生模仿等应用，进而进步运营效率和预测性规划功用。

黄仁勋还宣布了英伟达元宇宙平台Omniverse的相关更新，增加了一系列生成式AI、模仿仿真相关功用，让开发者能够更轻松地部署工业元宇宙应用。他表示，Omniverse Cloud是用于工业数字化的从数字到物理的操作系统，它的呈现正好赶上了正在树立的价值数万亿美圆的新电动汽车、电池和芯片工厂。

微软Azure成为英伟达Omniverse Cloud的首个云效劳提供商，并在下半年推出相关效劳。企业可访问Omniverse软件应用程序的全堆栈套件和英伟达 OVX基础设备，并享有Azure云效劳的范围战争安性。

在应用方面，亚马逊应用英伟达Omniverse平台构建了真切的数字孪生机器人仓库。英伟达还与宝马集团宣布扩展协作，为汽车制造商开设了第一个完整虚拟工厂，宝马集团将Omniverse平台用在其全球消费网络中构建和运转工业元宇宙应用。

同时，借助Azure的Omniverse Cloud效劳，汽车团队无论是在衔接3D设计工具以加速汽车开发，还是构建汽车的数字孪生工厂或运转闭环模仿来测试车辆性能等方面都可轻松完成工作流程的数字化。

路过

雷人

握手

鲜花

鸡蛋

收藏邀请

上一篇：增幅不超越 20%，音讯称苹果 A17 Bionic 性能提升低于预期下一篇：iPhone 15最新爆料汇总：A17难产且性能低于预期、USB-C ...

已有 1 人参与

会员评论

名表鉴定大师 2023-3-22 17:19 引用

有一说一，这种芯片算上光刻和电刻的话，那效率能提升，但功耗会增加。所以要加大芯片的功耗，然后进步芯片的性能才是基本

英伟达放大招：押注生成式AI，光刻计算提速40倍，助力台积 ...

会员评论

相关分类