记者 |
“这是最近几年GTC最忙的一天,我们发布了很多东西。”美国时间9月20日晚,在英伟达GTC大会结束之后,英伟达CEO黄仁勋穿着标志性的皮衣坐在电脑前,向界面新闻等亚太地区媒体说道。
近期,以GPU(图形处理器)跻身美国市值最高半导体公司的英伟达频频成为市场焦点,一度春风得意,但随着半导体市场进入下行周期,英伟达也迎来需求减低、地缘政治争端等“逆风”,市值大幅回调。对此,该公司仍保持既定产品发布节奏,推出了多款重要的软、硬件新品。
面对全球通胀,英伟达此次发布的一系列芯片以高端产品为主,包括Ada Lovelace架构RTX 40系列游戏GPU、自动驾驶芯片“雷神”(Thor)等,并宣布高性能数据中心GPU H100全面投产。省钱和性能提升,是黄仁勋口中英伟达新品的两大特性,并用“爆表”(the delivered values of us off the charts)来形容交付的产品价值。
但对消费者而言,新一代高端游戏显卡明显比过往版本更贵。其中RTX 4090定价比2020年发售的上一代3090显卡高7%,4080定价更比2020年发售的上一代3080显卡高29%。RTX 40系列的Ada Lovelace主要接替2020年5月问世的Ampere架构,而基于Ampere架构的RTX 30系列游戏显卡是在2020年9月上市。
黄仁勋称,半导体的成本比过去高很多,人们必须意识到,摩尔定律(集成电路上可容纳的元器件数目将每隔18-24个月增加一倍,性能也将提升一倍的半导体行业规律)已经结束,技术进步推动芯片成本越来越低的想法不再理所当然,这也是英伟达通过诸如光线追踪、张量计算核心(tensor core)等技术克服通胀的价值所在。“新产品能够提供比上一代高出许多倍的性能,这在过去是不可能的。”他说道。
“全栈”是黄仁勋在接受采访时多次提及的技术名词,他强调英伟达不仅是一家芯片公司,还提供开发工具包、算法等必要的软件,帮助开发者更快开发AI、科学计算、游戏应用,降低开发难度。他以游戏为例,即使电脑的CPU性能成为瓶颈,GPU仍能让游戏画面表现翻倍。
值得注意的是,此次发布的RTX 40系列GPU切换了芯片代工方,采用台积电专为GPU优化的4纳米制程工艺,而上一代RTX 30系列由三星生产。
当有韩国记者问及英伟达与三星的关系,黄仁勋称,双方涉及供应链与代工两部分,一方面英伟达是目前高带宽内存(HBM)的全球最大客户,三星电子提供HBM给英伟达;而在代工方面,三星旗下晶圆代工厂继续向英伟达生产GPU、机器人处理器等芯片。
黄仁勋坦言,外界需要认识到,供应链是一个非常复杂的事情,像手机、计算机、汽车等都已经是全球分工,“最先进的有机衬底(organic substrates)来自日本、组装在中国、晶圆制造在中国台湾、软件在美国,从头到尾来看,全世界已经高度整合。”他认为现在考虑安全风险是一个好事情,但观察供应链并非是从单一部件出发,而是需要整体视角。
此次英伟达高性能数据GPU H100也全面投产,只是尚未正式出货就被美国政府列入出口管制范围,无法向中国客户供货。该禁令源于8月美国政府推出的一项针对中国和俄罗斯的出口政策,涉及英伟达在售的Ampere架构A100和本次的Hopper架构H100两款芯片。
对此,黄仁勋回应称,目前市场使用的绝大多数产品不受影响,至于特殊应用的产品则需要通过申请出口认证。英伟达会向中国客户提供基于Hopper架构,且不在美国政府限制范围内的替代版本,足够满足中国市场绝大多数需求。而对受限产品有明确需求的客户,英伟达将尝试为其申请许可。
他强调,英伟达多款产品都足以满足大部分用户需求,A100也只是英伟达基于Ampere架构的五款产品中的一款,用户也可以通过其他选项进行替代。“我们将会有大量的产品,这些产品在架构上是兼容的,完全不需要许可。”
除了宣布RTX40系列GPU和H100全面投产,英伟达公布的Thor车用超级芯片也颇受市场关注。英伟达称,该芯片可提供每秒2000万亿次浮点运算性能,预计将于2024年量产,并应用于2025年的车型上。英伟达目前被应用于量产汽车的Orin产品,可提供每秒254万亿次浮点运算性能。而其去年发布了预计2024年量产、可提供每秒1000万亿次浮点运算性能的Atlan,如今已被Thor取代。
对于近期半导体领域火热的RISC-V架构,黄仁勋称,英伟达是全球最早把RISC-V架构用在产品上的公司之一,只是目前RISC-V与有完整生态链的x86、Arm架构相比,部分第三方软件还没准备好。黄仁勋认为RISC-V比较适合用在定制化产品上,长期来讲仍需要建立软件生态链,“RISC-V能不能构建类似Arm或x86类似的生态?当然可以,但这可能要花费十年甚至二十年时间。”
评论