英伟达新一代旗舰AI芯片Blackwell正在交付。但有市场人士爆料称,Blackwell GPU在装有72个处理器的服务器中使用时会产生过热问题,这些机器预计每个机架的功耗高达120kw。过热会限制GPU性能并有损坏组件的风险。
11月18日,英伟达发言人就此问题向第一财经记者回应称:“我们正在与领先的云服务提供商合作,将其作为我们工程团队和流程中不可或缺的一部分。工程迭代是正常且符合预期的。将GB200这一迄今为止最先进的系统集成到各种数据中心环境中,需要与我们的客户共同设计。”
这已不是英伟达新一代的AI芯片第一次被曝出技术问题。此前市场还爆料Blackwell处理器的设计缺陷导致产量下降,推迟生产,并称英伟达为此修改了GPU的某些结构设计,以提高生产可靠性。
尽管最新被曝出的过热技术问题可能进一步延迟GB200的交付,但从需求来看,英伟达的AI芯片仍处于供不应求。在AI芯片领域,全球近90%的市场仍被英伟达牢牢把控。
英伟达表示:“近来 客户正在抢占GB200系统的市场先机”。
据社交媒体上公司发布的最新消息,近来 GB200已经向客户交付。11月18日,戴尔宣布向Coreweave公司交付了全球首款GB200NVL72服务器机架,称“这将为AI基础设施树立新标杆”。
另据最新消息称,马斯克的人工智能xAI本周有望宣布新一轮融资,该融资据悉将用来购买10万块英伟达的GPU芯片。
鸿海集团上个月也宣布,该公司位于中国台湾最大的超级计算机基于英伟达的Blackwell架构构建,并采用GB200 NVL72平台,该平台共包含64个机架和4608个Tensor Core GPU。
近日,英伟达在日本技术峰会上表示,将与软银集团共同打造日本最大的AI数据中心。
英伟达将于本周公布最新季度财报,新一代AI芯片系统的交付情况也被市场高度关注。近来 英伟达市值接近3.5万亿美元,仍超过苹果公司位居美股市值榜首。今年以来,英伟达股价累计上涨近200%。
(本文来自第一财经)
发表评论