如果你出售大量硬件来支持人工智能工作负载,那么最好的方法就是让全球各国都相信人工智能是如此重要,以至于他们必须在自己的境内拥有大量人工智能。以防某些政治或经济危机导致人工智能技术无法通过遍布全球的云构建者获得。
将大量GPU送到超大规模和云计算构建者手中是扩展GenAI模型以展示其能力的最佳方式,同时也说明了GenAI对所有国家的战略重要性。
随着英伟达提高其“Hopper”和“Blackwell”GPU的产量,并找到了一种方法来增加其制造产量,以满足超大规模和云以及政府和企业的需求,主权人工智能云的整个概念已经开始流行起来。英伟达将是这一趋势的最大受益者。
上个月,英伟达首席执行官黄仁勋印度阐述了这种“主权人工智能”的观点,宣布与印度信实工业(Reliance Industries)、印孚瑟斯(Infosys)、Yotta Data Services、塔塔通信(Tata Communications)和Tech Mahindra等主要IT公司和云提供商建立合作关系,以促进印度在整个经济中对人工智能的使用。
黄仁勋当时说,“印度应该制造自己的人工智能是完全有道理的,你不应该输出数据来导入情报。”
这对这些国家来说是一件好事,让它们控制了一项新兴技术,这项技术可能在很多方面从根本上改变商业运作和社会运作的方式。主权人工智能也将是英伟达的一大胜利,因为它将在全球范围内传播自己的信息,更重要的是。英伟达预计,到今年年底,其在印度的GPU部署将增长近10倍。
本周,在这家GPU制造商在东京举行的人工智能峰会上,黄仁勋与软银董事长兼首席执行官孙正义坐下来讨论了软银和日本利用人工智能以及使用英伟达硬件和软件来实现这一目标的远大抱负。
据报道,日本官员希望通过宽松的监管方式使日本对人工智能友好,从而吸引人工智能公司来到日本。黄和其他英伟达高管赞扬了日本的创新历史,以及该国广泛的技术和人工智能技能。
英伟达电信高级副总裁Ronnie Vasishta在视频电话中告诉记者:“日本处于这一转型的最前沿,采用英伟达人工智能基础设施的日本云计算领导者将帮助日本转型其最重要的行业,并推进其主权人工智能的雄心。”
英伟达指出,它与许多日本公司在人工智能项目上有合作,但它与日本跨国公司软银(SoftBank)的合作占据了中心位置。软银将成为第一家使用英伟达的Blackwell平台建造其第一台超级计算机,也是该国最强大的超级计算机公司。
该公司将使用英伟达的DGXB200系统作为其英伟达DGX SuperPOD超级计算机的基础,该计算机将用于其自己的生成式人工智能雄心,其他企业以及日本的大学和研究机构也将能够访问。DGXB200系统于3月份首次推出,包括8个BlackwellGPU,这些GPU与供应商的第五代NVLink互连连接,每个GPU提供1.8TB/秒的双向吞吐量。
该平台还包括一个专用的RAS(可靠性、可用性和可服务性)引擎和一个用于更快数据库查询的解压缩引擎。根据英伟达的说法,该平台的人工智能模型训练性能是其前身的3倍,推理性能是其前身的15倍。
软银的超级计算机还将包括英伟达的人工智能企业软件和Quantum-2 InfiniBand网络,这将使大型语言模型(LLM)的开发更加容易,这些模型可以为讲日语的用户构建,与主权人工智能的推动保持一致。
软银还计划使用英伟达的Grace-Blackwell平台制造另一台基于英伟达的超级计算机,该平台包括其GB200NVL72液冷机架级系统,该系统同时使用BlackwellGPU和基于arm的GraceCPU。该系统将用于高度计算密集型的工作负载。
两家公司之间的另一个项目涉及软银和英伟达共同开发的AI-ran,这是一个同时运行人工智能和5G工作负载的电信网络。
英伟达的Vasishta说,“人工智能民主化需要建立一个全国性的人工智能基础设施。需要人工智能工厂来创造智能,建立和培训服务于日本工业的新模型。不过,还需要一个传输网络来分发智能,使人工智能推理尽可能接近端点。人工智能应用程序需要通过人工智能本地端点来消耗智能。”
该网络使用软件定义的5G无线电堆栈,其中包括基于英伟达Aerial加速平台的L1软件。两家公司在日本某地区对AI-ran网络进行了室外测试,测试了运营商级5G性能,并对网络的剩余容量进行了AI推理工作。软银估计,传统电信网络的设计初衷是处理高峰负荷,通常只使用了三分之一的容量。
软银表示,将整合到环境中的英伟达Aeria RAN计算机-1系统将比运行传统5G网络的基础设施节省40%的电力。孙正义在与黄仁勋表示:“有了我们紧密相连的这个智能网络,它将成为日本基础设施智能的一个大神经大脑。”
对于电信公司来说,它开辟了其他收入来源,因为能够在相同的网络上运行这些人工智能工作负载。英伟达和软银都估计,在新的AI-ran基础设施上每投资1美元,电信公司就能从AI推理收入中获得约5美元的回报。软银集团估计,每增加一台AI-RAN服务器,它将获得高达291%的回报。
英伟达还与GMO互联网集团、KDDI和樱花互联网等云计算公司建立了合作伙伴关系,以建立一个基于英伟达硬件和软件的全国性人工智能基础设施网络,推动日本机器人、医疗保健和药物研究等领域的人工智能创新。