许多企业在推出人工智能项目时关注的是计算能力和网络。但他们可能忽略了他们对海量存储需求的更大图景。
随着企业开始部署和使用人工智能,许多人意识到他们需要获得巨大的计算能力和快速的网络功能,但存储需求可能被忽视了。
一些人工智能和存储专家表示,启动聊天机器人或采用人工智能助手不太可能对大多数企业的存储容量造成负担,但可以访问数百万个数据点的大型人工智能项目可能需要数tb的新存储空间,可能会花费数千万美元。
Duos Technologies公司首席技术官Jeffrey Necciai表示,目前有几种存储选择,对于某些人工智能功能来说,云存储或传统硬盘可能就足够了。该公司利用人工智能与成像技术来检查行驶中的火车。
但Necciai和其他专家表示,对于需要提供即时响应或信息的人工智能系统,距离人工智能工作负载位置数百英里的硬盘和云存储可能太慢了。
Necciai说,例如,Duos Technologies公司在扫描铁路车辆后60秒内提供通知。在这种情况下,该公司需要与人工智能计算单元一起工作的超高速存储。
不仅仅是硬盘的大小
Necciai说,考虑大型人工智能项目的企业需要考虑他们需要的存储量以及他们的存储同时处理多个任务的能力。
他补充说:“我们需要为多个线程同时快速地写入存储,我们需要为多个线程快速地从故事存储中读取。”“对我们来说非常重要的是,能够同时对存储进行操作。”
去年,Duos Technologies公司扫描了850万辆火车车厢,每次扫描可能产生1050多张图像。Duos轨道车检查门户使用四个高性能存储阵列,每个存储阵列包含16个NVMe驱动器,总容量约为500TB。
该公司还使用了大约25TB的传统存储空间,用于内部培训和开发人工智能,减少了对即时结果的需求。Necciai说:“我们希望利用所有这些资源来做我们需要做的事情。归根结底,就是用正确的工具做正确的工作。”
海量数据需求
与Duos Technologies公司一样,其他一些运行大型人工智能项目的企业正在转向大容量SSD或NAND闪存来满足其存储需求。
高速内存比硬盘贵得多,每千兆字节的成本高达1,000美元,但它们还有其他优势。企业固态硬盘制造商Solidigm公司的领导力营销高级总监Roger Corell举例说,固态硬盘的能效几乎是服务器和硬盘机架的三倍,占用的空间也更小。
他说,随着企业采用更复杂、多模式的人工智能项目,以及越来越多的员工开始使用人工智能工具,对高容量、多线程存储选项的需求只会增加。
科雷尔补充道:“人工智能在需要存储的数据量以及需要以多快的速度访问这些海量数据集方面是如此强大。
此外,人工智能和机器学习项目的对象存储公司MinIO公司首席技术官Ugur Tigli表示,除了SSD或NAND选项外,一些公司正在使用私有云或托管设施来满足他们的存储需求。
他说,采用人工智能的MinIO客户通常会将存储容量增加4到10倍,他鼓励大规模人工智能用户在公共云之外寻找存储需求,因为使用私有云或托管服务的成本可能比公共云低60%。
他说:“在数百P字节或1E字节或2E字节的规模上,在公共云中行不通。根据容量、分层和数据访问配置,每年的总成本将在数千万到数亿美元之间。”
Tigli补充说,与公共云不同,企业用户可以私下构建并“突发”到云上,以获得额外的GPU使用。他说:“这里的关键是,计算是弹性的,但数据有引力,并且以可预测的(尽管是加速的)速度增长,因此需要相应地构建计算。”
存储作为平台
数字转型服务商AHEAD公司的领域首席技术官Priyanka Karan补充说,另一个选择涉及PB规模存储平台。她表示,“PB规模存储平台旨在减少数据移动的挑战,即将数据从最初降落的地方带到可以用于人工智能训练的地方。我们的目标不是建立一个新的仓库。”
她说,一些可用的存储平台建立在NAND闪存上,这提供了高吞吐量和低延迟,对于将数据馈送到GPU和TPU至关重要。
一些人工智能用户和专家表示,现在有几种选择,所需的存储数量和类型取决于组织正在部署的人工智能项目。
Karan表示,脱机批处理比实时工作负载的内存需求更低。她补充说,在某些情况下,二级存储选项可用于保存训练和运行人工智能模型所需的大量数据。
选择正确的存储选项还取决于经常提到的数据重力(也就是数据集的大小),是否可以将其移动到云中进行处理,或者对数据进行处理是否有意义。在一些人工智能项目中,数据存储与人工智能计算一起位于数据中心、另一个公共云或数据创建的边缘。
企业还有许多其他因素需要考虑,包括安全性、法规或遵从性挑战。对于云存储,Karan说。“网络、距离和延迟都是考虑因素,但他们必须考虑额外的成本变量。”
此外,除了存储本身的成本之外,可能还有数据传输费用、访问费用和非本地存储的管理费。另一方面,本地存储选项可能涉及巨大的前期投资,以及维护、电力和冷却以及员工工资。
Karan说:“组织必须评估他们的特定需求,包括性能、成本和可扩展性,为他们的人工智能计划选择最佳解决方案。”