首页
搜索
历史搜索
搜索发现

数据中心中的人工智能:挑战与解决方案

2024-07-26 10:23:30| 来源:千家网| | 0

数据中心中的人工智能:挑战与解决方案

  近年来,对人工智能应用的需求呈指数级增长,因此数据中心的设计、配置和管理必须采用新方法。《华尔街日报》估计,目前全球数据中心容量的约 20% 用于人工智能。然而,由于超过 77% 的公司已经在使用或探索人工智能技术,传统数据中心可能很快就会过时。

  人工智能僵局

  由于算法和模型复杂,人工智能应用通常比其他应用需要更多的电力和计算资源。例如,据说 ChatGPT 上的一个简单查询所需的电力几乎是谷歌快速搜索所需电力的十倍。传统数据中心的平均密度为每机架 5-10kW,但处理人工智能应用时,每机架的密度会增加到 60kW+。

  更多的工作量和能源需求意味着更高的间接成本。此外,数据中心必须想出替代和先进的方法来处理由于人员短缺而可能出现的冷却问题、漏洞、安全挑战和维护问题。

  然后,还有环境可持续性的问题。研究人员估计,GPT-3 在 2020 年向公众发布之前就产生了超过 552 吨的二氧化碳。这一数字相当于一百二十三辆汽油汽车全年产生的二氧化碳。

  不幸的是,除非这些挑战得到战略性和动态的解决,否则我们可能会看到类似于GPU供应短缺的基础设施紧张局面。缺乏设备齐全的数据中心来处理人工智能技术的压倒性需求,最终可能会减缓增长,促进人工智能基础设施的垄断,并对环境产生严重影响。

  为现在和未来而建

  为了正面解决这些问题,许多公司已经在实施新措施。这些措施包括使用共置数据中心来降低运营成本、提高可扩展性并确保有熟练的现场维护人员。与传统的空气冷却系统相比,数据中心还采用了更先进的冷却技术,如液体冷却、直接到芯片冷却和沉浸式冷却。

  对于新中心,设计至关重要。例如,2022 年,Meta 暂停了其在德克萨斯州耗资 8 亿美元的数据中心的建设,以考虑重新设计这个占地 90 万平方英尺的设施。

  然而,数据中心除了充当人工智能支持的应用程序和产品的基础设施和计算中心之外,还可以利用相同的人工智能来优化性能、管理成本,并通过多种方式确保运营效率。让我们来看看其中的一些。

  工作负载管理

  人工智能和自动化工具可以更准确地预测和更有效地分配数据中心的工作负载,确保部署符合资源需求。这通过最大限度地减少计算硬件的利用率不足和降低能耗来减少浪费。超过 32% 的云支出被浪费,主要是由于过度配置。然而,人工智能系统可以将资源重新分配给最需要它们的项目,从而优化性能并最大限度地利用闲置硬件。

  重复性和常规性任务可以方便地实现自动化,从而节省时间、能源和熟练的人力。人工智能还可以处理数据和性能指标,从而采取战略性、主动性的措施,在潜在的工作负载管理问题发生之前解决它们。

  人工智能驱动的冷却系统

  除了引入更好的冷却设施外,人工智能还可以在动态检测和调节温度方面发挥重要作用。人工智能可以分析温度数据并采取行动,为每个硬件提供所需的冷却量,而不是静态冷却数据中心的硬件。这可以调节湿度条件以获得最佳性能,提高电源效率,并延长设备的使用寿命。

  动态电源使用效率

  人工智能系统的实时监控和预测分析可以提供有关电源使用模式和低效率的关键见解,使管理人员能够做出数据支持的决策并实施必要的电源管理策略。虽然客观事实仍然是运行人工智能工作负载的数据中心的电力需求始终高于传统数据中心,但人工智能驱动的管理和数据中心设计的协同努力可以产生重大影响。

  数据中心还可以通过优先考虑高效的能源管理系统和采用动态电压和频率调整 (DVFS) 等电源管理技术来最大限度地减少碳足迹并减少对环境的影响。

  四舍五入

  高度复杂的数字未来的代价在于基础设施的核心。数据中心必须采用物理、运营和软件变革,以跟上不断发展的现代世界及其人工智能需求。

  值得庆幸的是,人工智能挑战也可以通过人工智能解决方案来解决。随着科技行业逐渐适应和技术进步,人工智能驱动的工作负载管理和优化将成为主流,从而带来强大的数据中心来为未来提供动力。来自分散式计算基础设施等其他替代方案的创新也将创造良性竞争并提高效率。

  作者:InFlux Technologies 首席执行官 Daniel Keller

  来源:千家网

联系销售
销售王经理微信 销售王经理
微信公众号 微信公众号
服务热线
400-6688-400