book_icon

A IA está acelerando a necessidade de resfriamento líquido em Data Centers

O uso intensivo de GPUs de alto desempenho para suportar aplicações de IA e ML gera calor excessivo, um desafio para implementações de racks nos Data Centers

A IA está acelerando a necessidade de resfriamento líquido em Data Centers

A Inteligência Artificial (IA) está revolucionando o fluxo de trabalho de muitas empresas. Permite mais inovação em quase todos os campos, processando e interpretando uma enorme quantidade de dados em tempo real, melhorando a tomada de decisões e a resolução de problemas e conduzindo a análises preditivas mais precisas para prever tendências e resultados. “Toda essa inovação computacional e baseada em aceleradores exige maior consumo de energia e apresenta desafios para o resfriamento de Data Centers”, disse Travis Vigil, vice-presidente sênior e líder do portfólio de Gerenciamento de Produtos do Infrastructure Solutions Group (ISG) da Dell, em um artigo no blog da empresa.

Segundo o executivo, nos últimos dez anos, inovações significativas no design da CPU aumentaram a contagem de núcleos e a frequência. Como resultado, o CPU Thermal Design Power (TDP) quase duplicou em apenas algumas gerações de processadores e espera-se que continue a aumentar ao longo do tempo. O surgimento de GPUs de uso geral de alto desempenho e que consomem muita energia para cargas de trabalho, como IA e aprendizado de máquina (ML), trabalha para capitalizar os recursos de processamento. “No entanto, o subproduto do calor está se tornando um desafio para implementações de racks em Data Centers. Semelhante às CPUs, o crescimento do consumo de energia das GPUs aumentou rapidamente. Por exemplo, enquanto a potência de uma GPU Nvidia A100 em 2021 era de 300 W, as GPUs Nvidia H100 mais recentes consomem até 700 W. Outras melhorias podem fazer com que o consumo de energia das GPUs ultrapasse 1.000 W nos próximos três anos”, afirmou.

À medida que as tendências atuais continuam o crescimento da potência da CPU e da GPU do processador para suportar as cargas de trabalho mais exigentes, o uso de refrigeração líquida também se expandirá para desempenhar um papel importante nos Data Centers

Para Vigil, os desafios de resfriamento apresentados por esses poderosos processadores estão sendo enfrentados por inovações que vão além do silício. Os componentes de refrigeração, como ventiladores e dissipadores de calor, estão se tornando mais eficientes a cada geração. “O gerenciamento inteligente do sistema da Dell Technologies, iDRAC, garante resfriamento adequado com uso mínimo de ventiladores, monitorando constantemente os sensores em todo o servidor e aprendendo com seu ambiente. Esses e outros recursos fazem parte da tecnologia Smart Cooling da Dell, garantindo que a fração de energia gasta do servidor em resfriamento possa diminuir mesmo com o aumento da demanda total de energia”, observou.

Para Vigil, um aspecto fundamental da tecnologia Smart Cooling da Dell é o Direct Liquid Cooling (DLC), onde um refrigerante líquido é bombeado para componentes quentes dentro de cada servidor. “A Dell está em sua terceira geração de plataformas de servidor DLC. Esta jornada começou com HPC em 2018, e agora oferecemos 12 plataformas habilitadas para DLC com nossos servidores de 16ª geração, pois o DLC não é mais apenas para HPC. Os clientes escolhem servidores habilitados para DLC para reduzir seus custos de resfriamento, economizar espaço e usar mais energia limitada do Data Center para computação em vez de resfriamento”, explicou.

Vantagens do resfriamento líquido

O resfriamento líquido é o método de extração térmica que utiliza refrigerante líquido para remover o calor de alguns ou de todos os componentes dentro de um servidor. Na solução da Dell, é usado o Direct Liquid Cooling, geralmente abreviado como DLC. Observando as soluções DLC3000 e DLC7000 da Dell, uma unidade de distribuição de refrigerante CDU circula o líquido em torno de um circuito de refrigeração para coletar e transportar o calor para longe do servidor. Em seguida, através do trocador de calor, a água resfriada da instalação transporta o calor para fora do Data Center. Os servidores PowerEdge usam placas frias com refrigeração líquida especialmente projetadas, que ficam em contato direto com as CPUs e GPUs dos servidores.

“Os clientes Dell agora podem se beneficiar de uma nova solução de rack DLC 3000 ou 7000 pré-integrada para servidores PowerEdge, que elimina a complexidade e o risco associados à seleção e instalação corretas de refrigeração líquida. A solução de rack DLC3000 é ideal para clientes que desejam implementar até cinco racks ou testar sua primeira solução DLC. Ele inclui um rack, um coletor de rack para distribuir refrigerante aos servidores e uma CDU no rack pronta para aceitar racks ou servidores modulares habilitados para Dell DLC montados de fábrica. O rack com solução de resfriamento DLC3000 integrada é construído, testado e entregue no Data Center do cliente, onde a equipe de serviços profissionais da Dell conecta o rack ao fornecimento de água gelada da instalação e garante operação total. Por fim, a manutenção e a cobertura de garantia do Dell ProSupport respaldam tudo no rack para tornar toda a experiência o mais simples possível”, explicou Vigil.

Os clientes podem monitorar e gerenciar a energia do servidor e os dados térmicos com o Dell OpenManage Enterprise Power Manager. O Power Manager coleta informações fornecidas pelos iDRACs de cada servidor e pode ser relatado como um servidor individual, um rack, uma linha ou todo o data center. As organizações podem utilizar esses dados para avaliar a eficiência energética do servidor e localizar anomalias térmicas, como pontos de acesso. O Power Manager também oferece recursos adicionais, incluindo limite de energia e cálculo de emissões de carbono. Ele também possui automação integrada para responder a vazamentos de DLC e eventos térmicos.

“À medida que as tendências atuais continuam o crescimento da potência da CPU e da GPU do processador para suportar as cargas de trabalho mais exigentes, o uso de refrigeração líquida também se expandirá para desempenhar um papel importante nos Data Centers. Embora o resfriamento direto por líquido ofereça muitos benefícios, ele tem seus desafios. A implementação do resfriamento líquido requer planejamento e instalação adicional. Ajudamos muitos clientes nesta jornada a reduzir a PUE de seus Data Centers. A PhonePe, por exemplo, viu uma queda na proporção de PUE de 1,6 para 1,3. A Dell Technologies pode oferecer suporte à sua estratégia de DLC, onde quer que você esteja durante sua jornada”, finalizou Vigil.

Serviço
www.dell.com

Últimas Notícias
Você também pode gostar
As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.