Nova geração de chips próprios da AWS foca em eficiência energética

Amazon Web Services (AWS) anunciou durante o evento AWS re:Invent (27/11 a 1/12 em Las Vegas, EUA) a nova geração de duas famílias de chips próprios – AWS Graviton4 e AWS Trainium2 –, trazendo melhorias em preço e eficiência energética para uma ampla gama de cargas de trabalho de clientes, incluindo treinamento em Machine Learning (ML) e aplicações de Inteligência Artificial (IA) generativa. O Graviton4 e o Trainium2 marcam as mais recentes inovações em desenvolvimento de chips da AWS. A cada nova geração de chips, a AWS entrega melhor desempenho de preço e eficiência energética, dando aos consumidores ainda mais opções – além das combinações de chip/instâncias que utilizam os mais recentes chips de terceiros, como AMD, Intel e Nvidia – para rodar virtualmente qualquer aplicação ou workload no Amazon Elastic Compute Cloud (Amazon EC2).

Segundo informações, o Graviton4 oferece até 30% mais desempenho computacional, 50% mais cores e 75% mais largura de banda de memória do que a atual geração de processadores Graviton3, entregando melhor desempenho de preço e eficiência energética para uma ampla gama de cargas de trabalho rodando no Amazon EC2.

Conforme os clientes trazem mais bancos de dados in-memory e cargas de trabalho de análise de dados para a Nuvem, suas demandas computacionais, de memória, armazenamento e de redes aumentam

O Trainium2 foi desenvolvido para entregar treinamentos até 4x mais rápidos do que a primeira geração de chips Trainium e poderá ser instalado em UltraClusters EC2 de até 100 mil chips, viabilizando o treinamento de modelos fundacionais (FMs) e LLM (Large Language Model) em uma fração de tempo, e melhorando a eficiência energética em até 2x.

“O silício sustenta todas as cargas de trabalho dos clientes, fazendo dele um elemento crítico de inovação para a AWS”, afirmou David Brown, vice-presidente de Computação e Redes da AWS. “Ao focar o design de nossos chips em workloads reais, que de fato interessam aos clientes, conseguimos entregar a mais avançada infraestrutura de Nuvem para eles. O Graviton4 é a quarta geração que lançamos em cinco anos, e é o chip mais poderoso e de melhor eficiência energética que já desenvolvemos para uma ampla gama de cargas de trabalho. E diante do crescente interesse em IA generativa, o Trainium2 ajudará os clientes a treinarem seus modelos de ML mais rapidamente, a custos reduzidos e com melhor eficiência energética”, afirmou.

Atendendo cargas de trabalho

Hoje, a AWS oferece globalmente mais de 150 tipos de instâncias Amazon EC2 rodando Graviton, construiu mais de 2 milhões de processadores Graviton e possui mais de 50 mil clientes – incluindo os 100 maiores clientes de ECS – utilizando instâncias baseadas no Graviton para obter melhor eficiência de preço em suas aplicações. Clientes como Datadog, DirecTV, Discovery, Formula 1 (F1), Nielsen, Pinterest, SAP, Snowflake, Sprinklr e Zendesk usam instâncias baseadas no Graviton para rodar cargas de trabalho como bancos de dados, Analytics, servidores Web, processamento batch, veiculação de anúncios, servidores de aplicações e microsserviços.

Conforme os clientes trazem mais bancos de dados in-memory e cargas de trabalho de análise de dados para a Nuvem, suas demandas computacionais, de memória, armazenamento e de redes aumentam. Como resultado, eles precisam de mais desempenho e instâncias ainda maiores para rodar essas cargas de trabalho demandantes. Ao mesmo tempo, precisam gerenciar custos. Além disso, para reduzir seu impacto ambiental, os clientes buscam opções de computação com mais eficiência energética para suas cargas de trabalho. O Graviton é suportado por muitos serviços gerenciados da AWS, incluindo Amazon Aurora, Amazon ElastiCache, Amazon EMR, Amazon MemoryDB, Amazon OpenSearch, Amazon Relational Database Service (Amazon RDS), AWS Fargate e AWS Lambda. Significa que os usuários desses serviços poderão tirar proveito dos benefícios de desempenho de preço do Graviton.

Os chips Trainium2 foram desenvolvidos para treinamentos de alto desempenho de FMs e LLMs com trilhões de parâmetros. O Trainium2 estará disponível nas instâncias Trn2 do Amazon EC2 com 16 chips em uma única instância. As instâncias Trn2 devem permitir que os clientes escalem a até 100 mil chips Trainium2 na próxima geração de UltraClusters EC2, interconectados com AWS Elastic Fabric Adapter (EFA) em redes de escala petabyte capazes de entregar até 65 exaflops de capacidade computacional, dando aos clientes acesso sob demanda a desempenho de nível de supercomputadores. Com essa escalabilidade, os clientes podem treinar um LLM com 300 bilhões de parâmetros em semanas ao invés de meses. Ao entregar a mais alta capacidade de escala para desempenho de treinamento de ML a custos significativamente menores, as instâncias Trn2 ajudam os clientes a destravarem e acelerarem a próxima onda de avanços em IA generativa.

Serviço
aws.amazon.com

AMD AWS AWS Graviton4 AWS re:Invent AWS Trainium2 chip EC2 Intel NVIDIA

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.

Nova geração de chips próprios da AWS foca em eficiência energética

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

Realidade Aumentada deve expandir setor de telecom no Brasil

IA é usada também para tornar golpes pela internet ainda mais convincentes

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

Realidade Aumentada deve expandir setor de telecom no Brasil

Realidade Aumentada deve expandir setor de telecom no Brasil

IA é usada também para tornar golpes pela internet ainda mais convincentes

IA é usada também para tornar golpes pela internet ainda mais convincentes

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

MediaTek lança chip que promete facilitar o acesso a celulares 5G

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

MediaTek lança chip que promete facilitar o acesso a celulares 5G

MediaTek lança chip que promete facilitar o acesso a celulares 5G

Agenda & Eventos

Compartilhar:

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

Realidade Aumentada deve expandir setor de telecom no Brasil

IA é usada também para tornar golpes pela internet ainda mais convincentes

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

O paradoxo da senha e o equilíbrio entre a conveniência e segurança na era digital

Realidade Aumentada deve expandir setor de telecom no Brasil

Realidade Aumentada deve expandir setor de telecom no Brasil

IA é usada também para tornar golpes pela internet ainda mais convincentes

IA é usada também para tornar golpes pela internet ainda mais convincentes

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

MediaTek lança chip que promete facilitar o acesso a celulares 5G

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

NEC e Rakuten Mobile iniciam produção de equipamento de rádio OpenRAN 5G

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

Salesforce anuncia a disponibilidade beta do Einstein Copilot for Tableau

MediaTek lança chip que promete facilitar o acesso a celulares 5G

MediaTek lança chip que promete facilitar o acesso a celulares 5G

Agenda & Eventos

Informe seu e-mail para receber os destaques da semana.