book_icon

AWS Graviton5 está agora disponível, oferecendo desempenho específico para IA Agêntica

Usando o Graviton5, os aplicativos rodam 35% mais rápido, a inferência de ML é 35% mais rápida, e os bancos de Dados são 30% mais rápidos

AWS Graviton5 está agora disponível, oferecendo desempenho específico para IA Agêntica

As instâncias Amazon EC2 M9g e M9gd equipadas com AWS Graviton5 estão agora disponíveis para o público geral. Apresentado em prévia no re:Invent 2025, o Graviton5 é construído especificamente para as demandas da IA Agêntica — raciocínio em tempo real, geração de código e orquestração de tarefas em várias etapas — onde os processadores devem lidar com um grande número de ambientes simultâneos e manter os aceleradores em movimento.

Desde a prévia, a Meta se comprometeu a implantar dezenas de milhões de núcleos em seus esforços de IA Agêntica. Uber e Snowflake também estão implantando o Graviton para suas respectivas cargas de trabalho Agênticas. Com mais de 120.000 clientes já construindo com o Graviton, a disponibilidade geral do M9g e M9gd traz essas mesmas vantagens arquitetônicas — 192 núcleos por chip, cache 5x maior, DDR5-8800 (o DDR5 mais rápido na Nuvem) e suporte a PCIe Gen 6 — para qualquer cliente AWS por meio de caminhos padrão de adoção do EC2.

Chip Graviton5

25% mais desempenho
As instâncias M9g oferecem até 25% mais desempenho de computação do que a geração anterior, incluindo 35% mais velocidade em aplicativos da web, 35% mais velocidade em inferência de Machine Learning e 30% mais em bancos de Dados. As novas instâncias M9gd são construídas especificamente para cargas de trabalho que exigem armazenamento local de alta velocidade, oferecendo até 11,4 TB de armazenamento NVMe SSD e 30% mais IOPS (operações de entrada/saída por segundo) do que a geração anterior.

Ambos os tipos de instância são construídas na sexta geração do AWS Nitro System, a base de Segurança e desempenho usada pelas organizações mais preocupadas com a privacidade em todo o mundo, incluindo governos, saúde e serviços financeiros.

As instâncias EC2 M9g baseadas em Graviton5 permitem processar informações com mais eficiência, com a maior densidade de núcleos de CPU disponível no Amazon EC2 — 192 núcleos em um único pacote. Esse design eficiente reduz a distância que os dados precisam percorrer entre os núcleos, diminuindo a latência de comunicação inter-core em até 33% e aumentando a largura de banda. Cargas de trabalho exigentes, como jogos em tempo real, bancos de Dados de alto desempenho, análise de Big Data, servidores de aplicativos e Electronic Design Automation (EDA) podem ser dimensionadas com uma troca de dados mais rápida entre os núcleos de processamento.

Outra vantagem do Graviton5 é ser mais eficiente em termos de energia, ajudando a cumprir as metas de sustentabilidade das organizações sem comprometer a capacidade  

O Airbnb relata resultados significativos. “As instâncias Amazon EC2 baseadas em AWS Graviton5 são algumas das instâncias EC2 mais rápidas que já testamos”, disse Denis Sheahan, principal performance engineer do Airbnb. “Estamos vendo melhorias de até 25% em relação a outras arquiteturas de sistema da mesma geração, e até 20% em comparação com as instâncias Graviton4 da geração anterior.”

Atlassian já migrou mais de 3.000 instâncias para a geração anterior (Graviton4) e, em testes com o Graviton5, observou ganhos de até 30% em desempenho. Siemens Digital Industries Software, SAP e Synopsys também relataram melhorias substanciais em testes iniciais com o Graviton5, variando de 20% a 60% de ganho de desempenho em diferentes aplicações, desde ferramentas de design de semicondutores até consultas OLTP no SAP Hana Cloud. Outros clientes que já adotam o Graviton são Adobe, Epic Games, Fórmula 1 e Pinterest.

Outra vantagem do Graviton5 é ser mais eficiente em termos de energia, ajudando a cumprir as metas de sustentabilidade das organizações sem comprometer a capacidade. Essas inovações são possíveis devido à propriedade de ponta a ponta, desde o design do chip até a arquitetura do servidor. O Graviton5 adota a mais recente tecnologia de 3 nm, otimiza o design para casos de uso da AWS e permite otimizações no nível do sistema, como resfriamento bare-die.

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital