book_icon

AMD revela novas GPUs da série Instinct MI350 para infraestrutura de IA aberta

A série MI350, que consiste em GPUs e plataformas Instinct MI350X e MI355X, oferece um aumento de computação de IA de 4x geração a geração e um salto de 35x na inferência

AMD revela novas GPUs da série Instinct MI350 para infraestrutura de IA aberta

A AMD apresentou na quinta-feira (12/6) sua visão abrangente de plataforma de IA integrada de ponta a ponta e sua infraestrutura de IA aberta e escalável de rack baseada nos padrões do setor em seu evento Advancing AI 2025. “A AMD está impulsionando a inovação de IA em um ritmo sem precedentes, com destaque para o lançamento de nossos aceleradores da série AMD Instinct MI350, avanços em nossas soluções em escala de rack AMD Helios de próxima geração e impulso crescente para nossa pilha de software aberto ROCm”, disse Lisa Su, presidente e CEO da AMD. “Estamos entrando na próxima fase da IA, impulsionada por padrões abertos, inovação compartilhada e liderança em expansão da AMD em um amplo ecossistema de parceiros de hardware e software que estão colaborando para definir o futuro da IA”, completou.

A AMD revelou no evento as novas GPUs da série Instinct MI350, estabelecendo uma nova referência para desempenho, eficiência e escalabilidade em IA generativa e computação de alto desempenho. A série MI350, que consiste em GPUs e plataformas Instinct MI350X e MI355X, oferece um aumento de computação de IA de 4x geração a geração e um salto de 35x na inferência, abrindo caminho para soluções de IA transformadoras em todos os setores. O MI355X também oferece ganhos significativos de preço-desempenho, gerando até 40% mais tokens por dólar em comparação com as soluções concorrentes.

Com o ROCm 7 e o AMD Developer Cloud, a AMD está reduzindo as barreiras e expandindo o acesso à computação de última geração. Colaborações estratégicas com líderes como Hugging Face, OpenAI e Grok estão provando o poder de soluções abertas e codesenvolvidas

A companhia ainda demonstrou uma infraestrutura de IA em escala de rack de padrões abertos de ponta a ponta, já implementada com aceleradores AMD Instinct MI350 Series, processadores AMD Epyc de 5ª geração e NICs AMD Pensando Pollara em implementações de hiperescaladores, como Oracle Cloud Infrastructure (OCI) e definidas para ampla disponibilidade no segundo semestre de 2025.

A AMD também apresentou seu rack de IA de próxima geração chamado Helios. Ele será construído nas GPUs AMD Instinct MI400 Series de próxima geração – que, em comparação com a geração anterior, devem oferecer até 10x mais desempenho executando inferência em modelos Mixture of ExpertsI, as CPUs AMD Epyc Venice baseadas em Zen 6 e as placas de rede AMD Pensando Vulcano.

A versão mais recente da pilha de software de IA de código aberto da AMD, ROCm 7, foi projetada para atender às crescentes demandas de IA generativa e cargas de trabalho de computação de alto desempenho, ao mesmo tempo em que melhora drasticamente a experiência do desenvolvedor em todos os aspectos. O ROCm 7 apresenta suporte aprimorado para estruturas padrão do setor, compatibilidade de hardware expandida e novas ferramentas de desenvolvimento, drivers, APIs e bibliotecas para acelerar o desenvolvimento e a implementação de IA.

Segundo informações, a série Instinct MI350 excedeu a meta de cinco anos da AMD de melhorar a eficiência energética do treinamento de IA e dos nós de computação de alto desempenho em 30 vezes, proporcionando uma melhoria de 38 vezes. A AMD também revelou uma nova meta para 2030 de oferecer um aumento de 20 vezes na eficiência energética em escala de rack em relação ao ano base de 2024.

A AMD também anunciou a ampla disponibilidade do AMD Developer Cloud para as comunidades globais de desenvolvedores e de código aberto. Construído especificamente para desenvolvimento rápido e de alto desempenho de IA, os usuários terão acesso a um ambiente de Nuvem totalmente gerenciado com as ferramentas e flexibilidade para começar a trabalhar com projetos de IA – e crescer sem limites. Com o ROCm 7 e o AMD Developer Cloud, a AMD está reduzindo as barreiras e expandindo o acesso à computação de última geração. Colaborações estratégicas com líderes como Hugging Face, OpenAI e Grok estão provando o poder de soluções abertas e codesenvolvidas.

Amplo ecossistema de parceiros mostra o progresso da IA com tecnologia AMD

Hoje, 7 dos 10 maiores construtores de modelos e empresas de IA estão executando cargas de trabalho de produção em aceleradores Instinct. Entre essas empresas estão Meta, OpenAI, Microsoft e xAI, que se juntaram à AMD e outros parceiros da Advancing AI, para discutir como estão trabalhando com a AMD para soluções de IA para treinar os principais modelos de IA da atualidade, alimentar a inferência em escala e acelerar a exploração e o desenvolvimento da IA.

– A Meta detalhou como o Instinct MI300X é amplamente implantado para inferência Llama 3 e Llama 4. A Meta compartilhou entusiasmo pelo MI350 e seu poder de computação, desempenho por TCO e memória de última geração. A Meta continua a colaborar estreitamente com a AMD em roteiros de IA, incluindo planos para a plataforma Instinct MI400 Series.

– O CEO da OpenAI, Sam Altman, discutiu a importância de hardware, software e algoritmos otimizados de forma holística e a estreita parceria da OpenAI com a AMD na infraestrutura de IA, com pesquisa e modelos GPT no Azure em produção no MI300X, bem como compromissos profundos de design nas plataformas da série MI400.

– A Oracle Cloud Infrastructure (OCI) está entre os primeiros líderes do setor a adotar a infraestrutura de IA em escala de rack aberta da AMD com GPUs AMD Instinct MI355X. A OCI aproveita as CPUs e GPUs da AMD para oferecer desempenho equilibrado e escalável para clusters de IA e anunciou que oferecerá clusters de IA zettascale acelerados pelos mais recentes processadores AMD Instinct com até 131.072 GPUs MI355X para permitir que os clientes criem, treinem e inferam IA em escala.

– A Humain discutiu seu acordo histórico com a AMD para construir uma infraestrutura de IA aberta, escalável, resiliente e econômica, aproveitando todo o espectro de plataformas de computação que somente a AMD pode fornecer.

– A Microsoft anunciou que o Instinct MI300X agora está alimentando modelos proprietários e de código aberto em produção no Azure.

– A Cohere compartilhou que seus modelos de comando escaláveis e de alto desempenho são implantados no Instinct MI300X, potencializando a inferência LLM de nível empresarial com alto rendimento, eficiência e privacidade de dados.

– A Red Hat descreveu como sua colaboração expandida com a AMD permite ambientes de IA prontos para produção, com GPUs AMD Instinct no Red Hat OpenShift AI oferecendo processamento de IA poderoso e eficiente em ambientes de nuvem híbrida.

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital