book_icon

AMD revela roteiro de próximos lançamentos das GPUs AMD Instinct

O roteiro atualizado começa com o novo acelerador AMD Instinct MI325X, que estará disponível no 4º trimestre de 2024, seguido da série AMD Instinct MI350, disponível em 2025

AMD revela roteiro de próximos lançamentos das GPUs AMD Instinct

Em sua palestra de abertura na Computex 2024 (4 a 7/6 para o público), Lisa Su, presidente e CEO da AMD, revelou o roadmap dos aceleradores AMD Instinct expandido de vários anos, que trará uma cadência anual de desempenho de IA de liderança e recursos de memória em todas as gerações.

O roteiro atualizado começa com o novo acelerador AMD Instinct MI325X, que estará disponível no 4º trimestre de 2024. Depois disso, espera-se que a série AMD Instinct MI350, alimentada pela nova arquitetura AMD CDNA 4, esteja disponível em 2025, trazendo um aumento de até 35x no desempenho de inferência de IA em comparação com a série AMD Instinct MI300 com arquitetura AMD CDNA 3. Prevista para chegar em 2026, a série AMD Instinct MI400 é baseada na arquitetura AMD CDNA “Next”.

Espera-se que a arquitetura AMD CDNA “Next”, que alimentará os aceleradores AMD Instinct MI400 Series, esteja disponível em 2026, fornecendo os recursos e capacidades mais recentes que ajudarão a desbloquear desempenho e eficiência

“Os aceleradores AMD Instinct MI300X continuam sua forte adoção de vários parceiros e clientes, incluindo Microsoft Azure, Meta, Dell Technologies, HPE, Lenovo e outros, um resultado direto do desempenho excepcional e da proposta de valor do acelerador AMD Instinct MI300X”, disse Brad McCredie, vice-presidente corporativo de Computação Acelerada de Data Center da AMD. “Com nossa cadência anual atualizada de produtos, somos implacáveis em nosso ritmo de inovação, fornecendo os recursos de liderança e desempenho que a indústria de IA e nossos clientes esperam impulsionar a próxima evolução do treinamento e inferência de IA de Data Center”, completou.

A pilha de software aberto AMD ROCm 6 continua a amadurecer, permitindo que os aceleradores AMD Instinct MI300X gerem um desempenho impressionante para alguns dos LLMs mais populares. Em um servidor que usa oito aceleradores AMD Instinct MI300X e ROCm 6 executando o Meta Llama-3 70B, os clientes podem obter desempenho de inferência e geração de token 1,3 vezes melhor em comparação com a concorrência. Em um único acelerador AMD Instinct MI300X com ROCm 6, os clientes podem obter melhor desempenho de inferência e taxa de transferência de geração de token em comparação com a concorrência em 1,2x no Mistral-7B. A AMD também destacou que o Hugging Face, o maior e mais popular repositório de modelos de IA, agora está testando 700 mil de seus modelos mais populares todas as noites para garantir que eles funcionem fora da caixa nos aceleradores AMD Instinct MI300X. Além disso, a AMD continua seu trabalho upstream em estruturas de IA populares como PyTorch, TensorFlow e JAX.

Durante a palestra, a CEO da AMD revelou uma cadência anual atualizada para o roteiro do acelerador AMD Instinct para atender à crescente demanda por mais computação de IA. Isso ajudará a garantir que os aceleradores AMD Instinct impulsionem o desenvolvimento de modelos de IA de fronteira de próxima geração. O roteiro anual atualizado do AMD Instinct destacou:

– O novo acelerador AMD Instinct MI325X, que trará 288 GB de memória HBM3E e 6 terabytes por segundo de largura de banda de memória, usará o mesmo design de servidor Universal Baseboard padrão da indústria usado pela série AMD Instinct MI300 e estará disponível para o público geral no 4º trimestre de 2024. O acelerador terá capacidade de memória e largura de banda líderes do setor, 2x e 1,3x melhores do que a concorrência, respectivamente4e 1,3x melhor desempenho computacional do que competição.

– O primeiro produto da série AMD Instinct MI350, o acelerador AMD Instinct MI350X, é baseado na arquitetura AMD CDNA 4 e deve estar disponível em 2025. Ele usará o mesmo design de servidor Universal Baseboard padrão da indústria que outros aceleradores da série MI300 e será construído usando tecnologia de processo avançada de 3nm, suportará os tipos de dados FP4 e FP6 AI e terá até 288 GB de memória HBM3E.

– Espera-se que a arquitetura AMD CDNA “Next”, que alimentará os aceleradores AMD Instinct MI400 Series, esteja disponível em 2026, fornecendo os recursos e capacidades mais recentes que ajudarão a desbloquear desempenho e eficiência adicionais para inferência e treinamento de IA em larga escala.

Por fim, a AMD destacou que a demanda por aceleradores AMD Instinct MI300X continua a crescer com vários parceiros e clientes usando os aceleradores para alimentar suas exigentes cargas de trabalho de IA, incluindo:

– Microsoft Azure usando os aceleradores para serviços Azure OpenAI e as novas máquinas virtuais Azure ND MI300X V5.

– Tecnologias Dell usando aceleradores MI300X no PowerEdge XE9680 para cargas de trabalho de IA corporativa.

– A Supermicro fornece várias soluções com aceleradores AMD Instinct.
Lenovo impulsiona inovação de IA híbrida com o ThinkSystem SR685a V3

– A HPE está usando-os para acelerar as cargas de trabalho de IA no HPE Cray XD675.

 

Últimas Notícias
Você também pode gostar
As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.