book_icon

Soluções da AMD processam cargas de trabalho no Microsoft Azure

Aceleradores AMD Instinct MI300X, software aberto ROCm, processadores e software Ryzen AI e aceleradores de mídia Alveo MA35D dão poder à Nuvem da Microsoft

Soluções da AMD processam cargas de trabalho no Microsoft Azure

Esta semana, no evento Microsoft Build, a AMD apresentou seus mais recentes recursos de computação e software para clientes e desenvolvedores da Microsoft. Usando soluções AMD, como aceleradores AMD Instinct MI300X, software aberto ROCm, processadores e software Ryzen AI e aceleradores de mídia Alveo MA35D, a Microsoft é capaz de fornecer um poderoso conjunto de ferramentas para implementações baseadas em IA em vários mercados. As novas máquinas virtuais (VMs) do Microsoft Azure ND MI300X agora estão disponíveis para o público em geral, oferecendo a clientes como o Hugging Face acesso a desempenho e eficiência para suas cargas de trabalho de IA mais exigentes.

“A pilha de software AMD Instinct MI300X e ROCm está alimentando os serviços Azure OpenAI Chat GPT 3.5 e 4, que são algumas das cargas de trabalho de IA mais exigentes do mundo”, disse Victor Peng, presidente da AMD. “Com a disponibilidade geral das novas VMs do Azure, os clientes de IA têm acesso mais amplo ao MI300X para fornecer soluções eficientes e de alto desempenho para aplicativos de IA”, completou.

O Alveo MA35D possui unidades de processamento de vídeo baseadas em ASIC que suportam o padrão de compressão AV1 e otimizações de qualidade de vídeo habilitadas para IA que ajudam a garantir experiências de vídeo suaves e perfeitas

“A Microsoft e a AMD têm uma rica história de parceria em várias plataformas de computação: primeiro o PC, depois o silício personalizado para Xbox, HPC e agora IA”, disse Kevin Scott, diretor de Tecnologia e vice-presidente executivo de IA da Microsoft. No passado mais recente, reconhecemos a importância de acoplar hardware de computação poderoso com a otimização de sistema e software necessária para oferecer desempenho e valor de IA incríveis. Juntamente com a AMD, fizemos isso por meio do uso de ROCm e MI300X, capacitando clientes e desenvolvedores de IA da Microsoft a alcançar excelentes resultados de preço-desempenho para os modelos de fronteira mais avançados e intensos de computação. Estamos comprometidos com nossa colaboração com a AMD para continuar impulsionando o progresso da IA”, comentou.

Avançando a IA na Microsoft

Anunciada anteriormente em novembro de 2023, a série de VMs do Azure ND MI300x v5 agora está disponível na região do Canadá Central para que os clientes executem suas cargas de trabalho de IA. Oferecendo desempenho líder do setor, essas VMs fornecem impressionante capacidade HBM e largura de banda de memória, permitindo que os clientes ajustem modelos maiores na memória GPU e/ou usem menos GPUs, ajudando a economizar energia, custo e tempo de solução.

Essas VMs e o software ROCm que as alimenta também estão sendo usadas para cargas de trabalho de Produção de IA do Azure, incluindo o Serviço Azure OpenAI, fornecendo aos clientes acesso aos modelos GPT-3.5 e GPT-4. Com o AMD Instinct MI300X e a pilha de software aberto ROCm comprovada e pronta, a Microsoft é capaz de alcançar preço/desempenho líderes em cargas de trabalho de inferência GPT.

Além das cargas de trabalho de produção de IA do Azure, um dos primeiros clientes a usar essas VMs é o Hugging Face. Portando seus modelos para as VMs ND MI300X em apenas um mês, a Hugging Face foi capaz de alcançar um desempenho impressionante e preço/desempenho para seus modelos. Como parte disso, os clientes de VM ND MI300X podem trazer modelos Hugging Face para as VMs para criar e implantar aplicativos NLP com facilidade e eficiência.

“A profunda colaboração entre Microsoft, AMD e Hugging Face no ecossistema de software aberto ROCm permitirá que os usuários do Hugging Face executem centenas de milhares de modelos de IA disponíveis no Hugging Face Hub no Azure com GPUs AMD Instinct sem alterações de código, tornando mais fácil para os clientes do Azure criar IA com modelos abertos e código aberto”, disse Julien Simon, diretor evangelista da Hugging Face.

Além disso, os desenvolvedores podem usar o software AMD Ryzen AI para otimizar e implementar a inferência de IA em PCs com AMD Ryzen AI. O software Ryzen AI permite que os aplicativos sejam executados na unidade de processamento neural (NPU) construída na arquitetura AMD XDNA, o primeiro silício de processamento de IA dedicado em um processador Windows x86. Enquanto a execução de modelos de IA em uma CPU ou GPU sozinha pode drenar a bateria rapidamente, com um notebook alimentado por IA Ryzen, os modelos de IA operam na NPU incorporada, liberando recursos de CPU e GPU para outras tarefas de computação. Isso ajuda a aumentar significativamente a vida útil da bateria e permite que os desenvolvedores executem cargas de trabalho de IA LLM no dispositivo e aplicativos simultâneos de forma eficiente e local.

Avançando os serviços de vídeo e a computação corporativa

A Microsoft selecionou o acelerador de mídia AMD Alveo MA35D para alimentar suas vastas cargas de trabalho de streaming de vídeo ao vivo, incluindo Microsoft Teams, vídeo do SharePoint e outros. Desenvolvido especificamente para alimentar serviços de streaming interativo ao vivo em escala, o Alveo MA35D ajudará a Microsoft a garantir uma experiência de vídeo de alta qualidade, simplificando as cargas de trabalho de processamento de vídeo, incluindo transcodificação de vídeo, decodificação, codificação e streaming de taxa de bits adaptável (ABR). Usando o acelerador Alveo MA35D em servidores alimentados por processadores AMD Epyc de 4ª geração, a Microsoft está recebendo:

Capacidade de consolidar servidores e infraestrutura de Nuvem: aproveitando a alta densidade de canais, eficiência energética e recursos de processamento de vídeo de latência ultrabaixa do Alveo MA35D, a Microsoft pode reduzir significativamente o número de servidores necessários para suportar seus aplicativos de streaming interativo ao vivo de alto volume.

Desempenho impressionante: o Alveo MA35D possui unidades de processamento de vídeo baseadas em ASIC que suportam o padrão de compressão AV1 e otimizações de qualidade de vídeo habilitadas para IA que ajudam a garantir experiências de vídeo suaves e perfeitas.

Tecnologia AV1 pronta para o futuro: com um caminho de atualização para suportar padrões emergentes como o AV1, o Alveo MA35D fornece à Microsoft uma solução que pode se adaptar aos requisitos de processamento de vídeo em evolução.

Atualmente, os processadores AMD Epyc de 4ª geração alimentam várias VMs de uso geral, com uso intensivo de memória, otimizadas para computação e aceleradas no Azure. Essas VMs mostram o crescimento e a demanda por processadores AMD Epyc na Nuvem e podem fornecer até 20% melhor desempenho para VMs de uso geral e com uso intensivo de memória com melhor preço/desempenho e até 2x o desempenho da CPU para VMs otimizadas para computação em comparação com a geração anterior de VMs com processador AMD Epyc no Azure. Agora em pré-visualização, as séries VM Dalsv6, Dasv6, Easv6, Falsv6 e Famsv6 estarão disponíveis nos próximos meses.

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.