book_icon

IBM expande ofertas de aceleradores de IA em colaboração com a AMD

Iniciativa visa melhorar o desempenho e a eficiência de energia para modelos de IA generativa, como aplicativos de computação de alto desempenho para clientes corporativos

IBM expande ofertas de aceleradores de IA em colaboração com a AMD

A IBM E a AMD anunciaram uma colaboração para implementar os aceleradores AMD Instinct MI300X como um serviço na IBM Cloud. Esta oferta, que deve estar disponível no primeiro semestre de 2025, visa melhorar o desempenho e a eficiência de energia para modelos de IA generativa, como aplicativos de computação de alto desempenho (HPC) para clientes corporativos. Essa colaboração também permitirá o suporte aos aceleradores AMD Instinct MI300X na plataforma de dados e IA watsonx da IBM, bem como o suporte de inferência de IA do Red Hat Enterprise Linux.

Para cargas de trabalho de inferência de IA generativa, a IBM planeja habilitar o suporte para aceleradores AMD Instinct MI300X na plataforma de dados e IA watsonx

“À medida que as empresas continuam adotando modelos e conjuntos de dados de IA maiores, é fundamental que os aceleradores dentro do sistema possam processar cargas de trabalho com uso intensivo de computação com alto desempenho e flexibilidade para escalar”, disse Philip Guido, vice-presidente executivo e diretor comercial da AMD. “Os aceleradores AMD Instinct combinados com o software AMD ROCm oferecem amplo suporte, incluindo as plataformas IBM watsonx AI, Red Hat Enterprise Linux AI e Red Hat OpenShift AI para criar estruturas líderes usando essas poderosas ferramentas de ecossistema aberto. Nossa colaboração com a IBM Cloud terá como objetivo permitir que os clientes executem e dimensionem a inferência de IA generativa sem prejudicar o custo, o desempenho ou a eficiência”, afirmou.

“A AMD e a IBM Cloud compartilham a mesma visão de trazer IA para as empresas. Estamos comprometidos em trazer o poder da IA para clientes corporativos, ajudando-os a priorizar seus resultados e garantindo que eles tenham o poder de escolha quando se trata de suas implantações de IA”, disse Alan Peacock, gerente-geral da IBM Cloud. “Aproveitar os aceleradores da AMD no IBM Cloud dará aos nossos clientes corporativos outra opção de escala para atender às suas necessidades corporativas de IA, ao mesmo tempo em que visa ajudá-los a otimizar custos e desempenho”, comentou.

A IBM e a AMD estão colaborando para fornecer aceleradores MI300X como um serviço na IBM Cloud para oferecer suporte a clientes corporativos que aproveitam a IA. Para ajudar clientes corporativos em todos os setores, incluindo aqueles que são fortemente regulamentados, a IBM e a AMD pretendem aproveitar os recursos de segurança e conformidade do IBM Cloud.

Suporte para inferência de grande modelo: equipados com 192 GB de memória de alta largura de banda (HBM3), os aceleradores AMD Instinct MI300X oferecem suporte para a maior inferência e ajuste fino de modelos. A grande capacidade de memória também pode ajudar os clientes a executar modelos maiores com menos GPUs, reduzindo potencialmente os custos de inferência.

Desempenho e segurança aprimorados: oferecer aceleradores AMD Instinct MI300X como um serviço no IBM Cloud Virtual Servers for VPC, bem como por meio do suporte de contêiner com o IBM Cloud Kubernetes Service e o IBM Red Hat OpenShift no IBM Cloud, pode ajudar a otimizar o desempenho para empresas que executam aplicativos de IA.

Para cargas de trabalho de inferência de IA generativa, a IBM planeja habilitar o suporte para aceleradores AMD Instinct MI300X na plataforma de dados e IA watsonx da IBM, fornecendo aos clientes watsonx recursos adicionais de infraestrutura de IA para dimensionar suas cargas de trabalho de IA em ambientes de Nuvem híbrida. Além disso, as plataformas Red Hat Enterprise Linux AI e Red Hat OpenShift AI podem executar modelos de linguagem grande (LLMs) da família Granite com ferramentas de alinhamento usando o InstructLab em aceleradores MI300X.

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital