book_icon

Inovações em processadores IBM para acelerar a IA em mainframes IBM Z

As novas tecnologias são projetadas para escalar a capacidade de processamento nos mainframes IBM Z de última geração, ajudando a acelerar o uso de modelos de IA e GenAI

Inovações em processadores IBM para acelerar a IA em mainframes IBM Z

A IBM revelou detalhes da arquitetura do próximo processador IBM Telum II e acelerador IBM Spyre no Hot Chips 2024. As novas tecnologias são projetadas para escalar significativamente a capacidade de processamento nos sistemas de mainframe IBM Z de última geração, ajudando a acelerar o uso de modelos tradicionais de IA e os emergentes grandes modelos de linguagem (LLM) em conjunto, por meio de um novo método de combinação de IA.

Com muitos projetos de IA generativa alavancando grandes modelos de linguagem (LLMs) passando da prova de conceito para produção, as demandas por soluções escaláveis, seguras e com baixo consumo de energia surgiram como principais prioridades. Uma pesquisa do Morgan Stanley, publicada em agosto, projeta que as demandas de energia da IA generativa aumentarão 75% ao ano nos próximos anos, direcionando-a a consumir tanta energia em 2026 quanto a Espanha em 2022. Muitos clientes IBM indicam que as decisões de arquitetura para suportar os modelos de base com tamanho apropriado e às abordagens híbridas por design para cargas de trabalho de IA são cada vez mais importantes.

Espera-se que o Telum II e o acelerador IBM Spyre, fornecidos por meio de placas PCIe de interface padrão de alta velocidade, estejam disponíveis para clientes IBM Z e LinuxONE em 2025

As principais inovações apresentadas hoje incluem:

Processador IBM Telum II: projetado para alimentar sistemas IBM Z de última geração, o novo chip IBM apresenta maior frequência, capacidade de memória, um crescimento de 40% no armazenamento em cache e núcleo acelerador de IA integrado, bem como uma Unidade de Processamento de Dados (DPU) conectada de forma coerente em comparação com o chip Telum I. Espera-se que o novo processador ofereça suporte a soluções de computação corporativa para LLMs, atendendo às complexas necessidades de transações do setor.

Unidade de aceleração de E/S: uma Unidade de Processamento de Dados (DPU) completamente nova no chip do processador Telum II foi projetada para acelerar protocolos complexos de E/S para redes e armazenamento no mainframe. A DPU simplifica operações do sistema e pode melhorar o desempenho do componente principal.

Acelerador IBM Spyre: fornece capacidade adicional de computação de IA para complementar o processador Telum II. Trabalhando juntos, os chips Telum II e Spyre formam uma arquitetura escalável para suportar a combinação de métodos de modelagem de IA – a prática de combinar vários modelos de IA de deep learning e aprendizado de máquina com LLMs codificadores. Ao alavancar os pontos fortes de cada arquitetura modelo, a combinação de modelos pode fornecer resultados mais precisos e robustos em comparação com os modelos individuais. O chip do acelerador IBM Spyre será entregue como uma opção complementar. Cada chip do acelerador é conectado por meio de um adaptador PCIe de 75 watts e é baseado em tecnologia desenvolvida em colaboração com o IBM Research AI Hardware Center. Assim como outras placas PCIe, o acelerador Spyre é escalável para se ajustar às necessidades do cliente.

“Nosso roteiro robusto e multigeracional nos posiciona para permanecer à frente das tendências tecnológicas, incluindo as crescentes demandas de IA”, disse Tina Tarquinio, vice-presidente de Gerenciamento de Produtos IBM Z e LinuxONE. “O processador Telum II e o acelerador Spyre são construídos para entregar soluções de computação corporativa de alto desempenho, seguras e com maior eficiência de energia. Após anos de desenvolvimento, essas inovações serão introduzidas em nossa plataforma IBM Z de última geração para que os clientes possam alavancar LLMs e IA generativa em escala”, completou.

O processador Telum II e o acelerador IBM Spyre são fabricados pelo parceiro fabricação de longa data da IBM, Samsung Foundry, e construídos com base em seu nó de processamento de 5nm de alto desempenho e eficiência energética. Trabalhando em conjunto, eles oferecem suporte a uma variedade de casos de uso avançados orientados por IA, projetados para desbloquear valor de negócios e criar novas vantagens competitivas. Com os métodos combinados de IA, os clientes podem obter resultados mais rápidos e precisos em suas previsões. A energia de processamento combinada anunciada hoje irá disponibilizar uma rampa de acesso para a aplicação de casos de uso de IA generativa, como a detecção de fraudes na cobrança de seguros, a prevenção à lavagem de dinheiro e a implementação acelerada de assistentes de inteligência artificial.

Especificações e métricas de desempenho:

Processador Telum II: apresenta oito núcleos de alto desempenho em execução a 5,5 GHz, com 36 MB de cache L2 por núcleo e um aumento de 40% na capacidade de cache no chip para um total de 360 MB. O cache virtual de nível 4 de 2,88 GB por gaveta do processador proporciona um aumento de 40% em relação à geração anterior. O acelerador de IA integrado permite inferência de IA em transações de baixa latência e alto rendimento, por exemplo, melhorando a detecção de fraude durante transações financeiras, e fornece um aumento de quatro vezes na capacidade de computação por chip em relação à geração anterior.

A nova DPU da unidade de aceleração de E/S é integrada ao chip Telum II. Ela foi projetada para melhorar a manipulação de dados com uma densidade de E/S aumentada em 50%. Esse avanço aprimora a eficiência geral e a escalabilidade do IBM Z, tornando-o projetado para lidar com cargas de trabalho de IA em larga escala e aplicativos com uso intensivo de dados dos negócios atuais.

Acelerador Spyre: um acelerador de classificação corporativa construído especificamente para oferecer capacidade escalável para modelos complexos de IA e casos de uso de IA generativa. Ele conta com até 1 TB de memória criada para funcionar em conjunto em todas as oito placas de uma gaveta de E/S regular, que suporta cargas de trabalho de modelo de IA no mainframe, embora projetada para consumir no máximo 75 W por placa. Cada chip tem 32 núcleos de computação que suportam os tipos de dados int8, fp8 e fp16 para aplicações de IA de baixa latência e alto rendimento​.

Disponibilidade

O processador Telum II será o processador central que alimentará as plataformas IBM Z e IBM LinuxONE de última geração da IBM. Espera-se que o Telum II e o acelerador IBM Spyre, fornecidos por meio de placas PCIe de interface padrão de alta velocidade, estejam disponíveis para clientes IBM Z e LinuxONE em 2025.

 

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *


As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.