book_icon

Intel lança Xeon 6 e Gaudi 3 AI para Data Centers de IA de próxima geração

Com o lançamento do Xeon 6 com P-cores e aceleradores Gaudi 3 AI, a Intel está habilitando um ecossistema aberto que possibilita maior desempenho, eficiência e segurança

Intel lança Xeon 6 e Gaudi 3 AI para Data Centers de IA de próxima geração

À medida que a IA continua a revolucionar as indústrias, as empresas precisam cada vez mais de uma infraestrutura econômica e disponível para rápido desenvolvimento e implantação. Para atender a essa demanda, a Intel lançou o Xeon 6 com núcleos de desempenho (P-cores) e aceleradores Gaudi 3 AI, reforçando o compromisso da empresa em fornecer sistemas de IA poderosos com desempenho ideal por watt e menor custo total de propriedade (TCO).

“A demanda por IA está levando a uma transformação massiva no Data Center, e a indústria está pedindo opções de hardware, software e ferramentas de desenvolvedor”, disse Justin Hotard, vice-presidente executivo da Intel e gerente-geral do Data Center and Artificial Intelligence Group. “Com o lançamento do Xeon 6 com P-cores e aceleradores Gaudi 3 AI, a Intel está habilitando um ecossistema aberto que permite que nossos clientes implementem todas as suas cargas de trabalho com maior desempenho, eficiência e segurança”, completou.

Os últimos avanços da Intel em infraestrutura de IA incluem duas grandes atualizações em seu portfólio de Data Centers:

Intel Xeon 6 com núcleos P: projetado para lidar com cargas de trabalho com uso intensivo de computação com eficiência excepcional, o Xeon 6 oferece o dobro do desempenho de seu antecessor. Ele apresenta maior contagem de núcleos, o dobro da largura de banda da memória e recursos de aceleração de IA incorporados em cada núcleo. Este processador foi projetado para atender às demandas de desempenho da IA da Borda ao Data Center e ambientes de Nuvem.

Acelerador Intel Gaudi 3 AI: especificamente otimizado para IA generativa em larga escala, o Gaudi 3 possui 64 núcleos de processador Tensor (TPCs) e oito mecanismos de multiplicação de matrizes (MMEs) para acelerar cálculos de redes neurais profundas. Inclui 128 gigabytes (GB) de memória HBM2e para treinamento e inferência e 24 portas Ethernet de 200 Gigabit (Gb) para rede escalável. O Gaudi 3 também oferece compatibilidade perfeita com a estrutura PyTorch e modelos avançados de transformadores e difusores Hugging Face. A Intel anunciou recentemente uma colaboração com a IBM para implantar os aceleradores Intel Gaudi 3 AI como um serviço na IBM Cloud. Por meio dessa colaboração, a Intel e a IBM pretendem reduzir o custo total de propriedade para alavancar e dimensionar a IA, ao mesmo tempo em que aprimoram o desempenho.

Aprimorando os sistemas de IA com benefícios de TCO

A implementação da IA em escala envolve considerações como opções de implementação flexíveis, taxas competitivas de preço-desempenho e tecnologias de IA acessíveis. A robusta infraestrutura x86 da Intel e o extenso ecossistema aberto a posicionam para apoiar as empresas na construção de sistemas de IA de alto valor com um TCO e desempenho ideais por watt. Notavelmente, 73% dos servidores acelerados por GPU usam Intel Xeon como CPU host.

A Intel faz parceria com os principais OEMs, incluindo Dell Technologies e Supermicro, para desenvolver sistemas de engenharia conjunta adaptados às necessidades específicas dos clientes para implantações eficazes de IA. A Dell Technologies está atualmente co-projetando soluções baseadas em RAG que utilizam o Gaudi 3 e o Xeon 6.

Preenchendo a lacuna dos protótipos à produção

A transição de soluções de IA generativa (Gen AI) de protótipos para sistemas prontos para produção apresenta desafios em monitoramento em tempo real, tratamento de erros, registro, segurança e escalabilidade. A Intel enfrenta esses desafios por meio de esforços de coengenharia com OEMs e parceiros para fornecer soluções de geração aumentada por recuperação (RAG) prontas para produção.

Essas soluções, construídas na plataforma Open Platform Enterprise AI (OPEA), integram microsserviços baseados em OPEA em um sistema RAG escalável, otimizado para sistemas Xeon e Gaudi AI, projetado para permitir que os clientes integrem facilmente aplicativos do Kubernetes, Red Hat OpenShift AI e Red Hat Enterprise Linux AI.

Expandindo o acesso a aplicativos corporativos de IA

O portfólio Tiber da Intel oferece soluções de negócios para enfrentar desafios como acesso, custo, complexidade, segurança, eficiência e escalabilidade em ambientes de IA, Nuvem e Borda. O Intel Tiber Developer Cloud agora fornece sistemas de visualização do Intel Xeon 6 para avaliação e teste de tecnologia. Além disso, clientes selecionados terão acesso antecipado ao Intel Gaudi 3 para validar implantações de modelos de IA, com clusters Gaudi 3 começando a ser lançados no próximo trimestre para implementações de produção em larga escala.

Novas ofertas de serviços incluem o SeekrFlow, uma plataforma de IA de ponta a ponta da Seekr para o desenvolvimento de aplicativos de IA confiáveis. As atualizações mais recentes apresentam a versão mais recente do software Intel Gaudi e notebooks Jupyter carregados com PyTorch 2.4 e Intel oneAPI e ferramentas AI 2024.2, que incluem novos recursos de aceleração de IA e suporte para processadores Xeon 6.

 

Últimas Notícias
Você também pode gostar

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *


As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.