book_icon

Intel e Aible aceleram cargas de trabalho GenAI com processadores Xeon

A colaboração, que inclui otimizações de engenharia e um programa de benchmarking, aprimora a capacidade da Aible de fornecer resultados GenAI a um baixo custo para clientes

Intel e Aible aceleram cargas de trabalho GenAI com processadores Xeon

A Intel e a Aible, uma solução corporativa de IA generativa (GenAI) sem servidor de ponta a ponta e análise aumentada, agora oferecem soluções para clientes compartilhados para executar casos de uso avançados de GenAI e geração aumentada de recuperação (RAG) em várias gerações de CPUs Intel Xeon. A colaboração, que inclui otimizações de engenharia e um programa de benchmarking, aprimora a capacidade da Aible de fornecer resultados GenAI a um baixo custo para clientes corporativos e ajuda os desenvolvedores a incorporar inteligência de IA em aplicativos. Juntas, as empresas oferecem soluções de IA escaláveis e eficientes que se baseiam em hardware de alto desempenho para ajudar os clientes a resolver desafios com IA.

“Os clientes estão procurando soluções eficientes e de nível empresarial para aproveitar o poder da IA. Nossa colaboração com a Aible mostra como estamos trabalhando em estreita colaboração com a indústria para oferecer inovação em IA e reduzir a barreira de entrada para muitos clientes executarem as cargas de trabalho GenAI mais recentes usando processadores Intel Xeon”, disse Mishali Naik, engenheiro principal sênior de Data Center do AI Group da Intel.

As soluções da Aible demonstram como as CPUs podem melhorar significativamente o desempenho em uma variedade das cargas de trabalho de IA mais recentes, desde a execução de modelos de linguagem até o RAG. Otimizada para processadores Intel, a tecnologia da Aible utiliza uma abordagem eficiente de ponta a ponta sem servidor para IA, consumindo recursos apenas quando há solicitações ativas do usuário. Por exemplo, o banco de dados vetorial é ativado por apenas alguns segundos para recuperar informações relevantes para uma consulta do usuário, e o modelo de linguagem também é ativado brevemente para processar e responder à solicitação. Essa operação sob demanda ajuda a reduzir o custo total de propriedade (TCO).

Enquanto o RAG é frequentemente implementado usando GPUs (unidades de processamento gráfico) e aceleradores para alavancar seus recursos de processamento paralelo, a técnica sem servidor da Aible, combinada com processadores escaláveis Intel Xeon, permite que os casos de uso do RAG sejam alimentados inteiramente por CPUs. Os dados de desempenho mostram que várias gerações de processadores Intel Xeon podem executar cargas de trabalho RAG de forma eficiente.

A Aible permite que os clientes reduzam os custos operacionais dos projetos GenAI utilizando exclusivamente CPUs na forma sem servidor para compartilhar os mesmos recursos de computação subjacentes com mais segurança em vários clientes. Como comparação, os custos operacionais reduzidos podem ser comparados à compra de eletricidade quando ela é usada, em vez de alugar um gerador de eletricidade. Além disso, à medida que a demanda por IA generativa cresce, a necessidade de otimizar o desempenho e o consumo de energia torna-se mais crucial. Os serviços baseados em CPU da Aible oferecem aos clientes uma solução econômica e energeticamente eficiente.

De acordo com a análise de benchmark da Aible, os clientes podem obter uma economia de custos de até 55x ao executar modelos RAG em suas soluções sem servidor baseadas em CPU. Essa redução de custos é uma prova da eficácia da abordagem exclusiva de CPU da Aible, que evita a necessidade de infraestruturas baseadas em GPU mais caras com serviços compartilhados ou servidores dedicados.

A Intel – incluindo a Intel Labs – trabalhou com a Aible para otimizar as cargas de trabalho de IA nos processadores Xeon. Notavelmente, ao otimizar o código da Aible para AVX-512, a Aible viu ganhos significativos de desempenho e melhorou sua taxa de transferência nos processadores Xeon, destacando o impacto das otimizações estratégicas de software na eficiência geral.

A combinação de modelos RAG com processadores Intel Xeon, facilitada por plataformas como a Aible, pode permitir aplicações como:

– Processamento de linguagem natural (PNL)

– Sistemas de recomendação

– Sistemas de apoio à decisão

– Geração de conteúdo

A colaboração da Intel com a Aible começou com o lançamento dos processadores Xeon de 4ª geração. Desde então, as duas empresas otimizaram cargas de trabalho, código e bibliotecas de IA para processadores Xeon para aumentar o desempenho das ofertas de produtos da Aible.

 

Últimas Notícias
Você também pode gostar
As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.