book_icon

Red Hat AI Enterprise acelera a implementação e o gerenciamento da IA

Solução preenche a lacuna entre a infraestrutura de IA e os agentes prontos para produção, unificando o ciclo de vida da IA ​​com a base do Red Hat Enterprise Linux e do Red Hat OpenShift

Red Hat AI Enterprise acelera a implementação e o gerenciamento da IA

A Red Hat, empresa global de soluções de código aberto, apresentou o Red Hat AI Enterprise, uma plataforma integrada de IA para implementação e gerenciamento de modelos, agentes e aplicativos de IA em Nuvem híbrida. A plataforma se junta ao portfólio de IA da Red Hat, que inclui o Red Hat AI Inference Server, o Red Hat OpenShift AI e o Red Hat Enterprise Linux AI. A Red Hat também está lançando o Red Hat AI 3.3, que traz atualizações e melhorias significativas para todo o portfólio de IA da empresa. Juntas, essas soluções fornecem uma pilha abrangente “do hardware ao agente”, integrando a infraestrutura subjacente do Linux e do Kubernetes com recursos avançados de inferência e agentes para ajudar as organizações a migrarem de experimentação fragmentada para operações governadas e autônomas.

“O Red Hat AI Enterprise foi projetado para preencher a lacuna entre infraestrutura e inovação, fornecendo uma plataforma unificada do hardware ao agente. Ao integrar recursos avançados de ajuste e agentes com a base líder do setor do Red Hat Enterprise Linux e do Red Hat OpenShift, oferecemos a solução completa — desde o hardware acelerado por GPU até os modelos e agentes que impulsionam a lógica de negócios”, disse Joe Fernandes, vice-presidente e gerente-geral da Unidade de Negócios de IA da Red Hat.

O Red Hat AI Enterprise oferece recursos essenciais, incluindo inferência de IA de alto desempenho, ajuste e personalização de modelos, além de implementação e gerenciamento de agentes, com a flexibilidade para suportar qualquer modelo e qualquer hardware

O cenário de IA empresarial está evoluindo rapidamente, passando de simples interfaces de bate-papo para fluxos de trabalho autônomos e de alta densidade, que exigem uma integração mais profunda em toda a pilha de tecnologia. No entanto, muitas organizações permanecem presas na “fase piloto” devido a ferramentas fragmentadas e infraestrutura inconsistente. O Red Hat AI Enterprise resolve esse problema unificando os ciclos de vida do modelo e do aplicativo, permitindo que as equipes de TI gerenciem a IA como um sistema empresarial padronizado, em vez de um projeto isolado, tornando a implementação de IA tão confiável e repetível quanto o software empresarial tradicional.

Red Hat AI Enterprise, a base para a produção de IA

O Red Hat AI Enterprise oferece recursos essenciais, incluindo inferência de IA de alto desempenho, ajuste e personalização de modelos, além de implementação e gerenciamento de agentes, com a flexibilidade para suportar qualquer modelo e qualquer hardware em qualquer ambiente. Impulsionado pelo Red Hat OpenShift – a plataforma líder do setor para aplicações em Nuvem híbrida, baseada em Kubernetes – o Red Hat AI Enterprise proporciona uma experiência altamente escalável e mais consistente, com maior segurança, em qualquer lugar, usando ferramentas e frameworks familiares. Para a infraestrutura de IA, a Nvidia e a Red Hat desenvolveram em conjunto o novo Red Hat AI Factory with Nvidia , combinando o Red Hat AI Enterprise e o Nvidia AI Enterprise para ajudar a acelerar e escalar a IA de produção para empresas.

Os principais benefícios do Red Hat AI Enterprise incluem:

– Inferência de IA mais rápida, econômica e escalável usando o mecanismo de inferência vLLM e a estrutura de inferência distribuída llm-d para implementações otimizadas de modelos generativos de IA em ambientes de hardware híbridos.

– Observabilidade integrada e gestão do ciclo de vida para ajudar a impulsionar a governança do ciclo de vida da IA ​​e mitigar riscos com uma pilha de IA integrada, testada e interoperável, pronta para uso empresarial.

Acesso sob demanda a recursos de GPU, permitindo que as organizações implementem suas próprias capacidades internas de GPU como serviço por meio de orquestração inteligente e acesso a hardware compartilhado com checkpoint automático

– Flexibilidade em toda a Nuvem híbrida, permitindo que as organizações implementem e gerenciem modelos, agentes e aplicativos de IA com maior consistência, onde quer que seus negócios precisem ser executados, com o suporte das plataformas confiáveis ​​da Red Hat.

Ampliando a flexibilidade estratégica e a eficiência de toda a pilha com o Red Hat AI 3.3

A estratégia da Red Hat centra-se em colmatar a lacuna entre a estabilidade essencial para a missão e a inovação de ponta através de uma plataforma unificada. A versão mais recente do software expande a escolha de modelos, aprofunda a otimização de toda a pilha para silício de última geração e reforça a consistência operacional para modelos de ponta.

As novas funcionalidades e melhorias incluem:

– Ecossistema de modelos expandido com versões compactadas, validadas e prontas para produção, do Mistral-Large-3, Nemotron-Nano e Apertus-8B-Instruct, disponíveis através do Catálogo de IA do OpenShift. Além disso, a versão permite a implementação de modelos de última geração, como o Ministral 3 e o DeepSeek-V3.2 com atenção esparsa, ao mesmo tempo que oferece melhorias multimodais, incluindo aceleração de 3x no Whisper, suporte geoespacial, decodificação especulativa aprimorada do Eagle e chamadas de ferramentas otimizadas para fluxos de trabalho com agentes.

– Acesso self-service a modelos de IA com uma prévia da tecnologia Models-as-a-Service (MaaS). As equipes de TI podem fornecer acesso self-service a modelos hospedados privadamente por meio de um gateway de API. Essa abordagem centralizada garante que a IA esteja disponível sob demanda para usuários internos, fomentando uma base de IA pronta para uso que promove a adoção de IA privada e escalável dentro da empresa.

– Suporte expandido para hardware, incluindo uma prévia tecnológica de suporte para IA Generativa em CPUs, começando com CPUs Intel para inferência de pequenos modelos de linguagem (SLM) mais econômica. Além disso, a plataforma expandiu sua certificação de hardware para o Nvidia Blackwell Ultra e o suporte para aceleradores AMD MI325X.

– Ciclo de vida unificado de dados e modelos, protegido pelo novo Red Hat AI Python Index. Este repositório confiável oferece versões robustas e de nível empresarial de ferramentas essenciais — incluindo Docling, SDG Hub e Training Hub — permitindo que as equipes migrem de experimentações fragmentadas para pipelines de produção repetíveis e focados em segurança.

– Observabilidade e segurança abrangentes da IA ​​com maior visibilidade da saúde, desempenho e comportamento do modelo. Isso fornece telemetria em tempo real em cargas de trabalho de IA, implementações do llm-d e uso de clusters e modelos de Modelos como Serviço (MaaS), e é combinado com uma prévia tecnológica de Guardrails NeMo integrados, permitindo que os desenvolvedores garantam segurança operacional e alinhamento em todas as interações de IA.

– Acesso sob demanda a recursos de GPU, permitindo que as organizações implementem suas próprias capacidades internas de GPU como serviço por meio de orquestração inteligente e acesso a hardware compartilhado com checkpoint automático para salvar o estado de tarefas de treinamento de longa duração, evitando perda de trabalho e mantendo custos de computação mais previsíveis, mesmo em ambientes altamente dinâmicos ou preemptíveis.

Serviço
www.redhat.com

 

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital