book_icon

H2O.ai anuncia novos modelos fundacionais para uso de IA em documentos

Compactos e eficientes, os modelos fundacionais H2OVL Mississippi representam um avanço na IA, oferecendo desempenho para tarefas de visão e OCR em ambientes corporativos

H2O.ai anuncia novos modelos fundacionais para uso de IA em documentos

A H2O.ai, provedora de IA generativa de código aberto e plataformas de IA preditiva, anunciou o H2OVL Mississippi 2B e 0.8B, dois novos modelos fundacionais multimodais poderosos, projetados especificamente para OCR (Optical character recognition – reconhecimento de caractere óptico para uso de IA em documentos). Compactos, mas altamente eficientes, os modelos fundacionais H2OVL Mississippi representam um avanço significativo na IA, oferecendo desempenho incomparável para tarefas de visão e OCR em ambientes corporativos.

Disponíveis agora no Hugging Face, o H2OVL Mississippi 2B e 0.8B oferecem às empresas uma solução econômica com eficiência e precisão para análise de documentos em tempo real e reconhecimento de imagens.

Ao misturar IA multimodal de ponta com extrema eficiência, o H2OVL Mississippi oferece soluções precisas e escaláveis de IA em documentos em diversos setores

A decisão da H2O.ai de lançar a série de modelos H2OVL com pesos abertos gerou grande interesse na comunidade de IA. Ao tornar o modelo acessível gratuitamente no Hugging Face, desenvolvedores, pesquisadores e empresas agora podem modificar, ajustar e adaptar os modelos H2OVL Mississippi para atender às suas necessidades específicas de OCR e IA em documentos.

O H2OVL Mississippi 2B é uma evolução do H2O Danube2, com um robusto modelo de 2,1 bilhões de parâmetros otimizado para implantação leve e uma arquitetura multimodal especializada que combina linguagem e visão computacional, atendendo à crescente demanda por OCR multimodal mais econômico. Pré-treinado em 5,3 milhões de pares de conversas e ajustado com mais 12 milhões de pares, o H2OVL Mississippi 2B se destaca no manuseio de diversas resoluções de imagem, variando de 448px a 4K.

Construído sobre o Danube3 0.5B, o modelo H2OVL Mississippi 0.8B – pré-treinado em 11 milhões de pares de conversas e ajustado com mais 8 milhões – superou todos os SLMs comparáveis no mercado em benchmarks de OCR, oferecendo desempenho incomparável no reconhecimento de texto.

“Projetamos os modelos H2OVL Mississippi para serem uma solução de alto desempenho e custo-efetiva, trazendo OCR, compreensão visual e IA em documentos impulsionados por IA para as empresas,” disse Sri Ambati, CEO e fundador da H2O.ai. “Ao misturar IA multimodal de ponta com extrema eficiência, o H2OVL Mississippi oferece soluções precisas e escaláveis de IA em documentos em diversos setores.”

Principais Características do H2OVL Mississippi 2B e 0.8B:

Modelo leve: parâmetros 2B e 0.8B otimizados para implementação eficiente, permitindo desempenho poderoso de IA com consumo mínimo de recursos.

Domínio multimodal: lida de forma fluida com tarefas de OCR e IA em documentos em várias resoluções, proporcionando capacidades versáteis de visão-linguagem.

Treinamento personalizado: treinamento em várias etapas com camadas de ajuste para desempenho altamente personalizado em aplicações.

Eficiência em tempo real: oferece processamento em tempo real com latência mínima, tornando-o ideal para setores como bancos, serviços financeiros, telecomunicações, manufatura, saúde, seguros e setor público, onde o processamento preciso de documentos é crucial.

 

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital