book_icon

Oracle desenvolve IA generativa no banco de dados com novo HeatWave GenAI

O HeatWave GenAI está disponível imediatamente em todas as regiões do Oracle Cloud, na região dedicada do Oracle Cloud Infrastructure (OCI) e em Nuvens sem custo extra para os clientes do HeatWave

Oracle desenvolve IA generativa no banco de dados com novo HeatWave GenAI

A Oracle anunciou a disponibilidade geral do HeatWave GenAI, que inclui os primeiros grandes modelos de linguagem (LLMs) no banco de dados do setor, um armazenamento vetorial automatizado no banco de dados, processamento vetorial em expansão e a capacidade de ter conversas contextuais em linguagem natural informadas por conteúdo não estruturado. Esses novos recursos permitem que os clientes tragam o poder da IA generativa para seus dados corporativos, sem exigir experiência em IA ou ter de mover dados para um banco de dados vetorial separado. O HeatWave GenAI está disponível imediatamente em todas as regiões do Oracle Cloud, na região dedicada do Oracle Cloud Infrastructure (OCI) e em Nuvens sem custo extra para os clientes do HeatWave.

Com o HeatWave GenAI, os desenvolvedores podem criar um repositório vetorial para conteúdo corporativo não estruturado com um único comando SQL, usando modelos de incorporação internos. Os usuários podem realizar pesquisas em linguagem natural em uma única etapa usando LLMs internos ou externos. Os dados não saem do banco de dados e, devido à escala e desempenho extremos do HeatWave, não há necessidade de provisionar GPUs. Como resultado, os desenvolvedores podem reduzir a complexidade do aplicativo, aumentar o desempenho, melhorar a segurança dos dados e reduzir os custos.

HeatWave Chat é um plug-in de código visual para MySQL Shell que fornece uma interface gráfica para HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou SQL

“O impressionante ritmo de inovação do HeatWave continua com a adição do HeatWave GenAI aos recursos integrados existentes do HeatWave: HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML e HeatWave MySQL”, disse Edward Screven, arquiteto-chefe corporativo da Oracle. ” Os aprimoramentos de IA integrados e automatizados de hoje permitem que os desenvolvedores criem aplicativos de IA generativa avançados mais rapidamente, sem exigir experiência em IA ou mover dados. Os usuários agora têm uma maneira intuitiva de interagir com seus dados corporativos e obter rapidamente as respostas precisas de que precisam para seus negócios”, afirmou.

Os novos recursos de IA generativa automatizados e integrados incluem:

– Os LLMs no banco de dados simplificam o desenvolvimento de aplicativos de IA generativa a um custo mais baixo. Os clientes podem se beneficiar da IA generativa sem a complexidade da seleção e integração de LLM externo e sem se preocupar com a disponibilidade de LLMs em Data Centers de vários provedores de Nuvem. Os LLMs no banco de dados permitem que os clientes pesquisem dados, gerem ou resuma conteúdo e executem a geração aumentada de recuperação (RAG) com o HeatWave Vector Store. Além disso, eles podem combinar IA generativa com outros recursos HeatWave integrados, como o AutoML, para criar aplicativos mais ricos. O HeatWave GenAI também está integrado ao serviço OCI Generative AI para acessar modelos fundamentais pré-treinados dos principais provedores de LLM.

– O Automated In-database Vector Store permite que os clientes usem IA generativa com seus documentos de negócios sem mover dados para um banco de dados vetorial separado e sem experiência em IA. Todas as etapas para criar um repositório vetorial e incorporações vetoriais são automatizadas e executadas dentro do banco de dados, incluindo descobrir os documentos no armazenamento de objetos, analisá-los, gerar incorporações de forma altamente paralela e otimizada e inseri-los no armazenamento vetorial tornando o HeatWave Vector Store eficiente e fácil de usar. O uso de um armazenamento vetorial para RAG ajuda a resolver o desafio de alucinação de LLMs, pois os modelos podem pesquisar dados proprietários com contexto apropriado para fornecer respostas mais precisas e relevantes.

– O processamento vetorial de expansão fornece resultados de pesquisa semântica muito rápidos sem qualquer perda de precisão. O HeatWave suporta um novo tipo de dados Vector nativo e uma implementação otimizada da função de distância, permitindo que os clientes realizem consultas semânticas com SQL padrão. A representação colunar híbrida na memória e a arquitetura scale-out do HeatWave permitem que o processamento vetorial seja executado em largura de banda próxima à memória e paralelize em até 512 nós HeatWave. Como resultado, os clientes têm suas perguntas respondidas rapidamente. Os usuários também podem combinar a pesquisa semântica com outros operadores SQL para, por exemplo, unir várias tabelas com documentos diferentes e executar pesquisas de similaridade em todos os documentos.

HeatWave Chat é um plug-in de código visual para MySQL Shell que fornece uma interface gráfica para HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou SQL. O Lakehouse Navigator integrado permite que os usuários selecionem arquivos do armazenamento de objetos e criem um repositório vetorial. Os usuários podem pesquisar em todo o banco de dados ou restringir a pesquisa a uma pasta. O HeatWave mantém o contexto com o histórico de perguntas feitas, citações dos documentos de origem e o prompt para o LLM. Isso facilita uma conversa contextual e permite que os usuários verifiquem a fonte das respostas geradas pelo LLM. Esse contexto é mantido no HeatWave e está disponível para qualquer aplicativo que use o HeatWave.

Criação de Vector Store e Benchmarks de Processamento Vetorial

A criação de um repositório vetorial para documentos nos formatos PDF, PPT, Word e HTML é até 23 vezes mais rápida com o HeatWave GenAI e 1/4 do custo de uso da Base de conhecimento para o Amazon Bedrock.

Como demonstrado por um benchmark de terceiros usando uma variedade de consultas de pesquisa de similaridade em tabelas que variam de 1,6 GB a 300 GB de tamanho, o HeatWave GenAI é 30 vezes mais rápido que o Snowflake e custa 25% menos, 15 vezes mais rápido que o Databricks e custa 85% menos, e 18 vezes mais rápido que o Google BigQuery e custa 60% menos.

Um benchmark separado revela que os índices vetoriais no Amazon Aurora PostgreSQL com pgvector podem ter um alto grau de imprecisão e produzir resultados incorretos. Em contraste, o processamento de pesquisa de similaridade do HeatWave sempre fornece resultados precisos, tem tempo de resposta previsível, é executado em velocidade próxima à memória e é até 10X-80X mais rápido do que o Aurora usando o mesmo número de núcleos.

“Estamos entusiasmados em continuar nossa forte colaboração com a Oracle para fornecer o poder e a produtividade da IA com o HeatWave GenAI para cargas de trabalho e conjuntos de dados corporativos críticos”, disse Dan McNamara, vice-presidente sênior e gerente-geral da Unidade de Negócios de Servidores da AMD. “O trabalho conjunto de engenharia realizado pela AMD e pela Oracle está permitindo que os desenvolvedores projetem soluções inovadoras de IA corporativa, aproveitando o HeatWave GenAI alimentado pela densidade do núcleo e pelo excelente desempenho de preço dos processadores AMD Epyc”, comentou.

A Oracle afirma que o HeatWave é o único serviço de Nuvem que fornece IA generativa automatizada e integrada e aprendizado de máquina em uma oferta única para transações e Lakehouse-scale Analytics. Um componente central da estratégia de Nuvem distribuída da Oracle, o HeatWave está disponível nativamente no OCI e Amazon Web Services (AWS), no Microsoft Azure por meio do Oracle Interconnect for Azure e nos Data Centers dos clientes com OCI Dedicated Region e Oracle Alloy.

 

Últimas Notícias
Você também pode gostar
As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.