book_icon

Oracle anuncia MySQL HeatWave com suporte a Machine Learning no banco de dados

Ferramenta automatiza o processo de treinamento e cria um modelo com o melhor algoritmo, recursos ideais e os hiperparâmetros ideais para um determinado conjunto de dados e uma tarefa especifica

Oracle anuncia MySQL HeatWave com suporte a Machine Learning no banco de dados

A Oracle anunciou que o Oracle MySQL HeatWave agora suporta Machine Learning (ML) no banco de dados, além do processamento e análise de transações, sendo o único serviço de banco de dados em Nuvem MySQL a fazer isso. O MySQL HeatWave ML automatiza totalmente o ciclo de vida do ML e armazena todos os modelos treinados dentro do banco de dados MySQL, eliminando a necessidade de mover dados ou o modelo para uma ferramenta ou serviço de aprendizado de máquina. A eliminação do ETL reduz a complexidade do aplicativo, reduz o custo e melhora a segurança dos dados e do modelo. O HeatWave ML está incluído no serviço de Nuvem do banco de dados MySQL HeatWave em todas as 37 regiões do Oracle Cloud Infrastructure (OCI).

Segundo informações, até agora, adicionar recursos de aprendizado de máquina a aplicativos MySQL era proibitivamente difícil e demorado para muitos desenvolvedores. Primeiro, há o processo de extração de dados do banco de dados para outro sistema para criar e implementar modelos de ML. Essa abordagem cria vários silos para aplicar o aprendizado de máquina aos dados do aplicativo e introduz latência à medida que os dados se movimentam. Isso também leva à proliferação de dados fora do banco de dados, tornando-o mais vulnerável a ameaças de segurança e aumenta a complexidade para os desenvolvedores programarem em vários ambientes. Em segundo lugar, os serviços existentes esperam que os desenvolvedores sejam especialistas em orientar o processo de treinamento do modelo de ML; caso contrário, o modelo é sub-ótimo, o que degrada a precisão das previsões.

Além dos recursos de Machine Learning, a Oracle lançou mais inovações no serviço MySQL HeatWave. A elasticidade em tempo real permite que os clientes aumentem e diminuam seu cluster HeatWave para qualquer número de nós, sem qualquer tempo de inatividade ou tempo somente leitura e sem a necessidade de reequilibrar manualmente o cluster

O MySQL HeatWave ML resolve esses problemas integrando nativamente recursos de aprendizado de máquina dentro do banco de dados MySQL, eliminando a necessidade de ETL dos dados para outro serviço. O HeatWave ML automatiza totalmente o processo de treinamento e cria um modelo com o melhor algoritmo, recursos ideais e os hiperparâmetros ideais para um determinado conjunto de dados e uma tarefa especificada. Todos os modelos gerados pelo HeatWave ML podem fornecer explicações de modelo e previsão.

A empresa afirma que nenhum outro fornecedor de banco de dados em Nuvem fornece recursos de ML tão avançados diretamente em seu serviço de banco de dados. Benchmarks de ML publicados pela Oracle realizado em um grande número de conjuntos de dados de classificação e regressão de aprendizado de máquina publicamente disponíveis, como Numerai, Namao e Bank Marketing, entre outros. Em média, no menor cluster, o HeatWave ML treina modelos de aprendizado de máquina 25 vezes mais rápido a 1% do custo do Redshift ML. Além disso, a vantagem de desempenho em relação ao Redshift ML aumenta quando o treinamento é feito em um cluster HeatWave maior.

O treinamento é um processo demorado e, como pode ser feito com muita eficiência e rapidez com o MySQL HeatWave, os clientes agora podem treinar novamente seus modelos com mais frequência e acompanhar as alterações nos dados. Isso mantém os modelos atualizados e melhora a precisão das previsões.

“Assim como integramos análises e processamento de transações em um único banco de dados, agora estamos trazendo aprendizado de máquina dentro do MySQL HeatWave”, disse Edward Screven , arquiteto corporativo chefe da Oracle. “O MySQL HeatWave é um dos serviços em Nuvem que mais crescem na Oracle. Um número crescente de clientes migraram da Amazon e outros serviços de banco de dados em Nuvem para o MySQL HeatWave e obtiveram melhorias significativas de desempenho e custos mais baixos. Hoje, também estamos anunciando uma série de outras inovações que enriquecem os recursos do HeatWave, melhoram a disponibilidade e reduzem o custo. Nossos novos resultados de benchmark totalmente transparentes demonstram novamente que Snowflake, AWS, Microsoft e Google são mais lentos e mais caros que o MySQL HeatWave por uma grande margem”, afirmou.

O HeatWave ML oferece os seguintes recursos em comparação com outros serviços de banco de dados em Nuvem:

Treinamento de modelo totalmente automatizado: as diferentes etapas na criação de um modelo com o HeatWave ML são totalmente automatizadas e não requerem nenhuma intervenção dos desenvolvedores. Isso resulta em um modelo ajustado que é mais preciso, não requer trabalho manual e o processo de treinamento é sempre concluído. Outros serviços de banco de dados em Nuvem, como o Amazon Redshift, fornecem integração com recursos de aprendizado de máquina em serviços externos, que exigem extensas entradas manuais dos desenvolvedores durante o processo de treinamento de ML.

Explicações do modelo e inferência: a explicabilidade do modelo ajuda os desenvolvedores a entender o comportamento de um modelo de aprendizado de máquina. Por exemplo, se um banco negar um empréstimo a um cliente, o banco precisa ser capaz de determinar quais parâmetros do modelo foram levados em consideração ou se o modelo contém algum viés. A explicabilidade da previsão é um conjunto de técnicas que ajudam a responder à pergunta de por que um modelo de aprendizado de máquina fez uma previsão específica. As explicações de previsão estão se tornando cada vez mais importantes nos dias de hoje, pois as empresas devem ser capazes de explicar as decisões tomadas por seus modelos de aprendizado de máquina. O HeatWave ML integra explicação de modelo e explicações de previsão como parte de seu processo de treinamento de modelo. Como resultado, todos os modelos criados pelo HeatWave ML podem oferecer explicações de modelo e de inferência sem a necessidade de treinamento de dados no momento da explicação de inferência. A Oracle ampliou as técnicas de explicação existentes para melhorar o desempenho, a interpretabilidade e a qualidade. Outros serviços de banco de dados em nuvem não oferecem uma explicação tão rica para todos os seus modelos de aprendizado de máquina.

Ajuste de hiperparâmetros: o HeatWave ML implementa um novo algoritmo de redução baseado em pesquisa de gradiente para ajuste de hiperparâmetros. Isso permite que a pesquisa de hiperparâmetros seja executada em paralelo sem comprometer a precisão do modelo. O ajuste de hiperparâmetros é o estágio mais demorado do treinamento do modelo de ML, e esse recurso exclusivo fornece ao HeatWave ML uma vantagem de desempenho significativa em relação a outros serviços de nuvem para a criação de modelos de aprendizado de máquina.

Seleção de algoritmo: o HeatWave ML usa a noção de modelos de proxy – que são modelos simples que exibem as propriedades de um modelo complexo completo – para determinar o melhor algoritmo de ML para treinamento. Usando um modelo de proxy simples, a seleção do algoritmo é feita de forma muito eficiente sem perda de precisão. Nenhum outro serviço de banco de dados para construir modelos de aprendizado de máquina tem esse recurso de modelagem de proxy.

Amostragem inteligente de dados: durante o treinamento do modelo, o HeatWave ML mostra uma pequena porcentagem dos dados para melhorar o desempenho. Essa amostragem é feita de forma que todos os pontos de dados representativos sejam capturados no conjunto de dados de amostra. Outros serviços em nuvem para construir modelos de aprendizado de máquina adotam uma abordagem menos eficiente – usando amostragem de dados aleatórios – que amostra uma pequena porcentagem de dados sem considerar as características de distribuição de dados.

Seleção de recursos: a seleção de recursos ajuda a determinar os atributos dos dados de treinamento que influenciam o comportamento do modelo de aprendizado de máquina para fazer previsões. As técnicas do HeatWave ML para seleção de recursos foram treinadas em uma ampla faixa de conjuntos de dados em vários domínios e aplicativos. A partir dessas estatísticas e metainformações coletadas, o HeatWave ML é capaz de identificar com eficiência os recursos relevantes em um novo conjunto de dados.

Além dos recursos de Machine Learning, a Oracle lançou mais inovações no serviço MySQL HeatWave. A elasticidade em tempo real permite que os clientes aumentem e diminuam seu cluster HeatWave para qualquer número de nós, sem qualquer tempo de inatividade ou tempo somente leitura e sem a necessidade de reequilibrar manualmente o cluster. Também está incluída a compactação de dados , que permite que os clientes processem duas vezes a quantidade de dados por nó e reduz os custos em quase 50%, mantendo a mesma relação preço-desempenho. Por fim, uma nova função de pausar e retomar permite que os clientes pausem o HeatWave para economizar custos. Ao retomar, os dados e as estatísticas necessários para o MySQL Autopilot são recarregados automaticamente no HeatWave.

Serviço
www.oracle.com

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.