A AWS anunciou na terça-feira (8/12), durante o evento AWS re: Invent, novos recursos para o seu serviço de Machine Learning (ML) Amazon SageMaker, tornando ainda mais fácil para os desenvolvedores automatizar e dimensionar todas as etapas do fluxo de trabalho de ponta a ponta. Entre as novidades estão a preparação de dados mais rápida, um repositório específico para dados preparados, automação de fluxo de trabalho, maior transparência nos dados de treinamento para mitigar tendências e explicar previsões, recursos de treinamento distribuído para treinar modelos grandes até duas vezes mais rápido e monitoramento de modelo em dispositivos de ponta.
O SageMaker Data Wrangler fornece a maneira mais rápida e fácil de preparar dados para ML, um processo considerado difícil, já que os atributos de dados (conhecidos como recursos) usados para treinar um modelo geralmente vêm de fontes diferentes e existem em vários formatos. Isso significa que os desenvolvedores devem gastar um tempo considerável extraindo e normalizando esses dados para que sejam consistentemente fáceis de usar. Com o SageMaker Data Wrangler, os clientes podem escolher os dados que desejam de seus vários armazenamentos de dados e importá-los com um único clique. Ele contém mais de 300 transformadores de dados integrados que podem ajudar a normalizar, transformar e combinar recursos sem ter que escrever nenhum código, enquanto gerencia toda a infraestrutura de processamento nos bastidores.
A Loja de recursos Amazon SageMaker fornece um novo repositório que facilita o armazenamento, atualização, recuperação e compartilhamento de recursos de ML para treinamento e inferência. Ela fornece um armazenamento de recursos criado para determinados propósitos, em que os desenvolvedores podem acessar e compartilhar recursos que tornam muito mais fácil nomear, organizar, localizar e compartilhar conjuntos de recursos entre equipes de desenvolvedores e cientistas de dados.
Outra novidade o gerenciamento e automação do fluxo de trabalho do SageMaker Pipelines, o primeiro serviço de integração e entrega contínua (CI/CD) desenvolvido para um propósito e fácil de usar para ML. Como os clientes podem ver com a engenharia de recursos, o Machine Learning compreende várias etapas, que podem se beneficiar da orquestração e automação. Isso não é diferente da programação tradicional, em que os clientes têm ferramentas como CI/CD para ajudá-los a desenvolver e implantar aplicativos mais rapidamente. Os desenvolvedores podem agora definir cada etapa de um fluxo de trabalho de ponta a ponta, que incluem as etapas de carregamento de dados, transformações de Amazon SageMaker Data Wrangler, recursos armazenados em Loja de recursos SageMaker, configuração de treinamento e definição de algoritmo, etapas de depuração e etapas de otimização.
O SageMaker Clarify fornece detecção de polarização em todo o fluxo de trabalho de ML, permitindo que os desenvolvedores criem maior justiça e transparência em seus modelos. Depois que os desenvolvedores prepararam os dados para treinamento e inferência, eles precisam tentar garantir que os dados estejam livres de distorções estatísticas e que as previsões do modelo sejam transparentes, para que possam explicar como os recursos do modelo estão contribuindo para as previsões. Com a nova ferramenta, os desenvolvedores podem agora detectar com mais facilidade o viés estatístico em todo o fluxo de trabalho e fornecer explicações para as previsões feitas por seus modelos de ML.
O SageMaker Debugger agora permite que os desenvolvedores treinem seus modelos com mais rapidez, monitorando automaticamente a utilização dos recursos do sistema e fornecendo alertas para gargalos de treinamento. Ele expande seu escopo para monitorar a utilização dos recursos do sistema, enviar alertas sobre problemas durante o treinamento e correlacionar o uso a diferentes fases do job de treinamento ou a um ponto específico no tempo (por exemplo, 28 minutos após o início do job). A ferramenta também pode disparar ações com base em alertas (por exemplo, interromper um trabalho de treinamento quando irregularidades no uso da GPU são detectadas).
Serviço
https://aws.amazon.com/sagemaker
Leia nesta edição:
CAPA | TECNOLOGIA
Centros de Dados privados ainda geram bons negócios
TENDÊNCIA
Processadores ganham centralidade com IA
TIC APLICADA
Digitalização do canteiro de obras
Esta você só vai ler na versão digital
TECNOLOGIA
A tecnologia RFID está madura, mas há espaço para crescimento
Baixe o nosso aplicativo