A Amazon Web Services (AWS), anunciou a disponibilidade geral do Amazon Elastic Compute Cloud (Amazon EC2) instâncias DL1, um novo tipo de instância projetado para treinar modelos de Learning Machine (ML). Instâncias DL1 são alimentadas por aceleradores Gaudi deHabana Labs (uma empresa da Intel) para fornecer preço até 40% melhor para modelos de aprendizado de máquina de treinamento. Com as instâncias DL1, os clientes podem treinar seus modelos de ML de forma mais rápida e econômica para casos de uso como processamento de linguagem natural, detecção e classificação de objetos, detecção de fraude, motores de recomendação e personalização, processamento inteligente de documentos, previsão de negócios e muito mais. As instâncias DL1 estão disponíveis sob demanda por meio de um modelo de uso pré-pago de baixo custo, sem compromissos iniciais.
O aprendizado de máquina se tornou popular à medida que os clientes perceberam um impacto tangível nos negócios com a implantementação de modelos em escala na Nuvem. Para usar o ML em seus aplicativos de negócios, os clientes começam construindo e treinando um modelo para reconhecer padrões, aprendendo a partir de dados de amostra e, em seguida, aplicam o modelo em novos dados para fazer previsões. Por exemplo, um modelo de aprendizado de máquina treinado em um grande número de transcrições do contact center pode fazer previsões para fornecer assistência personalizada em tempo real aos clientes por meio de um chatbot conversacional.
Para melhorar a precisão da previsão de um modelo, os cientistas de dados e engenheiros de aprendizado de máquina estão construindo modelos cada vez maiores e mais complexos. Para manter a precisão da previsão e a alta qualidade dos modelos, esses engenheiros precisam ajustar e treinar seus modelos com frequência. Isso requer uma quantidade considerável de recursos de computação de alto desempenho, resultando em maiores custos de infraestrutura. Esses custos podem ser proibitivos para os clientes treinarem novamente seus modelos na frequência necessária para manter previsões de alta precisão, ao mesmo tempo que representam um obstáculo para os clientes que desejam começar a experimentar o aprendizado de máquina.
As novas instâncias DL1 usam aceleradores Gaudi construídos especificamente para acelerar o treinamento do modelo de aprendizado de máquina, oferecendo maior eficiência de computação a um custo menor em comparação com GPUs de uso geral. As instâncias DL1 apresentam até 8 aceleradores Gaudi, 256 GB de memória de alta largura de banda, 768 GB de memória do sistema, processadores Intel Xeon personalizado (Cascade Lake), 400 Gbps de taxa de transferência de rede e até 4 TB de armazenamento NVMe local. Juntas, essas inovações se traduzem em desempenho de preço até 40% melhor do que instâncias EC2 para treinar modelos de aprendizado de máquina comuns.
Os clientes podem começar a usar instâncias DL1 de forma rápida e fácil, usando o Habana SynapseAI SDK incluído, que é integrado às principais estruturas de aprendizado de máquina (por exemplo, TensorFlow e PyTorch), ajudando os clientes a migrar perfeitamente seus modelos de ML existentes atualmente em execução com base em GPU ou CPU baseadas em instâncias DL1, com mudanças mínimas de código. Desenvolvedores e cientistas de dados também podem começar com modelos de referência otimizados para aceleradores Gaudi disponíveis no repositório GitHub da Habana, que inclui modelos populares para diversos aplicativos, incluindo classificação de imagens, detecção de objetos, processamento de linguagem natural e sistemas de recomendação.
Serviço
aws.amazon.com
Leia nesta edição:
MATÉRIA DE CAPA | TECNOLOGIA
O salto do Supply Chain
SEGURANÇA DA INFORMAÇÃO
Superações na Segurança de Dados
CARREIRA
A arte de navegar em meio à tempestade
Esta você só vai ler na versão digital
APLICAÇÃO
O mundo cabe dentro de um token
Baixe o nosso aplicativo