
A NEC Corporation utilizou sua análise de vídeo e IA generativa para desenvolver uma tecnologia que fornece conselhos para melhorar o desempenho do trabalhador, identificando diferenças entre as ações do modelo e os movimentos reais. Essa tecnologia recém-desenvolvida permite a exibição automática de conselhos apropriados para melhorar tudo, desde tarefas de precisão usando as mãos e os dedos até tarefas que exigem o uso de todo o corpo. Usando essa tecnologia, os trabalhadores podem dominar tarefas sem supervisão em locais de trabalho em manufatura, logística, construção e vários outros setores.

Nos últimos anos, a escassez de mentores decorrente do envelhecimento de trabalhadores qualificados tornou a transmissão de habilidades um desafio. Além disso, há uma preocupação crescente com o declínio da qualidade do trabalho como resultado do aumento do custo do treinamento supervisionado e da incapacidade de fornecer aos trabalhadores treinamento suficiente devido ao aumento da produção de alto mix e baixo volume e à diversidade e mobilidade dos trabalhadores.
Essa tecnologia permite a autoeducação para uma ampla variedade de tarefas, fazendo com que a IA forneça conselhos em vez de um instrutor. Para perceber isso, a NEC desenvolveu uma tecnologia de análise de vídeo para identificar diferenças sutis nos movimentos quando comparadas às ações do modelo e uma tecnologia para gerar conselhos apropriados para corresponder à ação do modelo por IA generativa com base nas diferenças.
A tecnologia de análise de vídeo para detectar diferenças sutis no movimento compara as ações do modelo com o movimento real e combina as seções onde a mesma operação é realizada. Nesse momento, é possível mesclar imagens capturando não apenas o movimento das pessoas, mas também interações como agarrar e segurar objetos. Isso permite que diferenças sutis nos movimentos dos trabalhadores que antes eram indetectáveis sejam detectadas com um alto grau de precisão, mesmo para imagens de vídeo de comprimentos diferentes.
A tecnologia que gera conselhos fornece segmentos de imagens de vídeo nos quais as diferenças foram detectadas, bem como informações esqueléticas, como movimento do quadril e joelho e o formato das mãos e dedos para um Modelo de Visão e Linguagem (VLM), o que permite que a postura de trabalho exata e as ações dentro do vídeo que exigem melhorias sejam identificadas com precisão e conselhos textuais específicos sejam gerados. Como o conselho textual é exibido junto com segmentos relevantes das imagens de vídeo, os trabalhadores podem dominar tarefas como montagem meticulosa, encaixotamento e transporte de mercadorias sem supervisão em vários ambientes da indústria, contribuindo assim para reduções significativas nos custos de treinamento.
No futuro, a NEC continuará com o desenvolvimento de produtos e verificação desta nova tecnologia, com o objetivo de lançar serviços no ano fiscal de 2026.

Leia nesta edição:

CAPA - TECNOLOGIA
Arquitetura neuromórfica, a plataforma inspirada no cérebro humano

MERCADO
O bom negócio da locação de equipamentos de TI

SEGURANÇA DIGITAL
Dilemas e oportunidades de blockchain para identidade
EXCLUSIVA DIGITAL

VERSÃO LATAM
Agora a versão digital também é LATAM
Baixe o nosso aplicativo














