book_icon

NEC combina tecnologia de análise de vídeo com IA generativa

Essa tecnologia recém-desenvolvida permite a exibição automática de conselhos apropriados para melhorar tudo, desde tarefas de precisão usando as mãos e os dedos até tarefas que exigem o uso de todo o corpo

NEC combina tecnologia de análise de vídeo com IA generativa

A NEC Corporation utilizou sua análise de vídeo e IA generativa para desenvolver uma tecnologia que fornece conselhos para melhorar o desempenho do trabalhador, identificando diferenças entre as ações do modelo e os movimentos reais. Essa tecnologia recém-desenvolvida permite a exibição automática de conselhos apropriados para melhorar tudo, desde tarefas de precisão usando as mãos e os dedos até tarefas que exigem o uso de todo o corpo. Usando essa tecnologia, os trabalhadores podem dominar tarefas sem supervisão em locais de trabalho em manufatura, logística, construção e vários outros setores.

Nos últimos anos, a escassez de mentores decorrente do envelhecimento de trabalhadores qualificados tornou a transmissão de habilidades um desafio. Além disso, há uma preocupação crescente com o declínio da qualidade do trabalho como resultado do aumento do custo do treinamento supervisionado e da incapacidade de fornecer aos trabalhadores treinamento suficiente devido ao aumento da produção de alto mix e baixo volume e à diversidade e mobilidade dos trabalhadores.

Essa tecnologia permite a autoeducação para uma ampla variedade de tarefas, fazendo com que a IA forneça conselhos em vez de um instrutor. Para perceber isso, a NEC desenvolveu uma tecnologia de análise de vídeo para identificar diferenças sutis nos movimentos quando comparadas às ações do modelo e uma tecnologia para gerar conselhos apropriados para corresponder à ação do modelo por IA generativa com base nas diferenças.

A tecnologia de análise de vídeo para detectar diferenças sutis no movimento compara as ações do modelo com o movimento real e combina as seções onde a mesma operação é realizada. Nesse momento, é possível mesclar imagens capturando não apenas o movimento das pessoas, mas também interações como agarrar e segurar objetos. Isso permite que diferenças sutis nos movimentos dos trabalhadores que antes eram indetectáveis sejam detectadas com um alto grau de precisão, mesmo para imagens de vídeo de comprimentos diferentes.

A tecnologia que gera conselhos fornece segmentos de imagens de vídeo nos quais as diferenças foram detectadas, bem como informações esqueléticas, como movimento do quadril e joelho e o formato das mãos e dedos para um Modelo de Visão e Linguagem (VLM), o que permite que a postura de trabalho exata e as ações dentro do vídeo que exigem melhorias sejam identificadas com precisão e conselhos textuais específicos sejam gerados. Como o conselho textual é exibido junto com segmentos relevantes das imagens de vídeo, os trabalhadores podem dominar tarefas como montagem meticulosa, encaixotamento e transporte de mercadorias sem supervisão em vários ambientes da indústria, contribuindo assim para reduções significativas nos custos de treinamento.

No futuro, a NEC continuará com o desenvolvimento de produtos e verificação desta nova tecnologia, com o objetivo de lançar serviços no ano fiscal de 2026.

 

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.
Revista Digital