book_icon

Pesquisa da Nvidia favorece para que criadores de conteúdo improvisem com objetos 3D

Pipeline de renderização inversa do Nvidia 3D MoMa é apresentado na Conferência sobre Visão Computacional e Reconhecimento de Padrões em Nova Orleans

Pesquisa da Nvidia favorece para que criadores de conteúdo improvisem com objetos 3D

Jazz tem tudo a ver com improvisação e a Nvidia está prestando homenagem ao gênero com pesquisas em Inteligência Artificial (IA) que um dia poderão permitir que profissionais de criação improvisem com modelos em 3D criados no mesmo tempo necessário para fazer uma jam session. O método Nvidia 3D MoMa pode capacitar arquitetos, designers, artistas conceituais e desenvolvedores de games a importar rapidamente um objeto para um mecanismo gráfico para começar a trabalhar com ele, modificando a escala, alterando o material ou experimentando diferentes efeitos de iluminação.

Extraindo objetos 3D de imagens 2D
“A renderização inversa, uma técnica para reconstruir uma série de fotos em um modelo 3D de um objeto ou cena, há muito tempo é o santo graal unificando visão computacional e computação gráfica”, diz David Luebke, vice-presidente de pesquisa gráfica da Nvidia.

O Nvidia MoMa 3D gera modelos de malha triangular em uma hora e em uma única GPU Nvidia Tensor Core 

“Ao formular cada parte do problema de renderização inversa como um componente diferenciável acelerado por GPU, o pipeline de renderização Nvidia 3D MoMa usa o maquinário da IA moderna e a potência computacional bruta das GPUs da Nvidia para produzir rapidamente objetos 3D que os criadores podem importar, editar e estender sem limitação nas ferramentas existentes”, diz.

Para ser mais útil para um artista ou engenheiro, um objeto 3D deve estar em um formato que possa ser colocado em ferramentas amplamente usadas, como mecanismos de jogos, modeladores 3D e renderizadores de filmes. Essa forma é uma malha triangular com materiais texturizados, a linguagem comum usada por essas ferramentas 3D.

Legenda: Malhas triangulares são frames subjacentes usados para definir formas em gráficos e modelagem 3D
Legenda: Malhas triangulares são frames subjacentes usados para definir formas em gráficos e modelagem 3D

Os estúdios de jogos e outros profissionais de criação, tradicionalmente, criam objetos 3D como esses com técnicas complexas de fotogrametria que exigem tempo e esforço manual significativos. Trabalhos recentes em campos de radiação neural podem gerar rapidamente uma representação 3D de um objeto ou cena, mas não em um formato de malha triangular que pode ser facilmente editado.

O Nvidia MoMa 3D gera modelos de malha triangular em uma hora e em uma única GPU Nvidia Tensor Core. O resultado produzido pelo pipeline é diretamente compatível com os mecanismos gráficos 3D e as ferramentas de modelagem que os criadores já usam.

A reconstrução do pipeline inclui três recursos: um modelo de malha 3D, materiais e iluminação. A malha é como um modelo papel machê em forma 3D construída a partir de triângulos. Com ela, os desenvolvedores podem modificar um objeto conforme sua visão criativa. Os materiais são texturas 2D sobrepostas nas malhas 3D como uma pele. Além disso, a estimativa do MoMa 3D de como a cena é iluminada permite que os criadores modifiquem posteriormente a incidência da iluminação sobre os objetos.

Afinando os instrumentos para uma banda de jazz virtual
Para mostrar os recursos do MoMa 3D, as equipes de pesquisa e criação da Nvidia começaram fotografando cinco instrumentos de uma banda de jazz (trompete, trombone, saxofone, bateria e clarinete) de diferentes ângulos, coletando cerca de 100 imagens de cada um.

O MoMa 3D reconstruiu essas imagens 2D em modelos 3D de cada instrumento, representados como malhas. Depois, a equipe da NVIDIA retirou os instrumentos das cenas originais e os importou para a plataforma de simulação 3D Nvidia Omniverse para edição.

“Essa é mais uma novidade que ajudará os criadores de conteúdo e demais profissionais da área a criarem trabalhos cada vez com mais excelência. Ficamos muito felizes de divulgar essa novidade”, conta Marcio Aguiar, diretor da divisão Enterprise da Nvidia para América Latina.

Em qualquer motor gráfico tradicional, os criadores podem facilmente trocar o material de uma forma gerada pelo MoMa 3D, como se vestissem a malha com roupas diferentes. A equipe fez isso com o modelo de trompete, por exemplo, convertendo instantaneamente seu plástico original em ouro, mármore, madeira ou cortiça.

Em seguida, os criadores podem colocar os objetos recém-editados em qualquer cenário virtual. A equipe da Nvidia deixou os instrumentos em uma caixa Cornell, um teste gráfico clássico para a qualidade de renderização. Eles demonstraram que os instrumentos virtuais reagem à luz exatamente como no mundo físico, com os instrumentos de bronze brilhantes apresentando reflexos cintilantes, e as peles de tambor foscas absorvendo luz.

Esses novos objetos, gerados por renderização inversa, podem ser usados como componentes para uma cena animada e complexa, exibida no final do vídeo como uma banda virtual de jazz.

A Nvidia demonstrou essa tecnologia em um vídeo celebrando o jazz em seu local de nascimento, Nova Orleans, onde o artigo sobre o MoMa 3D foi apresentado durante a Conferência sobre Visão Computacional e Reconhecimento de Padrões

O artigo sobre o MoMa 3D foi apresentado em uma sessão na CVPR no dia 22 de junho. É um dos 38 artigos apresentados por autores da Nvidia na conferência.

Serviço
www.nvidia.com/pt-br/omniverse
nvlabs.github.io/nvdiffrec
www.nvidia.com/en-us/events/cvpr
nvlabs.github.io/nvdiffrec
cvpr2022.thecvf.com/overview

Conferência sobre Visão Computacional e Reconhecimento de Padrões em Nova Orleans

David Luebke

Inteligência Artificial -IA

Marcio Aguiar

NVIDIA

Nvidia 3D MoMa

objetos 3D

Pipeline de renderização inversa

As opiniões dos artigos/colunistas aqui publicados refletem exclusivamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da Infor Channel ou qualquer outros envolvidos na publicação. Todos os direitos reservados. É proibida qualquer forma de reutilização, distribuição, reprodução ou publicação parcial ou total deste conteúdo sem prévia autorização da Infor Channel.