A IA generativa (GenAI) é a tecnologia do momento, todo mundo fala a respeito, mas poucos conhecem o seu funcionamento. Em um artigo publicado no blog da companhia, Jared Spataro, vice-presidente corporativo de IA no Trabalho da Microsoft, explica como é a anatomia de um copiloto de GenAI. “Meu trabalho envolve ajudar as empresas a trazer a IA para o trabalho com sucesso e converso com os clientes todos os dias. Nessas conversas, muitas das pessoas com quem falo se concentram em modelos fundamentais, normalmente os grandes modelos de linguagem (LLMs) que ajudam a alimentar os assistentes de IA”, disse Spataro. “Mas os LLMs – que receberam a maior parte da atenção na conversa pública sobre IA – são apenas um elemento de um sistema de IA mais amplo. Se o sistema for um carro, pense no LLM como o motor. Mas um carro não pode pegar a estrada sem alguns outros elementos-chave, como rodas, direção, combustível e muito mais”, explicou.
Componentes principais
Como os assistentes de IA trabalham ao nosso lado, pensamos neles como copilotos, na verdade, é por isso que chamamos nosso próprio assistente de IA de Microsoft Copilot. Mas todo sistema de IA, seja da Microsoft, ChatGPT, Google ou qualquer outro provedor, tem algumas peças-chave universais:
A experiência do usuário: este é o ponto de entrada no copiloto, onde você interage com o sistema por meio de prompts de texto, áudio ou visuais para obter as respostas necessárias.
O orquestrador: como hub central do sistema, o orquestrador supervisiona o planejamento e a coordenação. Quando você digita um prompt, ele determina quais partes do sistema podem responder às suas necessidades.
Modelo fundamental: pense nos modelos fundamentais como “mecanismos de raciocínio” alimentados por IA que analisam informações para responder a perguntas ou resolver problemas. Muitas vezes, este é um LLM treinado em grandes quantidades de texto, mas existem muitos outros tipos de modelos por aí, cada um com seus próprios pontos fortes, fracos e casos de uso ideais.
Às vezes, você pode obter o que precisa de um sistema que possui apenas esses elementos principais, disse Spataro. Pergunte algo direto, como “O que é um ótimo carro inicial para um novo motorista?” e você receberá sugestões úteis e específicas. Mas você também pode tentar perguntas mais inesperadas, como “Um elefante poderia puxar minha Tundra?” (claro, não é algo que eu recomendaria fazer na vida real). O copiloto pode reunir o que o LLM sabe sobre vários tópicos e, em seguida, aplicar o raciocínio com base em todos esses dados.
Nesse caso, quando fiz essa pergunta ao Copilot, o sistema inferiu corretamente que eu estava falando do meu Toyota Tundra. Ele respondeu: “Teoricamente, um elefante poderia puxar sua Tundra” e explicou seu raciocínio: os elefantes asiáticos são conhecidos por puxar pesos mais pesados do que uma Tundra. Também ofereceu uma mensagem de não tente fazer isso em casa: “Este não é um uso prático ou humano da força de um elefante”.
“Esse é um começo impressionante, mas é mais parecido com um truque de festa do que com uma solução de negócios. Em um ambiente de trabalho, você precisa de um sistema mais completo. Os elementos centrais de um copiloto são bons em raciocinar com base no conhecimento geral, mas não são suficientes quando se trata de trazer o conhecimento e as habilidades específicas que podem diferenciar sua empresa. Vejamos o porquê”, continuou Spataro.
Os modelos básicos do conhecimento têm uma limitação importante: eles são treinados em um conjunto finito de informações. Portanto, se sua pergunta estiver relacionada a algo não incluído nos dados de treinamento, eles ficarão aquém.
Mas existem maneiras de contornar essa limitação. Ou seja, você pode dar ao orquestrador acesso a novos conhecimentos ou fontes de dados. Por exemplo, quando o orquestrador pode extrair de seus dados de trabalho (e-mails, arquivos, reuniões etc.), ele é infinitamente mais inteligente sobre sua empresa e suas necessidades.
Digamos que você seja um profissional de marketing automotivo. Você pode fazer uma pergunta como: “Sou um profissional de marketing que lidera o lançamento de um novo SUV elétrico e preciso redigir um resumo criativo para nossa agência desenvolver uma campanha publicitária nacional na televisão. Uma ideia é apresentar animais selvagens, incluindo elefantes.
Em seguida, você pode apontar o sistema para as fotos do produto, arquivos que descrevem suas especificações específicas e outras entradas, para que ele entenda o assunto de forma mais ampla e profunda. Se você incluir esses recursos, obterá um resultado muito diferente. Isso porque o padrão crítico no uso de copilotos nos negócios agora é fundamentar o LLM em seus próprios dados muito particulares.
Com um prompt como esse, o orquestrador pode reunir o know-how geral do LLM (os elementos necessários em um briefing criativo típico) com o conhecimento específico da sua empresa (os detalhes do seu novo SUV).
Toda vez que seu copiloto extrai de fontes de conhecimento mais profundas ou mais específicas, ele fornece respostas melhores, mais precisas e acionáveis. Mas há um elemento adicional que aumenta ainda mais o nível de um copiloto.
Habilidades
A maioria dos modelos fundamentais vem com recursos inerentes, como a capacidade de resumir informações ou escrever novos conteúdos. Mas eles não são tão bons em outras habilidades importantes, como matemática, desenho ou design – todas as coisas que os humanos fazem todos os dias no trabalho. Para ampliar as capacidades do seu copiloto, você precisa dar a ele algumas habilidades adicionais.
“Digamos que você seja um líder criativo na agência de publicidade que trabalha nessa campanha para o SUV elétrico. Dentro do ecossistema da Microsoft, você pode pedir ajuda ao Image Creator do Designer para criar um storyboard de um conceito. Você pode começar seu prompt com: “Crie uma série de imagens para um anúncio de TV com um SUV elétrico dirigindo pela savana ao pôr do sol. Na primeira imagem, vemos o SUV emergir de trás de um matagal de grama alta…”, contou Spataro.
Em outras palavras, seu copiloto pode ajudá-lo a criar storyboards ásperos instantaneamente – e você pode criá-los durante uma reunião para dar vida ao seu conceito enquanto todos estão fazendo um brainstorming. Dessa forma, você tira as ideias fracas do caminho rapidamente e pode passar mais tempo se concentrando nas fortes.
A criação de imagens é apenas um exemplo de habilidade de copiloto. A capacidade de codificar, automatizar processos de negócios complexos, tornar grandes bancos de dados de informações instantaneamente acessíveis com IA – cada um representa novas habilidades que você pode ativar para seu copiloto.
Resumindo
Há muito hype em torno de modelos fundamentais, e muito desse hype é bem merecido. Eles são a tecnologia que abriu este novo capítulo na inovação da IA. Mas, embora sejam uma parte importante do sistema, são apenas uma parte. Ao orquestrar cuidadosamente as interações entre o usuário, o conhecimento, as habilidades e os modelos fundamentais, o copiloto se torna ainda mais poderoso do que a soma de suas partes. Esse é o verdadeiro desbloqueio que agregará valor ao trabalho que você faz todos os dias – de modo que, ao pisar no acelerador, você terminará exatamente onde precisa ir.
Leia nesta edição:
MATÉRIA DE CAPA | TECNOLOGIA
O salto do Supply Chain
SEGURANÇA DA INFORMAÇÃO
Superações na Segurança de Dados
CARREIRA
A arte de navegar em meio à tempestade
Esta você só vai ler na versão digital
APLICAÇÃO
O mundo cabe dentro de um token
Baixe o nosso aplicativo