segunda-feira - 08 / dezembro / 2025

Introdução à IA generativa

A IA generativa pode produzir conteúdo novo a partir do prompt de comando escrito pelo usuário. O ChatGPT é o exemplo mais conhecido.

Conceitos importantes de IA generativa

Redes adversárias generativas (GAN)

Duas redes neurais de aprendizado profundo, recebem um grande volume de dados vindo de várias fontes, e identificam padrões, relações e estruturas. A rede neural geradora produz novos dados com variações aleatórias das informações originais. Enquanto a rede neural discriminadora compara os dados produzidos pela rede geradora com os dados de treinamento, para verificar a veracidade dos dados produzidos.

fluxograma da ia generativa

Ambas as redes recebem informações sobre o resultado da verificação se os dados são verdadeiros ou falsos. Então, o gerador produz conteúdo para induzir o discriminador a classificar a informação gerada como verdadeira, ao mesmo tempo, o discriminador aprende com os erros na classificação e melhora a sua capacidade de verificar se a informação é verdadeira ou falsa. O treinamento termina quando a rede discriminadora não consegue mais distinguir os dados reais dos produzidos pela rede geradora.

Transformador

Foi introduzido em 2017, em um artigo chamado “Attention is all you need” (Atenção é tudo que você precisa). É uma arquitetura de rede neural que realiza tarefas em Processamento de Linguagem Natural. Consiste em um codificador (encoder) e um decodificador (decoder). O codificador recebe uma frase, divide-a em palavras ou partes destas em tokens. Cada token possui uma sequência numérica, ou vetor, chamado de embedding, que representa o significado da palavra, posição na frase, contexto, etc. O decodificador recebe os vetores, calcula os pesos de cada um e produz dados na saída com base nos valores dos vetores.

transformador em ia generativa
É uma arquitetura muito útil para fazer traduções. Neste exemplo, o transformador traduz uma frase em inglês para o japonês. Fonte: Mpost.

Além de traduções, também serve para sumarização e criação de textos. Alguns tranformadores possuem vários codificadores e decodificadores, para melhor qualidade no resultado.

Modelos de difusão

São usados no processo de difusão estável, que produz imagens originais a partir de texto. Os modelos de difusão fazem os processos de difusão direta e reversa.

Na difusão direta (Forward Diffusion), o modelo adiciona ruído aleatório gradualmente nas imagens reais de treinamento, até as imagens se tornarem ruído puro. Com uma rede neural UNet, treinada para prever o padrão de ruído, o modelo remove o ruído até a imagem se tornar bem definida. Este é o processo de difusão reversa (Reverse Diffusion). Fonte: Codoraven.

Limitações da IA generativa

A IA generativa pode fazer traduções, produzir textos coerentes, imagens, áudios, vídeos e algoritmos de linguagem de programação. Além de uma grande quantidade de dados, uma grande velocidade de processamento também é necessária. No entanto, pode produzir alucinações, que são informações incorretas a partir de dados de entrada incorretos, ambíguos ou incompletos.

Mais detalhes sobre estes e outros conceitos de IA generativa serão explicados em futuros posts.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -

Últimos posts