por Christian Zambra
Este é um artigo curto sobre algo simples de com grande resultado, que fizemos nesta semana.
RAG é uma técnica utilizada em AI Agents para reduzir as alucinações. Aqui fizemos isso manualmente com imagens, e o mesmo modelo pode ser automatizado via Python.
Durante um workshop sobre Inteligência Artificial - Prompt Engineering Básico - para as Startups do Expo Favela, quando estavamos apresentando o Gemini - Nano Banana (sistema para geração de imagens por GenAI), uma das empreendedoras falou de sua Startup, que atua resgatando tradições africanas e perguntou por imagens que ilustrassem seu trabalho. Questionamento similar veio de uma empreendedora que atua resgatando tradições indígenas.
Como era esperado para questões tão específicas, e com poucos dados disponíveis para treinamento, os sistemas inicialmente alucinaram. Porém, com uma técnica muito simples, combinando o conhecimento compartilhado no workshop, técnicas de prompt engineering e as capacidades do Nano Banana, chegamos a resultados incríveis.
Primeiro, pesquisamos usando o Gemini 2.5 flash (solicitando que o sistema trouxesse links para as referencias) por símbolos da arte Adinkra, com o seguinte prompt:
"Por favor, faça uma pesquisa sobre arte africana adrinka. Traga somente links de exemplos da arte Adrinka, com referencias seguras."
A partir dos resultados, usando o Nano Banana via Gemini, escolhemos um dos padrões, anexamos a imagem no prompt e colocamos junto o seguinte texto:
"Crie uma almofada com estes motivos. Estes motivos de arte Adrinka são parte da cultura africana, então não altere em hipótese alguma tais motivos. Somente os coloque em uma almofada. "
O resultado segue abaixo. Criamos uma imagem que pode ilustrar o instagram ou site, e servir como protótipo de um produto, no que diz respeito a imagem dele.
Primeiro, pesquisamos, usando o Gemini 2.5 Flash, símbolos da cultura indígena Marajoara, utilizando o seguinte prompt:
"Por favor pesquise simbolos indigenas marajoaras. Pesquise somente fontes reais e fidedignas como wikipedia, etc. Traga os links para que eu possa consultar."
A partir dos resultados, selecionamos um dos padrões, e usando o Nano Banana a partir do Gemini, anexamos a imagem e o seguinte prompt:
"Por favor, crie o design de uma bata tendo por inspiração o icone marajoara em anexo."
O resultado segue abaixo:
Assim, usando Gemini e Nano Banana, nós conseguimos contornar alucinações, direcionando o modelo com fontes confiáveis (grounding) e usando essas fontes para gerar imagens (RAG). Essa técnica simples gerou valor para estas empreendedoras, que estão resgarando tradições que são parte das história do povo brasileiro.
Fiquei muito feliz e orgulhoso em poder ser parte disso, ensimando um pouco do que sei sobre Prompt Engineering e Inteligência artificial, e vendo isso ser transformado em algo útil e de valor, durante o workshop, com essas empreendedoras incríveis!
Expo Favela: www.expofavela.com.br