Como treinar o agente com documentos (RAG)

Nível: Intermediário
Tempo de leitura: 8 min

O que é RAG

RAG significa Retrieval-Augmented Generation (geração aumentada por recuperação). É a técnica que permite ao agente buscar informações em documentos específicos antes de responder.

Na prática: você sobe os documentos da sua empresa (catálogo de produtos, política de trocas, FAQ interno, manual de serviços) e o agente passa a usar esse material como referência nas respostas. Ele não "decora" o documento: busca os trechos relevantes em tempo real e os usa para fundamentar a resposta.

Requisito: chave OpenAI ativa

A base de conhecimento usa a API da OpenAI para gerar os embeddings (vetores de significado) dos documentos. Por isso, é necessário ter uma chave OpenAI ativa configurada em Minha conta → Integrações de IA antes de fazer upload de qualquer arquivo.

Sem a chave, a área de upload fica desabilitada. Saiba como configurar →

Como adicionar documentos

A base de conhecimento fica na aba Inteligência do formulário do agente. Ela só aparece após o agente ser salvo pela primeira vez.

Abra o agente desejado e vá até a aba Inteligência
Role até a seção Arquivos da base de conhecimento (RAG)
Arraste os arquivos para a área indicada, ou clique para selecionar. Você pode enviar até 100 arquivos de uma vez
Se quiser, preencha a URL de origem de cada arquivo (opcional). Veja para que serve logo abaixo
Clique em Enviar e aguarde o processamento (geralmente menos de 1 minuto por documento)

Formatos aceitos: PDF, TXT, MD, HTML, DOC, DOCX, até 20 MB por arquivo.

URL de origem (para o agente citar a fonte)

Cada documento pode ter uma URL de origem opcional, por exemplo o link da página ou do artigo de onde o conteúdo veio. Você preenche no momento do envio, ou depois, na lista de arquivos (botão Adicionar URL ou o ícone de editar). Como a URL não faz parte da vetorização, dá para adicionar ou mudar a qualquer momento sem reprocessar o arquivo.

Para que serve: quando o agente usa uma informação da base para responder, ele passa a saber de qual documento e de qual link aquela informação veio. Assim você pode pedir, no prompt do agente, que ele ofereça o link como leitura adicional ou cite a fonte.

Importante: o agente não envia o link sozinho. Esse comportamento é decisão sua, no prompt. Por exemplo, você pode escrever: "Quando usar uma informação da base de conhecimento, ofereça ao cliente o link da fonte para ele se aprofundar." Se você não pedir nada, a URL fica disponível, mas o agente não compartilha por conta própria. Veja como configurar o prompt do agente.

Como o processamento funciona

Quando você sobe um documento, a Wevi:

Extrai o texto: converte PDF, DOCX etc. em texto puro
Divide em chunks: o texto é quebrado em trechos menores. Cada chunk tem em torno de 800 caracteres, com um pequeno trecho sobreposto ao anterior para não perder contexto na divisão
Gera embeddings: cada trecho é convertido em um vetor matemático que representa seu significado
Armazena: os vetores são salvos num banco de dados vetorial

O que é um chunk? Imagine que você tem um manual de 50 páginas. Em vez de entregar o manual inteiro para o agente cada vez que alguém faz uma pergunta, a Wevi separa o texto em pedaços menores, indexa cada pedaço separadamente e, na hora da pergunta, busca só os pedaços relevantes. Esses pedaços são os chunks. O agente lê apenas os 5 trechos mais pertinentes à pergunta, em vez de varrer o documento inteiro, o que torna as respostas mais precisas e rápidas.

Quando o cliente faz uma pergunta, o agente:

Converte a pergunta em vetor
Busca os chunks mais semanticamente próximos
Injeta esses trechos no contexto antes de responder

O número de chunks injetados por resposta é configurável em Parâmetros → Chunks no contexto (RAG). Entenda esse parâmetro →

Boas práticas para organizar os documentos

Prefira documentos focados a documentos longos. Um PDF de 200 páginas com tudo misturado é menos eficiente que 10 documentos de 20 páginas cada, organizados por tema. A busca vetorial funciona melhor com chunks bem delimitados.

Use títulos e estrutura clara. Documentos com H1, H2, H3 bem definidos geram chunks mais coerentes. Um chunk que começa no meio de um parágrafo sem contexto tende a ser menos útil.

Mantenha os documentos atualizados. Se o preço de um produto mudou, atualize o documento. O agente responde com base no que está na base, e informação desatualizada gera resposta errada.

Separe por tipo de informação. Por exemplo:

produtos.pdf: catálogo completo com especificações
politica-trocas.pdf: política de trocas e devoluções
faq.txt: perguntas frequentes
procedimentos-suporte.docx: fluxo de atendimento

Evite informações contraditórias. Se dois documentos tiverem informações conflitantes sobre o mesmo assunto, o agente pode usar qualquer uma. Remova versões antigas.

Testando a base de conhecimento

Após carregar os documentos, faça perguntas que só poderiam ser respondidas com aquele material:

"Qual o prazo de garantia do produto X?"
"Como funciona a política de devolução?"
"Quais são as formas de pagamento?"

Se o agente responder corretamente, a base está funcionando. Se responder com informações genéricas ou incorretas, revise o documento. Provavelmente a informação está mal formatada ou em um chunk confuso.

Se o agente não estiver encontrando informações que você sabe que existem no documento, tente aumentar o valor de Chunks no contexto (RAG) nos parâmetros do agente.

Limitações importantes

O agente não lê tabelas complexas com eficiência. Se o documento tiver uma tabela com células mescladas, a extração pode ficar confusa. Prefira tabelas simples ou converta para texto.

Imagens não são indexadas. Se o PDF contém imagens com texto (scans), o conteúdo não é extraído. Use PDFs com texto selecionável.

Documentos muito longos podem ter cobertura inconsistente. Se uma informação específica estiver em um trecho raro do documento, pode não ser recuperada. Considere criar um arquivo separado com as informações mais importantes.

Limites por plano

Plano	Total de arquivos
Básico	10 (somando todos os agentes da organização)
Pro	Sem limite
Ultra	Sem limite

Compartilhando documentos entre vários agentes

Se você tem vários agentes que precisam das mesmas informações (catálogo, política de trocas, FAQ), pode criar uma Biblioteca em Configurações e vinculá-la a todos eles. Atualiza uma vez, todos os agentes usam a versão nova.

Veja também: Bibliotecas de conhecimento compartilhadas entre agentes →

Próximos passos

←

Como lidar com clientes insatisfeitos dentro do fluxo

Bibliotecas de conhecimento compartilhadas entre agentes

→