Como treinar o agente com documentos (RAG)
Nível: Intermediário
Tempo de leitura: 8 min
O que é RAG
RAG significa Retrieval-Augmented Generation (geração aumentada por recuperação). É a técnica que permite ao agente buscar informações em documentos específicos antes de responder.
Na prática: você sobe os documentos da sua empresa (catálogo de produtos, política de trocas, FAQ interno, manual de serviços) e o agente passa a usar esse material como referência nas respostas. Ele não "decora" o documento: busca os trechos relevantes em tempo real e os usa para fundamentar a resposta.
Requisito: chave OpenAI ativa
A base de conhecimento usa a API da OpenAI para gerar os embeddings (vetores de significado) dos documentos. Por isso, é necessário ter uma chave OpenAI ativa configurada em Minha conta → Integrações de IA antes de fazer upload de qualquer arquivo.
Sem a chave, a área de upload fica desabilitada. Saiba como configurar →
Como adicionar documentos
A base de conhecimento fica na aba Inteligência do formulário do agente. Ela só aparece após o agente ser salvo pela primeira vez.
- Abra o agente desejado e vá até a aba Inteligência
- Role até a seção Arquivos da base de conhecimento (RAG)
- Arraste os arquivos para a área indicada, ou clique para selecionar
- Aguarde o processamento (geralmente menos de 1 minuto por documento)
Formatos aceitos: PDF, TXT, MD, HTML, DOC, DOCX — até 20 MB por arquivo.
Como o processamento funciona
Quando você sobe um documento, a Wevi:
- Extrai o texto: converte PDF, DOCX etc. em texto puro
- Divide em chunks: o texto é quebrado em trechos menores. Cada chunk tem em torno de 800 caracteres, com um pequeno trecho sobreposto ao anterior para não perder contexto na divisão
- Gera embeddings: cada trecho é convertido em um vetor matemático que representa seu significado
- Armazena: os vetores são salvos num banco de dados vetorial
O que é um chunk? Imagine que você tem um manual de 50 páginas. Em vez de entregar o manual inteiro para o agente cada vez que alguém faz uma pergunta, a Wevi descupa o texto em pedaços menores, indexa cada pedaço separadamente e, na hora da pergunta, busca só os pedaços relevantes. Esses pedaços são os chunks. O agente lê apenas os 5 trechos mais pertinentes à pergunta, em vez de varrer o documento inteiro, o que torna as respostas mais precisas e rápidas.
Quando o cliente faz uma pergunta, o agente:
- Converte a pergunta em vetor
- Busca os chunks mais semanticamente próximos
- Injeta esses trechos no contexto antes de responder
O número de chunks injetados por resposta é configurável em Parâmetros → Chunks no contexto (RAG). Entenda esse parâmetro →
Boas práticas para organizar os documentos
Prefira documentos focados a documentos longos. Um PDF de 200 páginas com tudo misturado é menos eficiente que 10 documentos de 20 páginas cada, organizados por tema. A busca vetorial funciona melhor com chunks bem delimitados.
Use títulos e estrutura clara. Documentos com H1, H2, H3 bem definidos geram chunks mais coerentes. Um chunk que começa no meio de um parágrafo sem contexto tende a ser menos útil.
Mantenha os documentos atualizados. Se o preço de um produto mudou, atualize o documento. O agente responde com base no que está na base, e informação desatualizada gera resposta errada.
Separe por tipo de informação. Por exemplo:
produtos.pdf: catálogo completo com especificaçõespolitica-trocas.pdf: política de trocas e devoluçõesfaq.txt: perguntas frequentesprocedimentos-suporte.docx: fluxo de atendimento
Evite informações contraditórias. Se dois documentos tiverem informações conflitantes sobre o mesmo assunto, o agente pode usar qualquer uma. Remova versões antigas.
Testando a base de conhecimento
Após carregar os documentos, faça perguntas que só poderiam ser respondidas com aquele material:
- "Qual o prazo de garantia do produto X?"
- "Como funciona a política de devolução?"
- "Quais são as formas de pagamento?"
Se o agente responder corretamente, a base está funcionando. Se responder com informações genéricas ou incorretas, revise o documento. Provavelmente a informação está mal formatada ou em um chunk confuso.
Se o agente não estiver encontrando informações que você sabe que existem no documento, tente aumentar o valor de Chunks no contexto (RAG) nos parâmetros do agente.
Limitações importantes
O agente não lê tabelas complexas com eficiência. Se o documento tiver uma tabela com células mescladas, a extração pode ficar confusa. Prefira tabelas simples ou converta para texto.
Imagens não são indexadas. Se o PDF contém imagens com texto (scans), o conteúdo não é extraído. Use PDFs com texto selecionável.
Documentos muito longos podem ter cobertura inconsistente. Se uma informação específica estiver em um trecho raro do documento, pode não ser recuperada. Considere criar um arquivo separado com as informações mais importantes.
Limites por plano
| Plano | Total de arquivos |
|---|---|
| Básico | 10 (somando todos os agentes da organização) |
| Pro | Sem limite |
| Ultra | Sem limite |