Boas práticas para treinar a base de conhecimento
Nível: Intermediário
Tempo de leitura: 7 min
O que é a base de conhecimento e como ela funciona
A base de conhecimento é o repositório de informações que o agente consulta antes de responder. Quando o usuário faz uma pergunta, o sistema busca nos documentos os trechos mais relevantes e os entrega ao modelo junto com a pergunta. O modelo usa esse conteúdo para formular uma resposta precisa.
A qualidade das respostas depende diretamente da qualidade dos documentos. Um agente com base de conhecimento ruim vai errar mesmo com um prompt excelente.
O que colocar na base de conhecimento
Bons candidatos:
- FAQ com perguntas e respostas reais de clientes
- Catálogo de produtos ou serviços com especificações
- Políticas da empresa (reembolso, entrega, garantia, privacidade)
- Tabelas de preços e condições comerciais
- Procedimentos e instruções passo a passo
- Regulamentos internos ou contratos simplificados
O que não colocar:
- Documentos com informações desatualizadas (desorganizam mais do que ajudam)
- Arquivos com muito conteúdo irrelevante para o escopo do agente
- Apresentações com muito texto em imagem (não são lidas pelo sistema)
- PDFs gerados a partir de scans sem camada de texto
Como organizar os documentos
Prefira arquivos focados a documentos genéricos
Um arquivo de 10 páginas sobre política de devolução é mais eficiente do que um manual geral de 80 páginas onde essa política aparece em três parágrafos espalhados.
O sistema divide os documentos em chunks antes de indexar. Documentos focados garantem que os chunks relevantes fiquem próximos uns dos outros, melhorando a qualidade da busca.
Use títulos e estrutura clara
O agente entende melhor documentos com hierarquia clara: títulos (#, ##), listas e parágrafos curtos. Blocos densos de texto sem formatação reduzem a precisão das respostas.
Separe documentos por assunto
Em vez de um grande documento com tudo, crie arquivos separados por tema:
politica-de-devolucao.pdf
tabela-de-precos-2024.pdf
perguntas-frequentes-entrega.txt
guia-de-instalacao-produto-x.pdf
Isso facilita a manutenção (atualizar um arquivo não afeta os outros) e melhora a qualidade do retrieval.
Parâmetros de configuração
A Wevi permite ajustar como os documentos são processados. Os controles de chunk aparecem no modal "Confirmar envio" ao selecionar arquivos para upload: clique em Avançado para expandi-los. O número de chunks recuperados por consulta fica na aba Inteligência, seção Parâmetros, controle Chunks no contexto (RAG).
| Parâmetro | Padrão | O que faz |
|---|---|---|
| Tamanho do chunk | 800 caracteres | Define o tamanho máximo de cada fragmento de texto indexado |
| Overlap entre chunks | 160 caracteres | Quantidade de texto compartilhada entre chunks consecutivos |
| Chunks no contexto (RAG) | 5 | Número de chunks recuperados por consulta |
Quando ajustar o tamanho do chunk
- Chunks menores (400-600 caracteres): úteis para documentos com muitos tópicos distintos, onde precisão é mais importante que contexto. Bom para FAQs.
- Chunks maiores (900-1200 caracteres): úteis quando as respostas dependem de contexto estendido, como procedimentos com várias etapas relacionadas.
Quando ajustar Chunks no contexto (RAG)
- Valor menor (3): quando o agente está trazendo informações irrelevantes nas respostas, misturando assuntos
- Valor maior (8-10): quando o agente não encontra a informação certa em documentos com muito conteúdo sobre o mesmo tema
Mantendo a base atualizada
Uma base de conhecimento desatualizada é perigosa: o agente responde com convicção sobre algo que mudou.
Boas práticas de manutenção:
- Defina um responsável por atualizar os documentos quando houver mudanças de produto, preço ou política
- Remova arquivos obsoletos antes de subir versões novas
- Após qualquer atualização, teste as perguntas relacionadas para confirmar que o agente está usando o conteúdo novo
Testando a base de conhecimento
Depois de subir documentos, faça perguntas que só podem ser respondidas com o conteúdo daquele arquivo:
- Pergunta direta: "Qual é o prazo de devolução?"
- Pergunta indireta: "Comprei um produto com defeito, o que faço?"
- Pergunta com variação de linguagem: "Posso trocar algo que não gostei?"
Se o agente errar em algum desses casos, verifique:
- O arquivo está com status "Processado" na base de conhecimento?
- A informação está explícita no documento ou está implícita demais?
- O chunk que contém a resposta não ficou fragmentado de forma estranha?
Complementando com o prompt
Base de conhecimento e prompt trabalham juntos. Algumas informações funcionam melhor diretamente no prompt:
- Informações curtas e absolutamente fixas (horário de funcionamento, telefone)
- Respostas a perguntas que ocorrem em praticamente todas as conversas
- Instruções sobre como usar a base (ex: "sempre verifique os documentos antes de responder sobre preços")
Informações longas, que mudam frequentemente ou que precisam de busca contextual ficam melhor na base de conhecimento.