Central de Ajuda Boas práticas para treinar a base de conhecimento

Boas práticas para treinar a base de conhecimento

Nível: Intermediário
Tempo de leitura: 7 min


O que é a base de conhecimento e como ela funciona

A base de conhecimento é o repositório de informações que o agente consulta antes de responder. Quando o usuário faz uma pergunta, o sistema busca nos documentos os trechos mais relevantes e os entrega ao modelo junto com a pergunta. O modelo usa esse conteúdo para formular uma resposta precisa.

A qualidade das respostas depende diretamente da qualidade dos documentos. Um agente com base de conhecimento ruim vai errar mesmo com um prompt excelente.


O que colocar na base de conhecimento

Bons candidatos:

  • FAQ com perguntas e respostas reais de clientes
  • Catálogo de produtos ou serviços com especificações
  • Políticas da empresa (reembolso, entrega, garantia, privacidade)
  • Tabelas de preços e condições comerciais
  • Procedimentos e instruções passo a passo
  • Regulamentos internos ou contratos simplificados

O que não colocar:

  • Documentos com informações desatualizadas (desorganizam mais do que ajudam)
  • Arquivos com muito conteúdo irrelevante para o escopo do agente
  • Apresentações com muito texto em imagem (não são lidas pelo sistema)
  • PDFs gerados a partir de scans sem camada de texto

Como organizar os documentos

Prefira arquivos focados a documentos genéricos

Um arquivo de 10 páginas sobre política de devolução é mais eficiente do que um manual geral de 80 páginas onde essa política aparece em três parágrafos espalhados.

O sistema divide os documentos em chunks antes de indexar. Documentos focados garantem que os chunks relevantes fiquem próximos uns dos outros, melhorando a qualidade da busca.

Use títulos e estrutura clara

O agente entende melhor documentos com hierarquia clara: títulos (#, ##), listas e parágrafos curtos. Blocos densos de texto sem formatação reduzem a precisão das respostas.

Separe documentos por assunto

Em vez de um grande documento com tudo, crie arquivos separados por tema:

politica-de-devolucao.pdf
tabela-de-precos-2024.pdf
perguntas-frequentes-entrega.txt
guia-de-instalacao-produto-x.pdf

Isso facilita a manutenção (atualizar um arquivo não afeta os outros) e melhora a qualidade do retrieval.


Parâmetros de configuração

A Wevi permite ajustar como os documentos são processados. Os controles de chunk aparecem no modal "Confirmar envio" ao selecionar arquivos para upload: clique em Avançado para expandi-los. O número de chunks recuperados por consulta fica na aba Inteligência, seção Parâmetros, controle Chunks no contexto (RAG).

Parâmetro Padrão O que faz
Tamanho do chunk 800 caracteres Define o tamanho máximo de cada fragmento de texto indexado
Overlap entre chunks 160 caracteres Quantidade de texto compartilhada entre chunks consecutivos
Chunks no contexto (RAG) 5 Número de chunks recuperados por consulta

Quando ajustar o tamanho do chunk

  • Chunks menores (400-600 caracteres): úteis para documentos com muitos tópicos distintos, onde precisão é mais importante que contexto. Bom para FAQs.
  • Chunks maiores (900-1200 caracteres): úteis quando as respostas dependem de contexto estendido, como procedimentos com várias etapas relacionadas.

Quando ajustar Chunks no contexto (RAG)

  • Valor menor (3): quando o agente está trazendo informações irrelevantes nas respostas, misturando assuntos
  • Valor maior (8-10): quando o agente não encontra a informação certa em documentos com muito conteúdo sobre o mesmo tema

Mantendo a base atualizada

Uma base de conhecimento desatualizada é perigosa: o agente responde com convicção sobre algo que mudou.

Boas práticas de manutenção:

  • Defina um responsável por atualizar os documentos quando houver mudanças de produto, preço ou política
  • Remova arquivos obsoletos antes de subir versões novas
  • Após qualquer atualização, teste as perguntas relacionadas para confirmar que o agente está usando o conteúdo novo

Testando a base de conhecimento

Depois de subir documentos, faça perguntas que só podem ser respondidas com o conteúdo daquele arquivo:

  1. Pergunta direta: "Qual é o prazo de devolução?"
  2. Pergunta indireta: "Comprei um produto com defeito, o que faço?"
  3. Pergunta com variação de linguagem: "Posso trocar algo que não gostei?"

Se o agente errar em algum desses casos, verifique:

  • O arquivo está com status "Processado" na base de conhecimento?
  • A informação está explícita no documento ou está implícita demais?
  • O chunk que contém a resposta não ficou fragmentado de forma estranha?

Complementando com o prompt

Base de conhecimento e prompt trabalham juntos. Algumas informações funcionam melhor diretamente no prompt:

  • Informações curtas e absolutamente fixas (horário de funcionamento, telefone)
  • Respostas a perguntas que ocorrem em praticamente todas as conversas
  • Instruções sobre como usar a base (ex: "sempre verifique os documentos antes de responder sobre preços")

Informações longas, que mudam frequentemente ou que precisam de busca contextual ficam melhor na base de conhecimento.


Próximos passos