Central de Ajuda Formatos de arquivo suportados na base de conhecimento

Formatos de arquivo suportados na base de conhecimento

Nível: Iniciante
Tempo de leitura: 4 min


Formatos suportados

Formato Extensão Observações
PDF .pdf Precisa ter texto selecionável. PDFs escaneados (imagem) não são extraídos
Word .docx, .doc Formatação preservada. Imagens ignoradas
Texto puro .txt Ideal para conteúdo simples e limpo
Markdown .md Headings e estrutura são preservados
HTML .html, .htm Conteúdo textual extraído. Scripts e estilos são ignorados

O que não é suportado

  • PDFs escaneados (imagem sem texto selecionável): o agente não consegue ler o conteúdo
  • Planilhas (.xlsx, .xls, .csv): não suportado; converta para .txt ou .md
  • Apresentações (.pptx, .ppt): não suportado; exporte o conteúdo como texto
  • Imagens isoladas (.jpg, .png, .webp): não há extração de texto via OCR
  • Vídeos e áudios: conteúdo multimídia não é indexado
  • Arquivos protegidos por senha: a Wevi não consegue abrir documentos com senha

Dica: se você tem conteúdo em PDF escaneado, use uma ferramenta de OCR (como Adobe Acrobat ou Google Drive) para convertê-lo em PDF com texto pesquisável antes de subir.


Tamanho máximo por arquivo

Plano Tamanho máximo
Básico 20 MB
Pro 20 MB
Ultra 20 MB

Para arquivos maiores, divida em partes menores ou extraia apenas o conteúdo relevante.


Dicas para cada formato

PDF

  • Exporte com texto selecionável (não imprima para PDF)
  • Inclua marcadores e cabeçalhos, pois eles ajudam a estruturar os chunks
  • Evite cabeçalhos e rodapés com informações repetitivas que possam poluir os chunks

Word (.docx / .doc)

  • Prefira .docx quando possível; o suporte é mais robusto
  • Imagens e gráficos dentro do documento são ignorados
  • Tabelas simples são extraídas; tabelas com células mescladas podem gerar ruído

Texto puro (.txt)

  • Use quebras de linha duplas para separar seções
  • Adicione títulos com maiúsculas ou com --- para separadores
  • É o formato mais eficiente em termos de processamento

Markdown (.md)

  • Headings (#, ##, ###) são preservados e ajudam a delimitar os chunks
  • Tabelas em formato Markdown são extraídas com boa fidelidade
  • Ideal para FAQs e documentação técnica

Como verificar se o documento foi processado corretamente

Após o upload, o status do documento muda para:

  • "Processando...": a Wevi está extraindo e indexando o conteúdo
  • "Processado": o documento foi indexado com sucesso

Para verificar a qualidade da indexação, faça uma pergunta ao agente que só poderia ser respondida com aquele documento. Se a resposta estiver correta, o conteúdo foi bem indexado.


Atualização de documentos

Para atualizar um documento existente:

  1. Remova o documento antigo da base de conhecimento
  2. Faça upload da versão atualizada

Não existe função de "substituir": o processo é sempre remover e adicionar. Isso garante que chunks desatualizados sejam completamente eliminados.


Próximos passos