Formatos de arquivo suportados na base de conhecimento
Nível: Iniciante
Tempo de leitura: 4 min
Formatos suportados
| Formato | Extensão | Observações |
|---|---|---|
.pdf |
Precisa ter texto selecionável. PDFs escaneados (imagem) não são extraídos | |
| Word | .docx, .doc |
Formatação preservada. Imagens ignoradas |
| Texto puro | .txt |
Ideal para conteúdo simples e limpo |
| Markdown | .md |
Headings e estrutura são preservados |
| HTML | .html, .htm |
Conteúdo textual extraído. Scripts e estilos são ignorados |
O que não é suportado
- PDFs escaneados (imagem sem texto selecionável): o agente não consegue ler o conteúdo
- Planilhas (
.xlsx,.xls,.csv): não suportado; converta para.txtou.md - Apresentações (
.pptx,.ppt): não suportado; exporte o conteúdo como texto - Imagens isoladas (
.jpg,.png,.webp): não há extração de texto via OCR - Vídeos e áudios: conteúdo multimídia não é indexado
- Arquivos protegidos por senha: a Wevi não consegue abrir documentos com senha
Dica: se você tem conteúdo em PDF escaneado, use uma ferramenta de OCR (como Adobe Acrobat ou Google Drive) para convertê-lo em PDF com texto pesquisável antes de subir.
Tamanho máximo por arquivo
| Plano | Tamanho máximo |
|---|---|
| Básico | 20 MB |
| Pro | 20 MB |
| Ultra | 20 MB |
Para arquivos maiores, divida em partes menores ou extraia apenas o conteúdo relevante.
Dicas para cada formato
- Exporte com texto selecionável (não imprima para PDF)
- Inclua marcadores e cabeçalhos, pois eles ajudam a estruturar os chunks
- Evite cabeçalhos e rodapés com informações repetitivas que possam poluir os chunks
Word (.docx / .doc)
- Prefira
.docxquando possível; o suporte é mais robusto - Imagens e gráficos dentro do documento são ignorados
- Tabelas simples são extraídas; tabelas com células mescladas podem gerar ruído
Texto puro (.txt)
- Use quebras de linha duplas para separar seções
- Adicione títulos com maiúsculas ou com
---para separadores - É o formato mais eficiente em termos de processamento
Markdown (.md)
- Headings (
#,##,###) são preservados e ajudam a delimitar os chunks - Tabelas em formato Markdown são extraídas com boa fidelidade
- Ideal para FAQs e documentação técnica
Como verificar se o documento foi processado corretamente
Após o upload, o status do documento muda para:
- "Processando...": a Wevi está extraindo e indexando o conteúdo
- "Processado": o documento foi indexado com sucesso
Para verificar a qualidade da indexação, faça uma pergunta ao agente que só poderia ser respondida com aquele documento. Se a resposta estiver correta, o conteúdo foi bem indexado.
Atualização de documentos
Para atualizar um documento existente:
- Remova o documento antigo da base de conhecimento
- Faça upload da versão atualizada
Não existe função de "substituir": o processo é sempre remover e adicionar. Isso garante que chunks desatualizados sejam completamente eliminados.