Formatos de arquivo suportados na base de conhecimento

Nível: Iniciante
Tempo de leitura: 4 min

Formatos suportados

Formato	Extensão	Observações
PDF	`.pdf`	Precisa ter texto selecionável. PDFs escaneados (imagem) não são extraídos
Word	`.docx`, `.doc`	Formatação preservada. Imagens ignoradas
Texto puro	`.txt`	Ideal para conteúdo simples e limpo
Markdown	`.md`	Headings e estrutura são preservados
HTML	`.html`, `.htm`	Conteúdo textual extraído. Scripts e estilos são ignorados

O que não é suportado

PDFs escaneados (imagem sem texto selecionável): o agente não consegue ler o conteúdo
Planilhas (.xlsx, .xls, .csv): não suportado; converta para .txt ou .md
Apresentações (.pptx, .ppt): não suportado; exporte o conteúdo como texto
Imagens isoladas (.jpg, .png, .webp): não há extração de texto via OCR
Vídeos e áudios: conteúdo multimídia não é indexado
Arquivos protegidos por senha: a Wevi não consegue abrir documentos com senha

Dica: se você tem conteúdo em PDF escaneado, use uma ferramenta de OCR (como Adobe Acrobat ou Google Drive) para convertê-lo em PDF com texto pesquisável antes de subir.

Tamanho máximo por arquivo

Plano	Tamanho máximo
Básico	20 MB
Pro	20 MB
Ultra	20 MB

Para arquivos maiores, divida em partes menores ou extraia apenas o conteúdo relevante.

Dicas para cada formato

PDF

Exporte com texto selecionável (não imprima para PDF)
Inclua marcadores e cabeçalhos, pois eles ajudam a estruturar os chunks
Evite cabeçalhos e rodapés com informações repetitivas que possam poluir os chunks

Word (.docx / .doc)

Prefira .docx quando possível; o suporte é mais robusto
Imagens e gráficos dentro do documento são ignorados
Tabelas simples são extraídas; tabelas com células mescladas podem gerar ruído

Texto puro (.txt)

Use quebras de linha duplas para separar seções
Adicione títulos com maiúsculas ou com --- para separadores
É o formato mais eficiente em termos de processamento

Markdown (.md)

Headings (#, ##, ###) são preservados e ajudam a delimitar os chunks
Tabelas em formato Markdown são extraídas com boa fidelidade
Ideal para FAQs e documentação técnica

Como verificar se o documento foi processado corretamente

Após o upload, o status do documento muda para:

"Processando...": a Wevi está extraindo e indexando o conteúdo
"Processado": o documento foi indexado com sucesso

Para verificar a qualidade da indexação, faça uma pergunta ao agente que só poderia ser respondida com aquele documento. Se a resposta estiver correta, o conteúdo foi bem indexado.

Atualização de documentos

Para atualizar um documento existente:

Remova o documento antigo da base de conhecimento
Faça upload da versão atualizada

Não existe função de "substituir": o processo é sempre remover e adicionar. Isso garante que chunks desatualizados sejam completamente eliminados.

Próximos passos

←

Boas práticas de escrita para base de conhecimento (RAG-friendly)

Como colocar o agente no seu site

→