Quanto custa pra IA processar o PDF que você jogou nela ontem?
Não falo de assinatura do Claude Pro nem do ChatGPT Plus. Falo de token. Token é a unidade que a IA conta cada palavra, cada caractere, cada metadado de arquivo. Mais token consumido, menos uso por mês no mesmo plano.
Um PDF de 30 páginas pode consumir entre 25 mil e 50 mil tokens. Se você faz cinco análises de contrato no dia, atinge o limite do plano antes do almoço e fica até a noite sem conseguir usar.
A Microsoft soltou uma ferramenta gratuita chamada MarkItDown que resolve esse problema. Mais de 100 mil estrelas no GitHub em poucos meses, o que pra um projeto open source é assinatura de adoção forte. Está disponível no endereço oficial github.com/microsoft/markitdown.
O problema que MarkItDown resolve
PDF foi feito pra impressora, não pra inteligência artificial. Cada elemento visual, layout, fonte, tabela, imagem, vira metadado que a IA precisa interpretar. Quando você envia o arquivo bruto, ela gasta token só pra decodificar a estrutura antes de fazer o trabalho que importa.
Markdown é o oposto. Texto puro, com marcação mínima de cabeçalho, lista e tabela. A IA lê em poucos tokens, processa mais rápido e devolve resposta melhor porque entende o conteúdo em vez de gastar processamento decodificando layout.
Pra você dimensionar o impacto:
| Mesmo PDF de 30 páginas | Tokens consumidos | Tempo de resposta |
| Enviado bruto pro Claude | ~40.000 | ~12 segundos |
| Convertido com MarkItDown | ~12.000 | ~4 segundos |
| Economia | 70% | 67% |
Multiplica isso por 30 dias de uso. A diferença entre estourar o plano e ter folga sobrando.
Resumo do mecanismo: arquivo pesado entra, texto leve sai, IA processa mais barato, plano dura mais tempo, custo operacional cai sem mudar de assinatura.
Antes de instalar: o único pré-requisito
MarkItDown roda em Python 3.10 ou superior. Mac já vem com Python nativo. Windows precisa baixar do site oficial python.org (5 minutos). Linux geralmente já tem.
Pra checar se você já tem Python instalado, abre o terminal:
| Sistema | Como abrir o terminal |
| Mac | Cmd + Espaço, digita "Terminal", Enter |
| Windows | Tecla Windows, digita "PowerShell", Enter |
| Linux | Ctrl + Alt + T |
Dentro do terminal, digita python3 --version e aperta Enter. Se aparecer 3.10 pra cima, está pronto. Se aparecer versão menor ou erro, instala pelo site python.org antes de seguir.
O guia passo a passo (~10 min pra instalar)
01 Instalar MarkItDown completo (2 min)
Esse é o comando oficial do GitHub. Cola no terminal e aperta Enter:
pip install 'markitdown[all]'
O [all] baixa todos os conversores de uma vez (PDF, Word, Excel, PowerPoint, áudio, YouTube). Demora de 30 segundos a 2 minutos dependendo da sua internet.
02 Confirmar instalação (30 seg)
Roda esse comando pra confirmar que instalou direito:
markitdown --help
Se aparecer uma tela de ajuda com a lista de opções, está instalado e funcionando. Se aparecer erro command not found, reinicia o terminal e tenta de novo.
03 Converter seu primeiro arquivo (1 min)
Coloca um PDF qualquer na pasta atual do terminal (pode ser um contrato, um relatório, qualquer coisa). Roda:
markitdown contrato.pdf -o contrato.md
Em poucos segundos, o arquivo contrato.md aparece na mesma pasta, com o conteúdo do PDF convertido em Markdown limpo.
04 Usar dentro da IA (resto da economia)
Abre contrato.md num editor de texto (TextEdit, Notepad, VS Code, qualquer um). Copia o conteúdo. Cola no Claude ou ChatGPT em vez de subir o PDF bruto.
Pronto. A partir de agora, todo arquivo passa por essa ponte antes de chegar na IA.
Instalação seletiva (se não quiser tudo)
Se sua operação só precisa de PDF e Word, dá pra instalar só os conversores necessários e ficar mais leve no disco.
| Necessidade | Comando |
| Só PDF, Word e PowerPoint | pip install 'markitdown[pdf, docx, pptx]' |
| Só Excel | pip install 'markitdown[xlsx]' |
| YouTube (transcrição automática) | pip install 'markitdown[youtube-transcription]' |
| Áudio (transcrição automática) | pip install 'markitdown[audio-transcription]' |
Pra empresário que está começando, recomendo o pacote completo [all]. Vale os poucos megabytes a mais pela flexibilidade.
Os 12 formatos que MarkItDown converte
Praticamente qualquer arquivo que entra na sua mesa pode virar matéria prima pra um funcionário digital, sem custo extra.
| Formato | Caso de uso pro empresário |
| PDF | Contrato, proposta comercial, relatório, e-book |
| Word (DOCX) | Procedimento interno, manual, ata de reunião |
| Excel (XLSX) e CSV | Planilha de cliente, relatório financeiro, base de leads |
| PowerPoint (PPTX) | Pitch deck, apresentação comercial, treinamento |
| HTML | Página de concorrente, artigo de referência |
| Imagens (JPG, PNG) | Foto de documento, screenshot, print de WhatsApp (com OCR) |
| Áudio (MP3, WAV) | Gravação de reunião, ligação de cliente, áudio de WhatsApp |
| YouTube | Aula, palestra, vídeo de concorrente, entrevista |
| EPUB | Livro digital pra extração de insight |
| ZIP | Pasta inteira convertida de uma vez só |
| Outlook (MSG) | Histórico de e-mail importante |
| JSON e XML | Exportação de sistema, integração |
Os 4 comandos que você vai usar 90% do tempo
Decora esses quatro e você está liberado pra usar MarkItDown na rotina sem consultar documentação.
| Objetivo | Comando |
| Converter e salvar em arquivo | markitdown arquivo.pdf -o saida.md |
| Converter e mostrar no terminal | markitdown arquivo.pdf |
| Transcrever vídeo do YouTube | markitdown URL_DO_VIDEO -o aula.md |
| Ver lista completa de opções | markitdown --help |
O comando do YouTube é o que mais me surpreendeu. Cola a URL como se fosse arquivo, MarkItDown extrai transcrição limpa em 30 segundos e você manda pro Claude resumir os insights principais.
Como aplico aqui na operação
Contrato de cliente novo. Converto pra Markdown, peço pro Claude extrair cláusulas críticas, prazo de pagamento e riscos. Tempo antes do MarkItDown: 8 minutos. Tempo agora: menos de 1.
Relatório de tráfego da Agência. Planilha mensal vira Markdown, e o funcionário digital de relatório monta o documento semanal de cada cliente automaticamente. Antes consumia 30% do meu plano Claude num só relatório. Agora consome 5%.
Aula que assisto no YouTube. Cola a URL no MarkItDown, recebo a transcrição limpa, Claude resume os 5 insights principais que valem aplicar. 1 hora de vídeo vira 10 minutos de leitura útil.
Livro novo que comprei. EPUB vira Markdown, e o funcionário digital de pesquisa traz os 3 conceitos que se conectam ao Projeto Lucas Oliveira IA, com página de referência pra checar depois.
Resultado prático na operação: tempo médio de conversão por arquivo de 8 segundos, economia de token entre 60 e 80% por arquivo, custo da ferramenta zero. Em um mês, plano que rendia 20 análises passa a render 60.
O cuidado que pouca gente avisa
Se você vai usar Python pra outras coisas além do MarkItDown, vale a pena criar um ambiente virtual antes de instalar. Isso evita que diferentes ferramentas briguem por versão de pacote no futuro.
Os passos são três:
python3 -m venv markitdown-env
source markitdown-env/bin/activate
pip install 'markitdown[all]'
No Windows o segundo comando é markitdown-env\Scripts\activate. Pra empresário que vai usar só MarkItDown, dá pra pular essa parte e instalar direto. Pra time técnico, ambiente virtual é padrão.
O detalhe estratégico que vale a leitura inteira
MarkItDown não substitui IA. Prepara o material pra IA trabalhar melhor.
Empresário que entende isso para de tratar Claude e ChatGPT como ferramenta isolada e começa a desenhar uma pequena cadeia de processo. Arquivo bruto entra, ferramenta de conversão limpa, IA analisa, funcionário digital aplica. Essa cadeia é o que separa quem brinca com IA de quem opera com IA.
Instalar MarkItDown é o ponto de partida. Mas ferramenta solta não vira operação. Operação acontece quando você combina ferramenta certa, processo claro e funcionário digital cuidando da execução repetitiva.
Se você quer ver como esse encaixe funciona na prática, o caminho completo está no Funcionário Digital. É o método que estruturei depois de testar 6 anos de ferramentas avulsas que sozinhas não resolviam nada. Pagamento único de R$97, garantia de 7 dias.
#markitdown
#microsoft
#iaAplicada
#funcionarioDigital
#produtividade