—Guía tablas PDF
PDF → Markdown tablas
Extraer tablas de PDF a Markdown — Guía 2026
Las tablas son lo más difícil de rescatar de un PDF. La mayoría de conversores las destruyen: mezclan columnas, pierden filas o las convierten en texto incomprensible. Esta guía te muestra cómo extraer tablas de PDF a Markdown nativo, con barras | y todo, sin perder ni una celda.
¿Por qué las tablas de PDF son tan difíciles?
Los PDFs no almacenan tablas como datos estructurados. Una tabla en PDF es un conjunto de líneas, espacios y texto posicionado con coordenadas absolutas. No hay concepto de "fila" ni "columna" en el formato PDF.
Por eso la mayoría de conversores producen resultados desastrosos:
- ✗ Texto plano sin barras | — las columnas se mezclan y es imposible reconstruir la tabla.
- ✗ Tabla como imagen — no es texto editable ni se puede buscar.
- ✗ Filas o columnas perdidas — datos que desaparecen en la conversión.
- ✗ Celdas fusionadas rotas — los encabezados que ocupan varias columnas se deshacen.
La solución: usar un conversor con detección de estructura de tabla avanzada que reconozca filas, columnas y celdas individualmente, y las convierta a Markdown nativo.
Paso 1: Sube tu PDF a un conversor online
Arrastra o selecciona el archivo PDF que contiene las tablas que quieres extraer. No necesitas instalar nada: herramientas como FolioMD funcionan directamente en el navegador y aceptan PDFs de hasta 200 MB.
Asegúrate de que el PDF no esté protegido con contraseña, ya que los conversores no pueden procesar archivos cifrados. Si el PDF es un escaneo, elige una herramienta con OCR integrado.
Paso 2: Espera a que el motor detecte las tablas
El motor de conversión (como MinerU) analiza el PDF página por página. Detecta automáticamente dónde hay tablas, identifica filas y columnas, y reconstruye la estructura de cada celda. Este proceso es el que marca la diferencia entre un conversor bueno y uno malo.
¿Qué hace un motor de calidad?
- ✓ Detecta los bordes de la tabla — líneas, espacios y alineación de texto.
- ✓ Reconoce filas y columnas — incluso si los bordes son invisibles.
- ✓ Maneja celdas vacías — sin colapsar columnas.
- ✓ Respeta celdas fusionadas — encabezados multi-columna.
Paso 3: Descarga el resultado como Markdown
Descarga el ZIP con el archivo .md. Las tablas aparecen en formato Markdown nativo, con barras | y separadores |---|:
| Producto | Precio | Stock |
|----------|--------|-------|
| Teclado | 45 € | 120 |
| Ratón | 25 € | 340 |
| Monitor | 299 € | 15 |
Este formato es universal: funciona en Obsidian, VS Code, GitHub, Notion, y cualquier editor Markdown. Puedes copiar y pegar directamente sin ajustar nada.
Paso 4: Edita y reutiliza las tablas extraídas
Abre el .md en tu editor favorito. Las tablas son texto editable: puedes:
- ✓ Corregir celdas que el OCR haya leído mal
- ✓ Reorganizar columnas (cortar y pegar en la tabla)
- ✓ Añadir filas nuevas
- ✓ Exportar a Excel, Google Sheets o CSV con herramientas como
pandas
- ✓ Incrustar en documentación técnica, wikis o notas
Consejo: si necesitas pasar la tabla a Excel, usa la extensión Markdown Table de VS Code o pega la tabla directamente en Google Sheets — detecta las columnas automáticamente.
Tablas en PDFs escaneados (con OCR)
Si tu PDF es un escaneo (cada página es una imagen), necesitas un conversor que combine OCR + detección de tablas. No basta con reconocer las letras: también hay que identificar la estructura de filas y columnas.
El proceso es el mismo (subir PDF → esperar → descargar), pero internamente el motor hace dos cosas:
- 1. OCR — reconoce el texto de cada celda.
- 2. Detección de estructura — identifica qué texto pertenece a qué fila y columna.
FolioMD hace ambas cosas automáticamente. La mayoría de conversores gratuitos solo hacen OCR plano, que produce texto sin estructura de tabla.
Comparativa de herramientas para extraer tablas
| Herramienta |
Tablas Markdown |
OCR + tablas |
Celdas fusionadas |
Precio |
| FolioMD |
Sí |
Sí |
Sí |
Gratis + Prioridad 5 € |
| Mathpix |
Sí |
Sí |
Parcial |
De pago |
| Tabula |
Solo CSV |
No |
No |
Gratis (local) |
| pdf2md / gratuitos |
No |
No |
No |
Gratis |
| Adobe Acrobat |
Solo Excel |
Sí |
Parcial |
Suscripción |
Nota: Tabula es una buena opción gratuita para PDFs nativos (no escaneados), pero solo exporta a CSV, no a Markdown. Necesitarías una conversión adicional de CSV a Markdown.
Extrae tablas de tu PDF ahora
Gratis ilimitado. Tablas en Markdown nativo con barras |, OCR incluido para PDFs escaneados, sin instalar nada.