¿Cómo extraer tablas de un PDF a Markdown?

Sube el PDF a un conversor como FolioMD, espera a que el motor detecte la estructura de las tablas, descarga el resultado como .md y ábrelo en tu editor. Las tablas están en formato Markdown nativo con barras |, listas para editar.

¿Por qué las tablas de mi PDF se rompen al convertirlas?

La mayoría de conversores gratuitos no detectan bien la estructura de las tablas: mezclan columnas, pierden filas o convierten la tabla en texto plano sin barras |. Necesitas un conversor con detección de tablas avanzada (como MinerU) que reconozca filas, columnas y celdas individualmente.

¿Se pueden extraer tablas de un PDF escaneado?

Sí, pero necesitas un conversor con OCR que también detecte tablas. FolioMD combina OCR (reconocimiento de texto) con detección de estructura de tabla, así que funciona tanto con PDFs nativos como escaneados.

¿Qué formato tienen las tablas en Markdown?

En Markdown, las tablas usan barras verticales | para separar columnas y guiones - para la fila de separación. Por ejemplo: | Nombre | Edad | Ciudad |, |---|---|---|, | Ana | 30 | Madrid |. Este formato es compatible con Obsidian, GitHub, VS Code y la mayoría de editores Markdown.

¿FolioMD es gratis para extraer tablas de PDF?

Sí, FolioMD es gratis e ilimitado. No hay límite de páginas ni de PDFs. Opcionalmente puedes donar 5 € para tener prioridad en la cola de conversión, pero la funcionalidad es la misma para todos los usuarios.

—Guía tablas PDF PDF → Markdown tablas

Extraer tablas de PDF a Markdown — Guía 2026

Las tablas son lo más difícil de rescatar de un PDF. La mayoría de conversores las destruyen: mezclan columnas, pierden filas o las convierten en texto incomprensible. Esta guía te muestra cómo extraer tablas de PDF a Markdown nativo, con barras | y todo, sin perder ni una celda.

Contenido

¿Por qué las tablas de PDF son tan difíciles?

Paso 1: Sube tu PDF a un conversor online

Paso 2: Espera a que el motor detecte las tablas

Paso 3: Descarga el resultado como Markdown

Paso 4: Edita y reutiliza las tablas extraídas

Tablas en PDFs escaneados (con OCR)

Comparativa de herramientas para extraer tablas

¿Por qué las tablas de PDF son tan difíciles?

Los PDFs no almacenan tablas como datos estructurados. Una tabla en PDF es un conjunto de líneas, espacios y texto posicionado con coordenadas absolutas. No hay concepto de "fila" ni "columna" en el formato PDF.

Por eso la mayoría de conversores producen resultados desastrosos:

✗ Texto plano sin barras | — las columnas se mezclan y es imposible reconstruir la tabla.
✗ Tabla como imagen — no es texto editable ni se puede buscar.
✗ Filas o columnas perdidas — datos que desaparecen en la conversión.
✗ Celdas fusionadas rotas — los encabezados que ocupan varias columnas se deshacen.

La solución: usar un conversor con detección de estructura de tabla avanzada que reconozca filas, columnas y celdas individualmente, y las convierta a Markdown nativo.

Paso 1: Sube tu PDF a un conversor online

Arrastra o selecciona el archivo PDF que contiene las tablas que quieres extraer. No necesitas instalar nada: herramientas como FolioMD funcionan directamente en el navegador y aceptan PDFs de hasta 200 MB.

Asegúrate de que el PDF no esté protegido con contraseña, ya que los conversores no pueden procesar archivos cifrados. Si el PDF es un escaneo, elige una herramienta con OCR integrado.

Paso 2: Espera a que el motor detecte las tablas

El motor de conversión (como MinerU) analiza el PDF página por página. Detecta automáticamente dónde hay tablas, identifica filas y columnas, y reconstruye la estructura de cada celda. Este proceso es el que marca la diferencia entre un conversor bueno y uno malo.

¿Qué hace un motor de calidad?

✓ Detecta los bordes de la tabla — líneas, espacios y alineación de texto.
✓ Reconoce filas y columnas — incluso si los bordes son invisibles.
✓ Maneja celdas vacías — sin colapsar columnas.
✓ Respeta celdas fusionadas — encabezados multi-columna.

Paso 3: Descarga el resultado como Markdown

Descarga el ZIP con el archivo .md. Las tablas aparecen en formato Markdown nativo, con barras | y separadores |---|:

| Producto | Precio | Stock |
|----------|--------|-------|
| Teclado  | 45 €   | 120   |
| Ratón    | 25 €   | 340   |
| Monitor  | 299 €  | 15    |

Este formato es universal: funciona en Obsidian, VS Code, GitHub, Notion, y cualquier editor Markdown. Puedes copiar y pegar directamente sin ajustar nada.

Paso 4: Edita y reutiliza las tablas extraídas

Abre el .md en tu editor favorito. Las tablas son texto editable: puedes:

✓ Corregir celdas que el OCR haya leído mal
✓ Reorganizar columnas (cortar y pegar en la tabla)
✓ Añadir filas nuevas
✓ Exportar a Excel, Google Sheets o CSV con herramientas como pandas
✓ Incrustar en documentación técnica, wikis o notas

Consejo: si necesitas pasar la tabla a Excel, usa la extensión Markdown Table de VS Code o pega la tabla directamente en Google Sheets — detecta las columnas automáticamente.

Tablas en PDFs escaneados (con OCR)

Si tu PDF es un escaneo (cada página es una imagen), necesitas un conversor que combine OCR + detección de tablas. No basta con reconocer las letras: también hay que identificar la estructura de filas y columnas.

El proceso es el mismo (subir PDF → esperar → descargar), pero internamente el motor hace dos cosas:

1. OCR — reconoce el texto de cada celda.
2. Detección de estructura — identifica qué texto pertenece a qué fila y columna.

FolioMD hace ambas cosas automáticamente. La mayoría de conversores gratuitos solo hacen OCR plano, que produce texto sin estructura de tabla.

Comparativa de herramientas para extraer tablas

Herramienta	Tablas Markdown	OCR + tablas	Celdas fusionadas	Precio
FolioMD	Sí	Sí	Sí	Gratis + Prioridad 5 €
Mathpix	Sí	Sí	Parcial	De pago
Tabula	Solo CSV	No	No	Gratis (local)
pdf2md / gratuitos	No	No	No	Gratis
Adobe Acrobat	Solo Excel	Sí	Parcial	Suscripción

Nota: Tabula es una buena opción gratuita para PDFs nativos (no escaneados), pero solo exporta a CSV, no a Markdown. Necesitarías una conversión adicional de CSV a Markdown.

Extrae tablas de tu PDF ahora

Gratis ilimitado. Tablas en Markdown nativo con barras |, OCR incluido para PDFs escaneados, sin instalar nada.

convertir PDF ahora → cómo funciona →