folio.md
Guía tablas PDF PDF → Markdown tablas

Extraer tablas de PDF a Markdown — Guía 2026

Las tablas son lo más difícil de rescatar de un PDF. La mayoría de conversores las destruyen: mezclan columnas, pierden filas o las convierten en texto incomprensible. Esta guía te muestra cómo extraer tablas de PDF a Markdown nativo, con barras | y todo, sin perder ni una celda.

¿Por qué las tablas de PDF son tan difíciles?

Los PDFs no almacenan tablas como datos estructurados. Una tabla en PDF es un conjunto de líneas, espacios y texto posicionado con coordenadas absolutas. No hay concepto de "fila" ni "columna" en el formato PDF.

Por eso la mayoría de conversores producen resultados desastrosos:

  • Texto plano sin barras | — las columnas se mezclan y es imposible reconstruir la tabla.
  • Tabla como imagen — no es texto editable ni se puede buscar.
  • Filas o columnas perdidas — datos que desaparecen en la conversión.
  • Celdas fusionadas rotas — los encabezados que ocupan varias columnas se deshacen.

La solución: usar un conversor con detección de estructura de tabla avanzada que reconozca filas, columnas y celdas individualmente, y las convierta a Markdown nativo.

Paso 1: Sube tu PDF a un conversor online

Arrastra o selecciona el archivo PDF que contiene las tablas que quieres extraer. No necesitas instalar nada: herramientas como FolioMD funcionan directamente en el navegador y aceptan PDFs de hasta 200 MB.

Asegúrate de que el PDF no esté protegido con contraseña, ya que los conversores no pueden procesar archivos cifrados. Si el PDF es un escaneo, elige una herramienta con OCR integrado.

Paso 2: Espera a que el motor detecte las tablas

El motor de conversión (como MinerU) analiza el PDF página por página. Detecta automáticamente dónde hay tablas, identifica filas y columnas, y reconstruye la estructura de cada celda. Este proceso es el que marca la diferencia entre un conversor bueno y uno malo.

¿Qué hace un motor de calidad?

  • Detecta los bordes de la tabla — líneas, espacios y alineación de texto.
  • Reconoce filas y columnas — incluso si los bordes son invisibles.
  • Maneja celdas vacías — sin colapsar columnas.
  • Respeta celdas fusionadas — encabezados multi-columna.

Paso 3: Descarga el resultado como Markdown

Descarga el ZIP con el archivo .md. Las tablas aparecen en formato Markdown nativo, con barras | y separadores |---|:

| Producto | Precio | Stock |
|----------|--------|-------|
| Teclado  | 45 €   | 120   |
| Ratón    | 25 €   | 340   |
| Monitor  | 299 €  | 15    |

Este formato es universal: funciona en Obsidian, VS Code, GitHub, Notion, y cualquier editor Markdown. Puedes copiar y pegar directamente sin ajustar nada.

Paso 4: Edita y reutiliza las tablas extraídas

Abre el .md en tu editor favorito. Las tablas son texto editable: puedes:

  • ✓ Corregir celdas que el OCR haya leído mal
  • ✓ Reorganizar columnas (cortar y pegar en la tabla)
  • ✓ Añadir filas nuevas
  • ✓ Exportar a Excel, Google Sheets o CSV con herramientas como pandas
  • ✓ Incrustar en documentación técnica, wikis o notas

Consejo: si necesitas pasar la tabla a Excel, usa la extensión Markdown Table de VS Code o pega la tabla directamente en Google Sheets — detecta las columnas automáticamente.

Tablas en PDFs escaneados (con OCR)

Si tu PDF es un escaneo (cada página es una imagen), necesitas un conversor que combine OCR + detección de tablas. No basta con reconocer las letras: también hay que identificar la estructura de filas y columnas.

El proceso es el mismo (subir PDF → esperar → descargar), pero internamente el motor hace dos cosas:

  • 1. OCR — reconoce el texto de cada celda.
  • 2. Detección de estructura — identifica qué texto pertenece a qué fila y columna.

FolioMD hace ambas cosas automáticamente. La mayoría de conversores gratuitos solo hacen OCR plano, que produce texto sin estructura de tabla.

Comparativa de herramientas para extraer tablas

Herramienta Tablas Markdown OCR + tablas Celdas fusionadas Precio
FolioMD Gratis + Prioridad 5 €
Mathpix Parcial De pago
Tabula Solo CSV No No Gratis (local)
pdf2md / gratuitos No No No Gratis
Adobe Acrobat Solo Excel Parcial Suscripción

Nota: Tabula es una buena opción gratuita para PDFs nativos (no escaneados), pero solo exporta a CSV, no a Markdown. Necesitarías una conversión adicional de CSV a Markdown.

Extrae tablas de tu PDF ahora

Gratis ilimitado. Tablas en Markdown nativo con barras |, OCR incluido para PDFs escaneados, sin instalar nada.

convertir PDF ahora → cómo funciona →