Los mejores visores de archivos Parquet en 2026

· Parquet Explorer
parquetherramientascomparacion

Tienes un archivo .parquet y quieres ver qué hay adentro. Suena simple, pero a diferencia de un CSV que puedes abrir con cualquier editor de texto, Parquet es un formato binario. Necesitas una herramienta específica.

La buena noticia es que en 2026 hay varias opciones excelentes. La pregunta ya no es “cómo abro un Parquet” sino “qué herramienta me da el flujo de trabajo más completo para lo que necesito hacer”. Porque la realidad es que rara vez solo quieres ver los datos — quieres consultarlos, entender su estructura, validar su calidad y probablemente transformarlos.

1. Parquet Explorer (navegador web)

Parquet Explorer empezó como un visor y con el tiempo fue sumando funciones de consulta, conversión y edición. Corre completamente en el navegador usando DuckDB-WASM, así que toda la ejecución ocurre en tu máquina — tus datos nunca salen del navegador.

Qué incluye

Además de visualizar los datos, cubre varias etapas del trabajo con archivos Parquet:

Consultas SQL completas: no es un SQL limitado — es DuckDB completo. Window functions, CTEs, subqueries, joins entre múltiples archivos. Incluye sugerencias de consultas contextuales basadas en la estructura de tu tabla (muy útil cuando no conoces el dataset) y un historial de queries para no perder tu trabajo.

Exploración profunda del esquema: el visor de esquema muestra la estructura completa con tipos anidados (STRUCT, LIST, MAP) en un árbol interactivo que puedes expandir y colapsar. Mucho más claro que leer una salida de texto.

Inspector de metadata: examina los row groups, codecs de compresión por column chunk, estadísticas min/max, conteo de nulos y valores distintos por columna. Es como tener pyarrow.ParquetFile.metadata pero visual e inmediato.

Data profiler: va más allá de estadísticas básicas. Para cada columna genera histogramas de distribución, detecta automáticamente tipos semánticos (emails, URLs, UUIDs, direcciones IP, números de teléfono) y calcula un puntaje de calidad de datos. Esto es algo que normalmente requiere un script de Python dedicado.

Conversión de formatos: convierte CSV, TSV, JSON y JSONL a Parquet, eligiendo la compresión (Snappy, Zstd, Gzip). Y exporta resultados a CSV, JSON o Parquet.

Creación y edición de archivos: crea Parquet desde cero definiendo el esquema, o edita archivos existentes con edición inline de celdas, agregando o eliminando filas y columnas. Es una función poco habitual en los visores online.

Tabla virtualizada: los resultados de las consultas usan renderizado virtualizado, así que puedes navegar millones de filas sin que el navegador se congele.

Disponible en inglés y español: con interfaz completa en ambos idiomas.

Para quién es ideal

  • Analistas y científicos de datos que necesitan explorar, consultar y validar datos rápidamente.
  • Equipos que trabajan con datos sensibles donde la privacidad es requisito no negociable.
  • Cualquier persona que quiere una experiencia completa sin instalar nada.
  • Quienes necesitan convertir entre formatos, crear archivos de prueba o editar datos existentes.

Limitaciones

  • Depende de la memoria disponible en el navegador. Para archivos de varios gigabytes, una herramienta nativa será más eficiente.
  • No tiene la extensibilidad de un entorno de programación completo como Python.

2. DuckDB CLI

DuckDB es un motor SQL embebido diseñado para análisis. Su CLI es una de las herramientas más potentes para trabajar con archivos Parquet desde la terminal.

Qué ofrece

  • SQL completo: window functions, CTEs, joins, agregaciones — todo lo que esperas de un motor SQL maduro.
  • Lectura directa: SELECT * FROM 'archivo.parquet' — sin importar ni crear tablas.
  • Múltiples archivos: soporta globs para leer directorios completos.
  • Rendimiento excelente: optimizado para análisis columnar, aprovecha múltiples cores.
  • Exportación flexible: a CSV, Parquet, JSON y otros formatos.

Instalación

# macOS
brew install duckdb

# Linux (Debian/Ubuntu)
sudo apt install duckdb

# Windows
winget install DuckDB.cli

Para quién es ideal

  • Ingenieros de datos que viven en la terminal.
  • Automatización de consultas en scripts y pipelines.
  • Archivos muy grandes que no caben cómodamente en el navegador.

Limitaciones

  • No tiene interfaz gráfica — no hay visualización de esquemas en árbol, ni histogramas, ni perfilado automático.
  • Requiere instalación.
  • No hay edición visual de datos.

3. Python (pandas / Polars / PyArrow)

Si ya trabajas en Python, tienes varias opciones para leer Parquet. pandas es el clásico (pd.read_parquet()), ideal si la exploración es parte de un análisis más amplio con visualizaciones o ML. Polars es la alternativa moderna escrita en Rust, significativamente más rápida y eficiente con la memoria. PyArrow te da acceso a bajo nivel a la metadata interna (row groups, estadísticas, encodings).

Las tres requieren tener Python instalado y configurado. Para simplemente inspeccionar un archivo, levantar un notebook es excesivo. Pero si ya estás en un proyecto de Python, son la opción natural.

4. Extensiones de VS Code

Extensiones como Parquet Viewer o Data Table te permiten ver tablas al abrir archivos .parquet sin salir del editor. Útil para inspección rápida durante el desarrollo, pero funcionalidad muy limitada: no hay SQL, ni perfilado, ni edición, ni conversión.

Comparación resumida

HerramientaInstalaciónSQLPerfilado de datosEdiciónConversión
Parquet ExplorerNingunaDuckDB completoHistogramas, tipos semánticos, calidadInline + filas/columnasCSV/TSV/JSON/JSONL a Parquet
DuckDB CLILigeraNativoManual con queriesNoCon queries COPY
Python (pandas/Polars/PyArrow)Python + libsNo (API)Con códigoCon códigoCon código
Ext. VS CodeExtensiónNoNoNoNo

¿Cuál debería usar?

La respuesta depende de tu contexto, pero si tuviera que recomendar un flujo de trabajo:

  • Exploración, validación, conversión, inspección, perfilado, edición: Parquet Explorer. Es donde más tareas resuelves sin salir de la herramienta.
  • Archivos enormes o automatización en scripts: DuckDB CLI.
  • Análisis dentro de un proyecto de Python: pandas, Polars o PyArrow.
  • Vistazo rápido sin salir del editor: extensión de VS Code.

Conclusión

El ecosistema de herramientas para trabajar con Parquet ha madurado bastante. Ya no hay excusa para evitar el formato solo porque “es difícil de abrir”.

Si buscas algo sin instalación, Parquet Explorer cubre la mayoría de tareas comunes —consultar con SQL, inspeccionar metadata, perfilar datos, convertir formatos y editar archivos— directamente en el navegador y de forma local, en español o inglés. Para archivos de varios gigabytes o flujos automatizados, DuckDB CLI o Python siguen siendo opciones más adecuadas. Al final, la mejor herramienta depende de tu caso de uso.