Los mejores visores de archivos Parquet en 2026
Tienes un archivo .parquet y quieres ver qué hay adentro. Suena simple, pero a diferencia de un CSV que puedes abrir con cualquier editor de texto, Parquet es un formato binario. Necesitas una herramienta específica.
La buena noticia es que en 2026 hay varias opciones excelentes. La pregunta ya no es “cómo abro un Parquet” sino “qué herramienta me da el flujo de trabajo más completo para lo que necesito hacer”. Porque la realidad es que rara vez solo quieres ver los datos — quieres consultarlos, entender su estructura, validar su calidad y probablemente transformarlos.
1. Parquet Explorer: la plataforma completa (navegador web)
Parquet Explorer empezó como un visor, pero evolucionó a lo que mejor se describe como la navaja suiza para archivos Parquet. Corre completamente en el navegador usando DuckDB-WASM, lo que significa que toda la ejecución ocurre en tu máquina — tus datos nunca salen del navegador.
Lo que lo distingue de un visor tradicional
La diferencia con un visor convencional es que Parquet Explorer cubre el ciclo completo de trabajo con archivos Parquet:
Consultas SQL completas: no es un SQL limitado — es DuckDB completo. Window functions, CTEs, subqueries, joins entre múltiples archivos. Incluye sugerencias de consultas contextuales basadas en la estructura de tu tabla (muy útil cuando no conoces el dataset) y un historial de queries para no perder tu trabajo.
Exploración profunda del esquema: el visor de esquema muestra la estructura completa con tipos anidados (STRUCT, LIST, MAP) en un árbol interactivo que puedes expandir y colapsar. Mucho más claro que leer una salida de texto.
Inspector de metadata: examina los row groups, codecs de compresión por column chunk, estadísticas min/max, conteo de nulos y valores distintos por columna. Es como tener pyarrow.ParquetFile.metadata pero visual e inmediato.
Data profiler: va más allá de estadísticas básicas. Para cada columna genera histogramas de distribución, detecta automáticamente tipos semánticos (emails, URLs, UUIDs, direcciones IP, números de teléfono) y calcula un puntaje de calidad de datos. Esto es algo que normalmente requiere un script de Python dedicado.
Conversión de formatos: convierte CSV, TSV, JSON y JSONL a Parquet, eligiendo la compresión (Snappy, Zstd, Gzip). Y exporta resultados a CSV, JSON o Parquet.
Creación y edición de archivos: crea Parquet desde cero definiendo el esquema, o edita archivos existentes con edición inline de celdas, y la posibilidad de agregar o eliminar filas y columnas. Esto no existe en ningún otro visor.
Tabla virtualizada: los resultados de las consultas usan renderizado virtualizado, así que puedes navegar millones de filas sin que el navegador se congele.
Disponible en inglés y español: con interfaz completa en ambos idiomas.
Para quién es ideal
- Analistas y científicos de datos que necesitan explorar, consultar y validar datos rápidamente.
- Equipos que trabajan con datos sensibles donde la privacidad es requisito no negociable.
- Cualquier persona que quiere una experiencia completa sin instalar nada.
- Quienes necesitan convertir entre formatos, crear archivos de prueba o editar datos existentes.
Limitaciones
- Depende de la memoria disponible en el navegador. Para archivos de varios gigabytes, una herramienta nativa será más eficiente.
- No tiene la extensibilidad de un entorno de programación completo como Python.
2. DuckDB CLI
DuckDB es un motor SQL embebido diseñado para análisis. Su CLI es una de las herramientas más potentes para trabajar con archivos Parquet desde la terminal.
Qué ofrece
- SQL completo: window functions, CTEs, joins, agregaciones — todo lo que esperas de un motor SQL maduro.
- Lectura directa:
SELECT * FROM 'archivo.parquet'— sin importar ni crear tablas. - Múltiples archivos: soporta globs para leer directorios completos.
- Rendimiento excelente: optimizado para análisis columnar, aprovecha múltiples cores.
- Exportación flexible: a CSV, Parquet, JSON y otros formatos.
Instalación
# macOS
brew install duckdb
# Linux (Debian/Ubuntu)
sudo apt install duckdb
# Windows
winget install DuckDB.cli
Para quién es ideal
- Ingenieros de datos que viven en la terminal.
- Automatización de consultas en scripts y pipelines.
- Archivos muy grandes que no caben cómodamente en el navegador.
Limitaciones
- No tiene interfaz gráfica — no hay visualización de esquemas en árbol, ni histogramas, ni perfilado automático.
- Requiere instalación.
- No hay edición visual de datos.
3. Python (pandas / Polars / PyArrow)
Si ya trabajas en Python, tienes varias opciones para leer Parquet. pandas es el clásico (pd.read_parquet()), ideal si la exploración es parte de un análisis más amplio con visualizaciones o ML. Polars es la alternativa moderna escrita en Rust, significativamente más rápida y eficiente con la memoria. PyArrow te da acceso a bajo nivel a la metadata interna (row groups, estadísticas, encodings).
Las tres requieren tener Python instalado y configurado. Para simplemente inspeccionar un archivo, levantar un notebook es excesivo. Pero si ya estás en un proyecto de Python, son la opción natural.
4. Extensiones de VS Code
Extensiones como Parquet Viewer o Data Table te permiten ver tablas al abrir archivos .parquet sin salir del editor. Útil para inspección rápida durante el desarrollo, pero funcionalidad muy limitada: no hay SQL, ni perfilado, ni edición, ni conversión.
Comparación resumida
| Herramienta | Instalación | SQL | Perfilado de datos | Edición | Conversión |
|---|---|---|---|---|---|
| Parquet Explorer | Ninguna | DuckDB completo | Histogramas, tipos semánticos, calidad | Inline + filas/columnas | CSV/TSV/JSON/JSONL a Parquet |
| DuckDB CLI | Ligera | Nativo | Manual con queries | No | Con queries COPY |
| Python (pandas/Polars/PyArrow) | Python + libs | No (API) | Con código | Con código | Con código |
| Ext. VS Code | Extensión | No | No | No | No |
¿Cuál debería usar?
La respuesta depende de tu contexto, pero si tuviera que recomendar un flujo de trabajo:
- Exploración, validación, conversión, inspección, perfilado, edición: Parquet Explorer. Es donde más tareas resuelves sin salir de la herramienta.
- Archivos enormes o automatización en scripts: DuckDB CLI.
- Análisis dentro de un proyecto de Python: pandas, Polars o PyArrow.
- Vistazo rápido sin salir del editor: extensión de VS Code.
Conclusión
El ecosistema de herramientas para trabajar con Parquet ha madurado enormemente. Ya no hay excusa para no usar este formato solo porque “es difícil de abrir”.
Si tuvieras que elegir una sola herramienta para empezar, Parquet Explorer es la de menor fricción y mayor alcance: no hay nada que instalar, funciona con SQL completo, perfila tus datos automáticamente, te deja inspeccionar la metadata, convertir entre formatos, crear archivos desde cero y editar los existentes. Todo en el navegador, todo local, todo en español (o inglés si prefieres).
Es la diferencia entre un “visor de Parquet” y una plataforma completa para trabajar con el formato. Y esa diferencia se nota desde el primer uso.