Consultar versiones pasadas en Delta

Aprende versionAsOf y timestampAsOf, valida cambios y entiende cuándo usar time travel para auditoría, recovery y análisis de regresiones en Delta Lake.

1 de febrero de 2026 · 2 min · 293 palabras · pw

Crear un Data Source de streaming en Spark

Implementa un reader mínimo con offsets reales, un schema claro y un formato utilizable. Comparas el enfoque batch vs streaming y lo ejecutas end-to-end.

1 de febrero de 2026 · 3 min · 440 palabras · pw

PySpark básico para el día a día

Guía práctica con ejemplos claros y salidas esperadas para dominar transformaciones básicas en DataFrames. Incluye patrones de chaining legibles y validaciones rápidas.

1 de febrero de 2026 · 2 min · 338 palabras · pw

Skew en joins de Spark y cómo arreglarlo

Detecta joins con skew en Spark y aplica salting para repartir las llaves “hot”. Verás el antes/después con tiempos de stage y shuffle, una repro sintética y un dataset real con descargas al final.

1 de febrero de 2026 · 4 min · 681 palabras · pw

Spark local, primer arranque

Guía práctica para levantar el stack local, comprobar UI/health y correr un primer job. Incluye checks mínimos para confirmar Spark Master/Workers y que tu entorno quede listo para los posts.

1 de febrero de 2026 · 2 min · 230 palabras · pw

Tu primera tabla Delta, paso a paso

Recorrido end‑to‑end: crear tabla Delta, insertar datos, leer, filtrar y validar resultados con salidas esperadas. Base mínima para entender Delta antes de optimizar.

1 de febrero de 2026 · 2 min · 332 palabras · pw