Consumer groups en Kafka: cómo se reparte el trabajo

Explica offsets, particiones y rebalances con un ejemplo reproducible que muestra cómo se divide el consumo entre consumidores y qué ocurre cuando se escala o falla un nodo.

1 de febrero de 2026 · 2 min · 215 palabras · pw
Delta storage layout: qué hay realmente en disco

Delta storage layout: qué hay realmente en disco

Explora el layout en disco, commits y checkpoints, y entiende por qué esto importa para performance, mantenimiento y troubleshooting en producción.

1 de febrero de 2026 · 2 min · 289 palabras · pw

Delta Time Travel: consulta el pasado con confianza

Aprende `versionAsOf` y `timestampAsOf`, valida cambios y entiende cuándo usar time travel para auditoría, recovery y análisis de regresiones en Delta Lake.

1 de febrero de 2026 · 2 min · 303 palabras · pw

Kafka 101: tu primer tópico local

Primeros pasos con Kafka CLI: crear tópicos, producir eventos y consumirlos desde consola en un entorno local reproducible. Ideal para practicar sin cloud ni dependencias externas.

1 de febrero de 2026 · 2 min · 219 palabras · pw

Particiones en Spark: la palanca del rendimiento

Introduce `spark.sql.shuffle.partitions`, repartition y coalesce con un ejemplo reproducible para ver impacto en tiempos, stages y tamaño de shuffle.

1 de febrero de 2026 · 2 min · 259 palabras · pw

PySpark DataFrames: las tres operaciones diarias

Guía práctica con ejemplos claros y salidas esperadas para dominar transformaciones básicas en DataFrames. Incluye patrones de chaining legibles y validaciones rápidas.

1 de febrero de 2026 · 2 min · 348 palabras · pw

Spark local: primer arranque y verificación

Guía práctica para levantar el stack local, comprobar UI/health y correr un primer job. Incluye checks mínimos para confirmar Spark Master/Workers y que tu entorno quede listo para los posts.

1 de febrero de 2026 · 2 min · 230 palabras · pw