Arregla joins con skew en Spark usando salting

Detecta joins con skew en Spark y aplica salting para repartir las llaves “hot”. Verás el antes/después con tiempos de stage y shuffle, una repro sintética y un dataset real con descargas al final.

1 de febrero de 2026 · 4 min · 681 palabras · pw

Particiones en Spark: la palanca del rendimiento

Introduce `spark.sql.shuffle.partitions`, repartition y coalesce con un ejemplo reproducible para ver impacto en tiempos, stages y tamaño de shuffle.

1 de febrero de 2026 · 2 min · 259 palabras · pw