SeriesKafka 101
1/3. Kafka local con CLI, primer recorrido2/3. Consumer groups de Kafka, en claro3/3. Leer Kafka con Spark Streaming
Este post conecta Spark Structured Streaming a un tópico local de Kafka y lee mensajes en tiempo real. Ref: Structured Streaming + Kafka.
Descargas al final: ir a Descargas.
En pocas palabras
- Spark puede leer Kafka directo con el connector.
- Puedes validar streaming end‑to‑end localmente.
- Es el puente entre ingesta y procesamiento.
Ejecuta tú mismo
- Docker local: ruta principal de este blog.
| |
Links:
Producir mensajes
Genera eventos en el tópico para alimentar el stream.
| |
Leer con Spark Structured Streaming
Spark leerá el tópico y enviará los mensajes a consola.
| |
Salida esperada: Verás filas nuevas en consola cuando envíes mensajes.
Qué verificar
- Los mensajes aparecen en la salida de consola de Spark.
- La consulta streaming sigue activa mientras produces.
- Detener el producer no rompe la consulta.
Descargas
Si no quieres copiar código, descarga el notebook o el .py.