esvdev_logo

Data Engineering 4 - ETL vs ELT

Publicado: lun, 20/10/2025

| Actualizado: sáb, 25/10/2025

Patrones populares para pipelines de datos

Repasemos

En la parte anterior de esta serie, aprendimos que los Data Engineers construimos pipelines para automatizar el movimiento y procesamiento de datos de manera eficiente, escalable, y segura.

Lo que nos toca ver hoy son dos maneras (aunque no las únicas) para construir dichos sistemas. Te las presento: ETL y ELT, dos enfoques o patrones distintos —aunque complementarios— para mover datos desde su origen hasta su destino.


¿Qué son?

ETL y ELT son patrones de diseño de pipelines de datos, es decir, son una secuencia o forma estructurada de definir el flujo que siguen los datos, desde que se extraen, hasta que transforman y almacenan. Arranquemos con ETL, el que se suele utilizar con más frecuencia (aunque parece que la tendencia está empezando a ir más por ELT).


ETL — Extract, Transform, Load

ETL es el framework más antiguo y aún el más común para diseñar pipelines de datos, desgranando el flujo de datos en tres pasos secuenciales:

Este enfoque se usa mucho cuando:

ELT — Extract, Load, Transform

En los últimos años, con la aparición de data warehouses modernos (como Snowflake, BigQuery o Redshift), el orden de las letras cambió… y también la forma de trabajar.

En el enfoque ELT, primero se:

  1. Extraen los datos desde la fuente,
  2. Cargan tal cual (en crudo) en el warehouse,
  3. Y Transforman directamente dentro del warehouse, usualmente con SQL.

La idea es aprovechar el poder de cómputo y la escalabilidad del warehouse para transformar los datos una vez cargados.

Este patrón es ideal cuando:

¿Cuál patrón utilizar?

Si te estás haciendo esta pregunta, dejame decirte que es perfectamente válida. ¿En qué casos cargo todo primero y luego transformo (ELT)? ¿O cuándo me conviene irme por el clásico de extraer, transformar y servir los datos al usuario final (ETL)? ¿O es que uno de los dos patrones es definitivamente mejor en general? Como me gusta decir…depende.

No existe bala de plata, no hay uno mejor que el otro per se, y es más, hasta puede suceder (y sucede) que un mismo proyecto requiera una combinación de ambos enfoques, y de hecho, en muchos proyectos se combinan ambos.

Por ejemplo:

¿ETLT? Podríamos decir que sí 😄

Lo importante es que tu pipeline tenga claridad, trazabilidad y eficiencia, sin importar la etiqueta.

Conclusión

¿Ya conocías estos patrones de diseño? ¿Te pasó de estar trabajando en un ETL sin saber que lo era? En mi caso...SÍ, me pasó 😅

Tags:

#data-engineering

Elias Velazquez photo

Escrito por:

Elias Velazquez

Data Engineer | Developer | Musico | Nerd de yerbas varias