¿Qué criterio distingue un proyecto final con nivel profesional?

Lo profesional es diseñar flujo mantenible, auditable y orientado a operación, no acumular líneas de código.

Proyecto final: pipeline ETL de inventario con validación, logging y reporte

Cierra el curso construyendo una automatización completa: ingesta de datos, normalización, manejo de errores, métricas y salida lista para operación.

¿Cuánto sabes de Python?

📘 Teoría

1) Arquitectura objetivo del proyecto final

Diseña el flujo antes de codificar: ETL + validación + observabilidad.

En este proyecto vas a simular un flujo de inventario: recibes registros en texto, los normalizas y generas un resumen para operaciones.

Separar `extract()`, `transform()` y `load()` evita acoplamiento y facilita testear cada parte de manera aislada.

El manejo de errores debe capturar filas inválidas sin tumbar todo el proceso, pero reportando cuántas se descartaron y por qué.

Esqueleto ETL con contrato explícito

from typing import Iterable

def extract() -> Iterable[str]:
    return [
        'sku=A1,qty=10,price=9.5',
        'sku=B9,qty=2,price=31',
        'sku=C3,qty=bad,price=8.2',
    ]

def transform(rows: Iterable[str]) -> list[dict]:
    raise NotImplementedError

def load(records: list[dict]) -> dict:
    raise NotImplementedError

2) Reglas de negocio y validación de datos

Una automatización es fiable cuando sus reglas son explícitas y auditables.

Conviene modelar cada registro con estructura consistente (`sku`, `qty`, `price`, `total`) para evitar llaves inconsistentes en pasos posteriores.

Validar tipos en transformación (`int`, `float`) te permite descartar ruido de entrada de forma controlada.

Cuando una fila falla, registra el error con contexto mínimo (línea y causa) y continúa para no perder el resto del lote.

Conversión segura

Aísla parseo y lanza excepción con mensaje claro si una columna es inválida.

Transform con tolerancia a fallo

Procesa lote completo, acumula errores y devuelve registros válidos.

3) Carga, métricas y ejecución orquestada

El punto de entrada integra todo y produce una salida útil para el equipo.

La fase `load()` no solo guarda datos; también calcula métricas de negocio (ingresos, unidades, SKUs únicos).

Registrar el resumen final con logging facilita soporte y debugging cuando el pipeline se ejecuta por cron o CI.

El `main()` debe devolver una estructura estable para poder serializarla, testearla y compararla entre ejecuciones.

Incluye conteo de filas válidas e inválidas.
Expón métricas agregadas (`revenue_total`, `units_total`).
Conserva salida determinista para facilitar pruebas.
Evita efectos secundarios fuera de `main()` y `load()`.

Orquestador final con reporte

def pipeline() -> dict:
    rows = list(extract())
    records, errors = transform(rows)
    summary = load(records)
    summary['input_rows'] = len(rows)
    summary['invalid_rows'] = len(errors)
    summary['errors'] = errors
    return summary

1 1) Arquitectura objetivo del proyecto final 2 2) Reglas de negocio y validación de datos 3 3) Carga, métricas y ejecución orquestada

🧪 Aprende probando

Ejemplo Ejemplo completo: ETL de inventario y resumen JSON Ejecuta este flujo mentalmente y observa cómo separa responsabilidades, tolera errores y produce una salida operativa.

⌄

🏁 Retos

Reto Reto: añade punto de entrada profesional Completa un `main()` que ejecute el pipeline y deje el patrón de ejecución listo para producción.

⌄

🧰 Recursos

Enlaces útiles

Python docs - csv Python docs - logging Python docs - pathlib

Test

Comprueba tus conocimientos con un test sobre Python.

Test de Python

Recursos del curso 25

📘 Glosario 🎬 Vídeos 🔗 Enlaces

‹

Lección 24

Automatización y scripts CLI en Python: productividad operativa real