FUNCIONES
- Construir y entrenar modelos estadísticos y de machine learning (R,
Python, PySpark
u otros) para resolver problemas de negocio.
- Crear y mantener pipelines de datos y de ML (ETL, entrenamiento, validación, despliegue y monitoreo) en entornos como
Azure Databricks.
- Implementar prácticas de
MLOps
para empaquetado, versionamiento, pruebas, despliegue y monitoreo de modelos usando herramientas como MLflow.
- Definir y aplicar estándares de calidad de datos, mecanismos de control y manejo de excepciones.
- Realizar análisis estadísticos, validación de modelos y generación de reportes técnicos y de negocio.
- Ejecutar despliegues bajo estrategias
blue/green, canary o A/B testing
.
- Documentar procesos y resultados, asegurando la trazabilidad y gobernanza de los modelos.
- Colaborar con equipos multidisciplinarios para integrar soluciones en arquitecturas empresariales.
NIVEL ACADÉMICO
- Profesional en Ingeniería de Sistemas, Software, Computación, Electrónica, Matemáticas Aplicadas, Estadística, Economía, Administración o afines.
- Deseable:
Graduado(a) o en últimos semestres de Maestría en Inteligencia Artificial, Machine Learning o áreas relacionadas con datos.
- Deseable:
Certificaciones en plataformas Cloud, MLOps y herramientas de CI/CD (Azure certificado es un plus).
CONOCIMIENTOS REQUERIDOS
- Modelos de segmentación, clasificación, regresión, clustering y series temporales.
- Procesamiento y limpieza de datos a gran escala.
- Data Engineering con PySpark y orquestación de pipelines.
- Análisis y visualización de datos.
- Algoritmos de machine learning y deep learning: Random Forest, Gradient Boosting, Redes Neuronales, NLP, modelos de duración, conteo y regresión cuantílica.
- Prácticas de
MLOps
: versionamiento, empaquetado, testing y monitoreo de modelos.
- Arquitecturas de despliegue y estrategias de experimentación (blue/green, canary, A/B testing).
TECNOLOGÍAS Y HERRAMIENTAS
- Lenguajes:
Python, R, SQL, PySpark
.
- Frameworks/Bibliotecas:
TensorFlow, Scikit-learn, Spark MLlib
.
- Herramientas:
Azure Databricks, MLflow, Git, Docker, CI/CD (Azure DevOps)
.
- Bases de datos relacionales y no relacionales.
- Certificaciones en Python, Machine Learning y Deep Learning (deseables).