PyConES 2022

Asegurando el tiro: intervalos de confianza para tus modelos de Machine Learning
10-02, 12:10–12:45 (Europe/Madrid), Katherine Johnson (Teoría 7)
Language: Español

Comprender cómo funcionan y la ventaja de emplear los intervalos de confianza, intervalos de predicción y predicción por cuartiles a la hora de emplear modelos de ML para soluciones de negocio.


A día de hoy son cada vez más las empresas que se apoyan en modelos y técnicas de Machine Learning y analítica avanzada para tomar sus decisiones de negocio. No hay duda de que los datos son el petróleo de esta nueva era y tomar decisiones basadas en ellos supone una ventaja competitiva considerable. No obstante siguen existiendo escenarios (fluctuación de la bolsa, precio de la energía y commodities ...) cuya gran complejidad hace que sea complicado de modelar hasta con los algoritmos más punteros.
En estas situaciones la solución más viable suele pasar por cuantificar la incertidumbre del modelo o asignando unos intervalos de confianza en las predicciones para poder tomar decisiones de negocio más precisas.
Esta charla plantea, a partir de un caso de uso en Python, entrar en el detalle de los conceptos de intervalo de confianza, intervalo de predicción y predicción basada en cuartiles. Para cada uno de los conceptos explicados se definirán las ventajas y desventajas de su empleo tanto a nivel de interpretabilidad como a nivel de coste computacional, focalizándose en el valor añadido aportado a la solución de negocio planteada.

Librerías:
- Xgboost: https://xgboost.readthedocs.io/en/stable/
- Catboost: https://catboost.ai/
- Lightgbm: https://lightgbm.readthedocs.io/en/v3.3.2/
- Ngboost: https://github.com/stanfordmlgroup/ngboost
- sklearn: https://scikit-learn.org/stable/

Definiciones y referencias:
- Ngboost: https://arxiv.org/abs/1910.03225
- Regresión cuantílica: http://www.econ.uiuc.edu/~roger/research/rq/QRJEP.pdf
- intervalo de credibilidad: https://en.wikipedia.org/wiki/Credible_interval
- intervalo de confianza: https://es.wikipedia.org/wiki/Intervalo_de_confianza
- intervalo de predicción: https://es.wikipedia.org/wiki/Intervalo_de_predicci%C3%B3n


Level of your proposal

Intermedio

Topic

Ciencia de datos, Machine Learning e IA

See also: Presentación (2.0 MB)

Apoyándome en mi formación como ingeniero de telecomunicaciones, siempre me han interesado las nuevas tecnologías. He dedicado los últimos 6 años de mi vida al apasionante mundo del Machine Learning, trabajando en multitud de proyectos de diversa índole (Computer Vision, NLP, Time Series Forecating...). Actualmente soy el responsable del área de Data Science en Decide4AI y más allá de mi trabajo siempre me ha gustado colaborar en distintas iniciativas y charlas relacionadas con el sector.

Graduado en Matemáticas por la UCM y con un Máster en Inteligencia Artificial por la UPM. Actualmente trabajo como Senior Data Scientist en decide4AI y me especializo en la aplicación y desarrollo de modelos de aprendizaje automático empleando principalmente Python como lenguaje de programación. También trabajo como profesor asociado en la Universidad San Pablo CEU.