01/10/2022 –, Ada Lovelace (Paraninfo)
Idioma: Español
Todos sabemos que correlación no es igual a causalidad. La mayoría de modelos de Machine Learning en la actualidad buscan correlaciones de los datos con el objetivo. La causalidad viene como herramienta para identificar los factores que afectan al objetivo y de qué manera lo hacen.
El objetivo de esta charla es proporcionar unos conocimientos básicos, así como las herramientas para poder solucionar problemas de inferencia y modelado causal en Python.
En esta presentación explicaremos de forma práctica los conceptos y técnicas básicas de inferencia causal en python así como la relevancia que estas técnicas tienen para mejorar los procesos basados en machine learning.
Las técnicas de inferencia causal y “causal discovery” nos permiten responder a preguntas para las que las técnicas de analítica predictiva y métodos de clasificación/regresión habituales no tienen respuestas. Básicamente nos permite responder usando datos observacionales a la pregunta de porqué se ha producido un determinado efecto, y como debería haber actuado para que se hubiera producido un efecto distinto.
Por otro lado nos permiten comprender y corregir los efectos que tienen sobre nuestros sistemas predictivos el efecto de sesgos de selección y el efecto de construcción de modelos condicionados o balanceados sobre algún estrato.
Los principios que nos permiten entender estos efectos permiten desarrollar modelos de aprendizaje explicables, permiten corregir sesgos indeseados, y otorga mayor robustez al desplazamiento de dominio (domain shift) en la aplicación de los modelos.
En esta presentación explicaremos estos conceptos de forma práctica y para ello usaremos las librerias DoWhy y CausalML.
Referencias:
“Concept and Principles of Causality “, Miguel F. Alarcon, https://medium.com/hotel-tech-stories/concept-and-principles-of-causality-d687832d6f5d
“The Book of Why.”. Pearl, Judea, and Dana Mackenzie.Harlow, England: Penguin Books. 2019.
“Elements of Causal Inference, Foundations and Learning Algorithms”, Jonas Peters, Dominik Janzing and Bernhard Schölkopf.
"A unified survey of treatment effect heterogeneitymodelling and uplift modelling".W Zhang, J Li, L Liu - ACM Computing Surveys (CSUR), 2021
“Introduction to Causal Inference course”, Brady Neal, https://www.bradyneal.com/causal-inference-course
Paquetes Python:
Microsoft DoWhy, https://github.com/py-why/dowhy
Uber CausalML: https://github.com/uber/causalml
Intermediate
Temática –Data Science, Machine Learning and AI
Computer scientist and mathematician. Interested in Machine learning as a means to an end. I love all the opportunities it enables, not in one industry, but across all.
Studied Computer Science and Mathematics at Universidad Autónoma de Madrid. Spent a year studying abroad in Copenhagen and then worked for three months in the Data Science department of a cyber security company.
I finished my studies the following year and went straight to Barcelona to start my job for The Hotels Network, where I have helped build the data, models and experiments platform, as well as build various data science products such as user-behavior predictive models, recommendations models and so on. Lately I've grown an interest into causality, and how it can help us model the world.