Introducción a modelos cualitativos de respuesta discreta

Los modelos cualitativos de respuesta discreta consisten en predecir la probabilidad que tendrá un cliente para cumplir cierta condición/Target.

Por ejemplo, pensemos en un banco que quiere ofrecer un nuevo producto, pero este, obviamente, no se lo puede ofrecer a todos los clientes, pues tiene unos costes. Por lo tanto deciden realizar este tipo de modelos para conocer qué clientes son aquellos que tienen mayor probabilidad de contratar este nuevo producto, y así poder abordarlos.

Luego el target será aquella condición u objetivo cuya probabilidad queremos predecir, en nuestro ejemplo, los clientes que cumplan las condiciones para la contratación del nuevo producto.

Una vez tenemos el target definido, tendremos que estudiar qué variables son potenciales/candidatas a entrar en el modelo, para ello habrá que realizar un análisis de Poder Discriminante de cada variable frente al target, y así obtener aquellas con mayor tasa de respuesta del target. Hay dos tipos de variables candidatas para los modelos:

  • Alto valor poblacional y alto poder de respuesta del target.
  • Bajo valor poblacional y alto poder de respuesta del target.

poder-discriminante

¡Ojo con la multicolinealidad! Es importante tener presente el significado de cada variable, ya que un Poder Discriminante excesivamente bueno puedo significar que estamos replicando el Target.

Cuando tengamos estudiada la información, podremos construir los modelos, y aquí quiero hacer hincapié en el enfoque bayesiano que se le puede dar a estos modelos.

Un enfoque bayesiano permite reducir la incertidumbre asociada a los datos recopilados incorporando el conocimiento de negocio e incorporar en el modelo las distintas fuentes de información de las que se disponga a través de distribuciones de probabilidad y restricciones sobre los parámetros.

Por último, podremos analizar los datos mediante tablas de contingencia o de una manera más visual con las curvas ROC, Lift-Chart, o Cumulative-Lift-Chart. También podremos validar los modelos con estadísticos, los más comunes son: AUC, Gini, K-S o LIFT.

roc

Como habíamos comentado antes, hay que tener cuidado con la multicolinealidad, ya que es posible que si sale un resultado excesivamente bueno, podamos estar replicando el target con el conjunto de nuestras variables, por ello es necesario realizar un análisis SVD (Singular Value Descomposition). Con la matriz de resultado, si obtenemos alguna columna/fila de ceros, es porque estamos teniendo combinación lineal entre las variables, de no ser así, deberemos de dividir el valor de la matriz en la posición 1×1 entre el valor de la posición nxn (Recordad que el resultado del SVD será una matriz diagonal ordenada de mayor a menor), cuyo resultado debe de ser menor que 20, de lo contrario, estaremos replicando el TARGET.

¿Qué herramientas recomiendo para hacer estos modelos?

R y Python siempre son una buena opción, pero como ya he comentado en anteriores POST, TOL es una herramienta muy recomendable para la construcción de modelos. Si es cierto que en modelos cualitativos, es algo más complejo trabajar, ya que tienes que hacerlo con matrices y no con DataFrames, y esto puede resultar algo tedioso si no estás acostumbrado. Pero aún con esto, la facilidad para la construcción de modelos, y en especial para la inferencia bayesiana, lo convierte en la mejor opción. También comentar, que para las cadenas de Markov, TOL, hace una llamada a R porque resulta más eficiente este proceso, luego tendréis que tener R instalado en vuestras variables de entorno. Dejo la web de TOL para que le echéis un vistazo.

https://www.tol-project.org/

Esta ha sido una breve introducción en la que no hemos entrado en detalles técnicos ni matemáticas, pero sí lo haremos en otros artículos más adelante.

Espero que os haya parecido interesante y no dudéis en comentar.

Un saludo,

Pedro José Mendoza

analytics

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s