Las empresas requieren de modelos de análisis predictivo para avanzarse a situaciones futuras, adaptarse al mercado y optimizar sus estrategias de cara al futuro. Existen dos tipos de análisis predictivo: los modelos de clasificación y los modelos de regresión.
No es ciencia ficción, es business intelligence. Los modelos y algoritmos de análisis predictivo ya son una de las ramas de la inteligencia artificial más usadas por los negocios.
A medida que el mundo en el que vivimos se complica y la cantidad de información se extiende, la capacidad de predecir qué pasará en el futuro adquiere relevancia.
En el mundo empresarial, las organizaciones ya perciben el análisis predictivo como una necesidad y lo aplican a diario sin darse cuenta. Los algoritmos de inteligencia artificial, machine learning y deep learning se están convirtiendo en una herramienta de negocio más.
En cuanto al análisis predictivo, sus aplicaciones son muy variadas: predicciones sobre el comportamiento del cliente, de la competencia, de la propia actividad, previsión de stock, etc. Las predicciones sobre lo que pasará la semana que viene, el mes que viene y el trimestre después forman parte del ADN de las estrategias de análisis de datos y business intelligence de las empresas.
Sin embargo, a pesar de usarlo de forma habitual, pocas personas saben qué hay detrás del análisis predictivo y cómo funciona en realidad.
El análisis predictivo combina varias técnicas estadísticas de modelado de datos, machine learning y data mining para hacer predicciones acerca del futuro mediante datos actuales e históricos.
La compañía estadounidense IBM define el análisis predictivo de esta manera: "El análisis predictivo es una rama de la analítica avanzada que realiza predicciones sobre resultados futuros utilizando datos históricos combinados con modelos estadísticos, técnicas de extracción de datos y machine learning. Las empresas emplean el análisis predictivo para encontrar patrones en estos datos e identificar riesgos y oportunidades."
En cuanto a disciplina, el análisis predictivo en forma parte de la ciencia de datos o data science. Son, por tanto, los científicos de datos los encargados de desarrollar modelos de análisis predictivo mediante el desarrollo de algoritmos de machine learning y deep learning que encuentran patrones en conjuntos de datos.
El análisis predictivo suele complementarse con la analítica prescriptiva, que aprovecha los insights descubiertos por el análisis predictivo para generar recomendaciones y proponer acciones de mejora.
Podemos diferenciar entre dos tipos de analíticas predictivas: los modelos de clasificación y los modelos de regresión. Ambos forman parte del machine learning supervisado, pero los modelos de clasificación modelan variables discretas, mientras que los modelos de regresión modelan variables continuas.
Los modelos de clasificación son aquellos que identifican una clase o categoría de entre una serie de categorías. Es decir, de entre un conjunto de variables establecidas, el algoritmo es capaz de reconocer a qué categoría pertenece una nueva variable.
Los modelos de clasificación aplicados a la analítica predictiva suelen usarse para hacer predicciones de tipo binario. Es decir, existen dos respuestas posibles y el algoritmo predice cuál de las dos opciones es más probable que suceda.
Sin embargo, también podemos emplear modelos de clasificación para predicciones no binarias. Los sistemas que reconocen qué hay en una imagen de entre una serie de opciones establecidas, por ejemplo, utilizan este tipo de algoritmos de clasificación.
En definitiva, la analítica predictiva por clasificación siempre nos da por resultado una categoría o clase.
Los modelos de regresión suelen ser más complejos que los modelos de clasificación y se usan para predecir el rendimiento de algo, habitualmente un producto, un proceso o un individuo.
Una de las formas más claras de diferenciar ambos modelos es que el análisis predictivo por regresión siempre da por resultado un número. Al contrario de los modelos de clasificación, los modelos de regresión son capaces de predecir qué pasará de entre un número infinito de posibilidades.
Esta clase de modelos suelen aplicarse para predecir el rendimiento de algo:
Más allá de los dos tipos de análisis predictivos ya mencionados, existen diversas técnicas de aplicación de estos dos modelos que se traducen en algoritmos matemáticos y estadísticos.
Análisis de regresión
Las técnicas de análisis de regresión son aquellas que relacionan variables entre sí. Los análisis de regresión pueden ser logísticas —predicen el resultado de una variable categórica con variables predictoras— o lineales —variables dependientes, independientes y elementos aleatorios—.
Árboles de decisión
Los árboles de decisión trabajan con aprendizaje supervisado y están formados por subconjuntos de variables de objetivos predeterminadas estructuradas en forma de árbol, ya que parten de un nodo que se ramifica en múltiples variables.
Redes neuronales
La técnica de redes neuronales se estructura en múltiples capas que se relacionan con otros elementos simples conectados entre sí. Precisamente por la similitud de esta estructura con las neuronas del cerebro, la técnica recibe este nombre.
El objetivo de la inteligencia artificial es intentar reproducir la inteligencia humana. Por este motivo, la técnica de redes neuronales ha evolucionado bastante en los últimos años.
En definitiva, la analítica predictiva es algo complejo de entender para personas no especializadas en la materia. Sin embargo, su uso ya es algo cotidiano y muchas compañías la están usando para optimizar procesos y adaptarse a las nuevas necesidades de los clientes y a las tendencias del mercado.