La creciente diversificación del tipo y el volumén de datos, el abaratamiento de los costos de procesamiento computacional y de los costos de almacenamiento han abierto una ventana de oportunidad para el resurgir de una disciplina que sobre el papel y entre ecuaciones ya existía: el machine learning.

¿Qué es Machine Learning?

Machine Learning es una técnica de inteligencia artificial usada dentro del análisis de datos que automatiza la construcción de modelos analíticos mediante el iterativo descubrimiento de patrones dentro de un conjunto de datos. Usando algoritmos que automática e iteradamente aprenden de los datos, los modelos analíticos resultantes son luego usados para resolver problemas específicos asociados a dicho conjunto de datos.

Cuando hablamos de modelos analíticos nos referimos a todo el conjunto de reglas lógicas, analíticas y/o empíricas que mejor describen al conjunto de datos. Es cómo hablar de las mejores fórmulas por las cuales el conjunto de datos se rige, aunque no necesariamente sean siempre las mismas cuando se recogen más datos.

El que un algoritmo aprenda automáticamente significa que para determinado problema es capaz de aprender patrones que no han sido definidos ni programados previamente. Debido a esta forma automática de detección de patrones, el algoritmo también puede automáticamente mejorar en su aprendizaje con crecientes conjuntos de datos.

Para aprender iteradamente los algoritmos sencillamente recurren al mismo conjunto de datos una y otra vez, con un objetivo o problema concreto, modificando el conjunto de reglas internas (modelo analítico) con cada iteración para ajustarlo lo mejor posible al conjunto de datos visto. La combinación de estas dos características resulta en algoritmos que son capaces de actualizarse a si mismos con nuevos datos, siempre produciendo el mejor modelo analítico que describe al conjunto de datos.

Machine Learning es más que poner mágicamente a los ordenadores a aprender

Imágenes obtenidas de Freepik

¿Qué problemas se resuelven con machine learning?

Para evitar pifias en el uso de machine learning, debemos, a pesar de la naturaleza automática e iterada del machine learning, plantear problemas que sean “desconocidos conocidos”: problemas que sabemos que existen, pero cuyas respuestas desconocemos. Los problemas desconocidos conocidos suelen ser interrogantes y curiosidades que surgen naturalmente del conocimiento de un área específica del negocio. Y generalmente pueden dividirse en tres grandes grupos:

  1. Descriptivos (minería de datos): Van relacionados a preguntas y problemas más clásicos y cercanos al BI, cómo que correlaciones hay entre unas ventas y algunos clientes, qué patrones de negocio han existido en el tiempo o cuales y cuantos distintos grupo de clientes existen que compren un determinado producto/servicio.
  2. Predictivos (pronósticos): Los problemas de tipo predictivo se presentan cuando nos interesa saber qué y con cuanta certeza ocurrirá un determinado resultado en nuestro proceso de negocio. Generalmente se suele hablar de predicciones cuando intentamos proyectar un determinado proceso en el tiempo, pero también se habla de predicciones cuando se intenta saber qué tipo de clientes comprará nuestros productos/servicios, que tipo de respuesta tendrá determinado mercado o cual será el impacto de determinada campaña de marketing.
  3. Prescriptivos (optimización): Una vez se ha desarrollado la predicción para determinado problema, seguidamente nos interesa saber cómo actuar. Para problemas y predicciones relativamente simples y de bajo impacto, la toma de decisiones suele ser fácil. Pero con el aumento de complejidades y de interdependencia entre agentes, procesos y resultados, tomar decisiones resulta complicado. Machine learning permite atacar este tipo de problemas iterando y aprendiendo a tomar siempre la decisión más óptima (dado un resultado deseado) en ambientes y contextos altamente complejos.

Algunos de los ejemplos más ampliamente publicitados del uso de machine learning son:

  • Recomendación de productos de Amazon y Netflix en base a los patrones de grupos de clientes ya existentes.
  • Seguimiento de la opinión de los usuarios y clientes en Twitter y reconocimiento del sentimiento generalizado de las opiniones expuestas.
  • Detección del fraude en sistemas financieros en base a la búsqueda de patrones anómalos de comportamiento.
  • Coches autónomos cuyos modelos están entrenados en muchas dimensiones y conceptos: reconocimiento de imágenes y elementos de las vías, identificación de patrones de conducción o la predicción de movimientos de otros coches.

¿Debo implementar machine learning en mi empresa?

¡Sí! Pero siempre y cuando hayamos pasado la siguientes reglas:

  • ¿Tengo un proceso o área de negocio que genera grandes volúmenes de datos?
  • ¿Es el proceso o área repetitivo y tengo el presentimiento de que existe un patrón en el comportamiento?
  • ¿Hay un problema o interrogante concisa que quiero responder a partir de los datos? ¿Alguna situación de negocio que me interesa predecir?

¿Qué hago para implementar machine learning en mi empresa?

  1. Formula y acota el problema a resolver.
  2. Identifica la fuente de datos y si es necesario ampliar la recopilación
  3. Empápate del conocimiento existente y ayúdate con profesionales que ya hayan resuelto problemas similares
  4. Elije la herramienta correcta para resolver el problema elegido
  5. Evalúa la solución y sus resultados, e itera los pasos anteriores hasta encontrar mejores soluciones al problema.
  6. Despliega la mejor solución cómo un servicio en tu organización para ayudar en la toma de decisiones o para añadir funcionalidad a una determinada área.

Conclusiones

Debido a la alta disponibilidad de datos y la reducción en costos de procesamiento y almacenamiento informático el machine learning se ha abierto paso como una herramienta para la detección de patrones en conjuntos de datos, con la consecuente aplicación a la toma de decisiones y previsiones en un negocio. El machine learning permite de manera automática identificar los mejores modelos analíticos en conjuntos de datos para resolver un problema determinado, ya sea describir lo ocurrido, predecir futuros comportamientos o ayudar en la toma de decisiones en situaciones de alta complejidad.

La implementación de machine learning en un negocio debe darse siempre que se identifique la necesidad de resolver un problema dentro de un contexto con grandes volúmenes de datos, de un proceso repetitivo y con algunos patrones identificados, y si la resolución de dicho problema añade valor mediante la descripción, predicción, o optimización de algún proceso que ayude a la toma de decisiones. Para implementar Machine Learning lo más importante es identificar el problema a resolver. Una vez identificado el problema, hay que iterar el proceso de prueba – solución – evaluación hasta dar con un algoritmo que sea de valor.

Machine Learning en SolidQ

Este post es el inicio de una serie de artículos introductorios sobre Machine Learning. En nuestros siguientes artículos ahondaremos un poco más en:

  • Problemas comunes que resuelve el Machine Learning
  • Implementación y soluciones de Machine Learning con herramientas de Microsoft.
  • Ejemplos de uso en soluciones aplicadas a problemas de negocio.

En SolidQ tenemos amplia experiencia en la aplicación de Machine Learning con tecnologías de Microsoft, R y Python a problemas de negocios reales. Estamos disponibles para guiarte y si es necesario desarrollar tu solución de Machine Learning para tus problemas de minería de datos, predicciones u optimizaciones. Adicionalmente ofrecemos un taller de 5 días de introducción a Machine Learning. Más información en nuestra página web

Tama Francisquez

Data-curious fellow who joined SolidQ in 2016.

Latest posts by Tama Francisquez (see all)