Machine Learning y su clasificación.

Hablar de Machine Learning se ha vuelto tan común y se describe en varias áreas de estudio como una herramienta de apoyo, pero ¿Qué es realmente el Machine Learning?.

En una definición general :

“Machine Learning is the field of study that gives computers the ability to learn without being explicitly programmed. ”

-Arthur Samuel, 1959-

Pero la definición que más encontraremos y que más ayuda nos dará en la práctica, es la que está más apegada al campo de la ingeniería:

“A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.”

-Tom Mitchell, 1997-

Tipos de sistemas de Machine Learning

Existen diferentes tipos de ML, cada uno se clasifica de acuerdo a su uso y estos pueden aplicarse en cualquier combinación:

  • Pueden  o no, ser entrenados bajo supervisión humana (supervisado, no supervisado, semi-supervisado y reforzado).
  • Pueden o no, aprender incrementalmente durante su aplicación (Online vs Batch Learning).
  • Si funcionan simplemente comparando nuevos data points con data points conocidos, o si detectan patrones en los datos de entrenamiento y se construye un modelo predictivo (instance-based vs model-based learning).

Aprendizaje supervisado

El aprendizaje supervisado es un tipo de algoritmo de ML que emplea un conjunto de datos conocidos (training set) para realizar predicciones. El conjunto de datos de entrenamiento incluye datos de entrada y valores de respuesta. El algoritmo busca crear un modelo que pueda realizar predicciones acerca de los valores de respuesta para un nuevo conjunto de datos.  Es común  utilizar un conjunto de datos de prueba para validar el modelo (test set).

El aprendizaje supervisado se divide en dos categorías:

  • Clasificación: para valores de respuesta categóricos, en los que los datos se pueden separar en “clases” específicas.
  • Regresión: para valores de respuesta continua.

Algunos algoritmos de aprendizaje supervisado son:

  • K-Nearest Neighbors
  • Linear Regression
  • Logistic Regression
  • Support Vector Machines (SVMs)
  • Decision Trees and Random Forest
  • Neural Networks

Aprendizaje no supervisado

En los algoritmos no supervisados no es necesario disponer de la respuesta correcta en los datos de entrenamiento. Ya que no se busca la reproducción de un resultado conocido, sino el descubrimiento de nuevos patrones o resultados.

Algunos algoritmos de aprendizaje no supervisado son:

  • Clustering
    • k-Means
    • Hierarchical Cluster Analysis (HCA)
    • Expectation Maximization
  • Vizualization and dimensionality reduction
    • Principal Component Analysis (PCA)
    • Kernel PCA
    • Locally-Linear Embedding (LLE)
    • t- distributed Stochastic Neighbor Embedding (t-SNE)
  • Association rule learning
    • Apriori
    • Eclat

Semi- supervisado y reforzado

En el semi-supervisado el flujo de trabajo es iterativo y aprovecha las relaciones que pueden encontrarse en datos no etiquetados. Estas técnicas pueden mejorar modelos al combinar grupos de datos etiquetados y no etiquetados de varias maneras.

El aprendizaje reforzado es considerado como una bestia diferente. En este contexto se denomina a un agente, como algo que puede observar e interactuar en su ecosistema, seleccionar y ejecutar acciones, por lo tanto se le puede recompensar o penalizar si la actividad ejecutada es correcta o no, de esta manera el agente aprende. Esta basado en los principios la psicología conductista.

Mario como ejemplo de aprendizaje reforzado.

Una breve descripción de lo que es el Machine Learning y su clasificación, no obstante cualquiera de sus clasificaciones se pueden utilizar en conjunto y combinación para ayudar a resolver problemas más complejos. La cantidad de algoritmos van en aumento y con ello nuevas áreas como el Deep Learning, en está área sera importante comprender conceptos más complejos como las redes neuronales.

Escrito por Irving Ariel Escamilla Jacobo.

Deja un comentario