robot de la enciclopedia para niños

Aprendizaje automático para niños

Enciclopedia para niños

El aprendizaje automático (también conocido como machine learning en inglés) es una parte de las ciencias de la computación y de la inteligencia artificial. Su meta principal es crear técnicas que permitan a las computadoras aprender.

Una computadora aprende cuando mejora lo que hace gracias a la experiencia y al uso de datos. Es como cuando una habilidad no estaba en su programación inicial, pero la adquiere con el tiempo. Imagina que una computadora observa muchos datos, crea un modelo basado en ellos y luego usa ese modelo para resolver problemas.

El aprendizaje automático se parece mucho a la estadística inferencial porque ambas se basan en analizar datos. Sin embargo, el aprendizaje automático también se preocupa por lo difícil que puede ser para una computadora resolver ciertos problemas. Muchas veces, los problemas son tan complejos que se necesita mucha investigación para encontrar soluciones prácticas. Este campo también está muy conectado con el reconocimiento de patrones.

El aprendizaje automático busca automatizar algunas partes del método científico usando matemáticas. Es como un proceso para descubrir conocimiento a partir de la información.

Tiene muchas aplicaciones, como en los motores de búsqueda, para ayudar en diagnósticos, detectar fraudes con tarjetas de crédito, analizar mercados, clasificar secuencias de ADN, reconocer el habla y el lenguaje escrito, en juegos y en la robótica.

Archivo:Esquema aprendizaje
Aprendizaje automático

¿Cómo funciona el aprendizaje automático?

Algunos sistemas de aprendizaje automático buscan que las computadoras analicen datos sin necesidad de que un experto les diga qué hacer. Otros sistemas prefieren que el experto y la computadora trabajen juntos. Aunque las computadoras son muy útiles, la intuición humana sigue siendo importante. Por ejemplo, la persona que diseña el sistema debe decidir cómo se presentarán los datos y cómo se usarán.

Las computadoras son herramientas poderosas que usamos para muchas cosas buenas en la tecnología.

Tipos de modelos en el aprendizaje automático

El aprendizaje automático crea un "modelo" para resolver una tarea. Hay diferentes tipos de modelos:

  • Modelos geométricos: Se construyen en un espacio de datos y pueden tener varias dimensiones. Si hay una línea o superficie que separa claramente los datos en diferentes grupos, se dice que los datos son "linealmente separables".
  • Modelos probabilísticos: Intentan entender cómo se distribuyen las probabilidades de los datos. Un concepto clave aquí es la estadística bayesiana.
  • Modelos lógicos: Transforman las probabilidades en reglas que se organizan como árboles de decisión.

Los modelos también se pueden clasificar como modelos de agrupamiento (que dividen los datos en grupos) y modelos de gradiente (que muestran una diferencia gradual entre cada dato).

Tipos de algoritmos de aprendizaje

Archivo:Linear-svm-scatterplot
Una máquina de vectores de soporte

Los diferentes algoritmos de aprendizaje automático se agrupan según el tipo de resultado que producen. Algunos tipos son:

Aprendizaje supervisado

El algoritmo crea una función que relaciona las entradas con las salidas que se esperan del sistema. Por ejemplo, en un problema de clasificación, el sistema aprende a poner etiquetas (clasificar) a diferentes datos usando categorías. La computadora aprende de ejemplos que ya tienen etiquetas. Esto es muy útil en la investigación biológica y la bioinformática.

Aprendizaje no supervisado

En este caso, el sistema solo recibe datos de entrada y no tiene información sobre las categorías a las que pertenecen. Por eso, el sistema debe ser capaz de encontrar patrones por sí mismo para poder clasificar nuevas entradas.

Aprendizaje semisupervisado

Este tipo de algoritmos combina el aprendizaje supervisado y el no supervisado. Usa tanto datos que ya tienen etiquetas como datos que no las tienen para clasificar de forma más precisa.

Aprendizaje por refuerzo

El algoritmo aprende observando el mundo a su alrededor. Su información de entrada es la retroalimentación que recibe del exterior como respuesta a sus acciones. Así, el sistema aprende probando y corrigiendo errores.

El aprendizaje por refuerzo es el más general. En lugar de que alguien le diga al sistema qué hacer, el sistema aprende cómo funciona el entorno a través de recompensas o "castigos" (que indican si hizo algo bien o mal). El objetivo es aprender a maximizar las recompensas para tomar las mejores decisiones.

Un ejemplo famoso de aprendizaje por refuerzo es AlphaGo, un programa de inteligencia artificial creado por Google DeepMind para jugar al juego de mesa Go. En 2016, AlphaGo le ganó una partida al jugador profesional Lee Se-Dol, que es uno de los mejores del mundo. AlphaGo usa algoritmos avanzados, incluyendo el aprendizaje profundo. Puedes ver su historia en un documental.

Aprendizaje multi-tarea

Estos métodos usan el conocimiento que el sistema ya ha aprendido de problemas anteriores para resolver problemas nuevos que son parecidos.

El estudio de cómo funcionan y rinden los algoritmos de aprendizaje automático es una parte de la estadística llamada teoría computacional del aprendizaje.

Los humanos aprendemos de forma automática sin darnos cuenta de lo complejo que es. Desde que nacemos, adquirimos conocimientos y desarrollamos habilidades a través de la experiencia. Sin embargo, a las máquinas hay que enseñarles cómo aprender. Si una máquina no desarrolla sus habilidades, solo repetirá secuencias sin un verdadero aprendizaje.

Técnicas de clasificación importantes

Árboles de decisiones

Esta técnica usa un árbol de decisiones como modelo para predecir. Conecta lo que se observa de un objeto con conclusiones sobre su valor final. Los árboles son estructuras básicas en la informática y ayudan a tomar decisiones.

Existen diferentes formas de construir estos árboles, como las que miden la "impureza" de la información en cada rama, usadas en algoritmos como ID3 y C4.5.

Reglas de asociación

Los algoritmos de reglas de asociación buscan descubrir relaciones interesantes entre diferentes datos. Métodos conocidos son el algoritmo a priori y el algoritmo Eclat.

Algoritmos genéticos

Los algoritmos genéticos son procesos de búsqueda que imitan la selección natural. Usan métodos como la mutación y el "cruzamiento" para crear nuevas soluciones que puedan resolver un problema.

Redes neuronales artificiales

Las redes neuronales artificiales (RNA) se inspiran en cómo funcionan las neuronas en el cerebro de los animales. Son un sistema de conexiones entre "neuronas" que trabajan juntas para producir una respuesta. Estas conexiones tienen "pesos" numéricos que se ajustan con la experiencia, permitiendo que las redes aprendan. Su importancia ha crecido mucho con el desarrollo del aprendizaje profundo.

Máquinas de vectores de soporte

Las máquinas de vectores de soporte (MVS) son métodos de aprendizaje supervisado que se usan para clasificar y predecir. Usan ejemplos ya clasificados en dos grupos para construir un modelo que prediga a qué grupo pertenece un nuevo ejemplo.

Algoritmos de agrupamiento

El agrupamiento (o clustering) clasifica observaciones en subgrupos llamados clusters. Las observaciones dentro de cada grupo son muy parecidas entre sí.

Las técnicas de agrupamiento hacen suposiciones sobre la estructura de los datos y se guían por qué tan similares son los elementos dentro de un grupo y qué tan diferentes son los grupos entre sí. El agrupamiento es un método de aprendizaje no supervisado y es muy popular para analizar datos.

Redes bayesianas

Una red bayesiana es un modelo que representa variables al azar y cómo dependen unas de otras usando un gráfico. Por ejemplo, una red bayesiana puede mostrar las relaciones entre enfermedades y síntomas. Con ciertos síntomas, la red puede calcular la probabilidad de que ciertas enfermedades estén presentes. Hay algoritmos eficientes para aprender y usar este tipo de representación.

Tipos de conocimiento en el aprendizaje automático

En el aprendizaje automático, podemos obtener tres tipos de conocimiento:

1. Crecimiento

Es el conocimiento que se adquiere del entorno, como si dejara "huellas" en la memoria.

2. Reestructuración

Al interpretar lo que se sabe, se razona y se crea nuevo conocimiento.

3. Ajuste

Se obtiene al generalizar varios conceptos o al crear ideas propias.

Los tres tipos ocurren durante el aprendizaje automático, pero la importancia de cada uno depende de lo que se esté aprendiendo. El aprendizaje es fundamental para la inteligencia artificial.

Diferencia entre aprendizaje supervisado y no supervisado

El aprendizaje supervisado se caracteriza por tener información que indica qué datos son correctos para el objetivo de aprendizaje. Por ejemplo, si un programa aprende a reconocer rostros, se le dan muchas imágenes y se le dice cuáles son rostros y cuáles no.

En el aprendizaje no supervisado, el programa no tiene datos que le digan qué información es correcta. El objetivo principal es que el programa encuentre patrones por sí mismo para clasificar los datos en diferentes grupos, basándose en sus características. Siguiendo el ejemplo anterior, un programa no supervisado no podría decir si una imagen es un rostro o no, pero sí podría agrupar las imágenes que contienen rostros humanos, las que tienen rostros de animales y las que no tienen rostros. La información que se obtiene de un algoritmo no supervisado debe ser interpretada por una persona para que sea útil.

Aplicaciones del aprendizaje automático

Temas importantes del aprendizaje automático

Algunos temas clave que se estudian en el aprendizaje automático son:

  • Modelos para predecir resultados: clasificación y regresión
    • Redes neuronales artificiales
    • Árboles de decisión: Usan un árbol para predecir el valor de un objeto.
    • k-vecinos más próximos
    • Máquinas de soporte vectorial
  • Modelos para generar datos:
  • Técnicas para hacer inferencias aproximadas
  • Optimización: Muchos métodos de aprendizaje automático usan algoritmos de optimización.

Historia y conexión con otros campos

El aprendizaje automático surgió de la búsqueda de la inteligencia artificial. Desde los inicios de la IA, los investigadores quisieron que las máquinas aprendieran. Intentaron resolverlo con diferentes métodos, incluyendo las "redes neuronales" que eran modelos simples basados en estadísticas.

Hardware para el aprendizaje automático

Desde 2010, los avances en algoritmos y en el hardware de las computadoras han permitido entrenar redes neuronales profundas de manera más eficiente. Las unidades de procesamiento gráfico (GPU), que a menudo tienen mejoras específicas para la IA, se han vuelto el método principal para entrenar IA a gran escala en la nube. Se ha calculado que la capacidad de cómputo necesaria para los proyectos de aprendizaje profundo más grandes ha aumentado enormemente en pocos años.

Software para el aprendizaje automático

Muchos lenguajes de programación se pueden usar para crear algoritmos de aprendizaje automático. Los más populares en 2015 eran R y Python. R se usa mucho en el ámbito académico, mientras que Python es más popular en las empresas.

Existen muchos programas que incluyen algoritmos de aprendizaje automático:

Software de código abierto

  • TensorFlow: plataforma de Google.
  • Apache Mahout: plataforma de Java para algoritmos escalables.
  • dlib: biblioteca para C++.
  • ELKI: plataforma para Java.
  • Pytorch
  • KNIME
  • OpenCV
  • OpenNN
  • R: lenguaje de programación estadística.
  • RapidMiner
  • scikit-learn: biblioteca en Python.
  • Spark MLlib: parte de Apache Spark.
  • Weka: biblioteca en Java.

Software comercial

  • SPSS Modeler
  • Mathematica
  • MATLAB
  • Microsoft Azure Machine Learning
  • Neural Designer
  • Oracle Data Mining
  • STATISTICA
  • SAS

Sesgos en el aprendizaje automático

Los algoritmos de aprendizaje automático a veces pueden verse afectados por los sesgos que puedan tener los datos con los que se entrenan. Por ejemplo, si un sistema no recibe información sobre ciertas entradas durante su entrenamiento, no podrá clasificarlas correctamente. De hecho, cuando el entrenamiento se hace con datos clasificados por humanos, el aprendizaje automático puede reflejar los mismos sesgos que existen en la sociedad.

Por ejemplo, en 2016, un programa de Twitter de Microsoft desarrolló comportamientos inadecuados al observar los datos de esa red social. Por esta razón, en los últimos años se ha trabajado mucho en desarrollar métodos para aumentar la equidad y reducir los sesgos en estos algoritmos. Como dijo la experta Fei-fei Li: "La IA no tiene nada de especial. Se inspira en personas, es creada por personas, y lo más importante, impacta en las personas. Es una herramienta muy poderosa que apenas hemos empezado a entender, y eso es una gran responsabilidad".

Véase también

Kids robot.svg En inglés: Machine learning Facts for Kids

kids search engine
Aprendizaje automático para Niños. Enciclopedia Kiddle.