Visión de máquina para niños
La visión de máquina o visión artificial es una tecnología que permite a las computadoras "ver" y entender imágenes. Se utiliza para realizar inspecciones y análisis automáticos en diferentes áreas, como la industria, el control de calidad y la guía de robots. Imagina que una máquina puede revisar productos en una fábrica para asegurarse de que todo esté perfecto, o ayudar a un robot a encontrar y mover objetos.
Esta tecnología combina muchos elementos: programas de computadora (software), equipos (hardware), sistemas completos y la experiencia de personas que saben cómo usarlos. La visión de máquina es una rama de la Ingeniería de sistemas que busca integrar tecnologías existentes de formas nuevas para resolver problemas del mundo real. Es muy común en la automatización industrial, pero también se usa para guiar vehículos. El proceso general implica planificar lo que se necesita, crear una solución, tomar imágenes, analizarlas automáticamente y extraer la información importante.
Contenido
¿Qué es la Visión de Máquina?
La visión de máquina se define como la tecnología y los métodos que se usan para obtener información de una imagen de forma automática. A diferencia del Procesamiento digital de imágenes, donde el resultado es otra imagen, aquí el objetivo es extraer datos. Por ejemplo, puede ser una señal simple que diga "pieza buena" o "pieza mala", o información más compleja como la identidad, posición y orientación de cada objeto en una imagen.
Esta información se usa en muchas aplicaciones, como la inspección automática de productos, la guía de procesos y robots en fábricas, el control de seguridad y la guía de vehículos. Es un campo que abarca una gran cantidad de tecnologías, programas, equipos y conocimientos. En la automatización industrial, "visión de máquina" es el término más usado.
Inspección y Clasificación Automática con Imágenes
Los usos principales de la visión de máquina son la inspección y clasificación automáticas de objetos usando imágenes, y la guía de robots. La "inspección automática" es un proceso que incluye planificar los requisitos del proyecto y luego crear una solución. Aquí te explicamos cómo funciona este proceso técnico durante la operación.
Cómo Funciona la Inspección Automática
El primer paso en la inspección automática es capturar una imagen. Para esto, se usan cámaras, lentes e iluminación especiales que están diseñadas para resaltar las características que se necesitan analizar. Los programas de visión de máquina utilizan varias técnicas de Procesamiento digital de imágenes para extraer la información necesaria. A menudo, estos programas toman decisiones, como si un producto "pasa" o "no pasa" el control de calidad, basándose en la información que extraen.
Los componentes de un sistema de inspección automática suelen incluir:
- Iluminación: Para iluminar el objeto de forma adecuada.
- Cámara: O algún otro dispositivo para capturar la imagen.
- Procesador: La "mente" que analiza la imagen.
- Software: Los programas que le dicen al procesador qué hacer.
- Dispositivos de salida: Para comunicar los resultados (por ejemplo, una señal para rechazar un producto).
Captura de Imágenes
El dispositivo que toma las imágenes (como una cámara) puede estar separado de la unidad principal de procesamiento o integrado en ella. Cuando están juntos, se les llama "cámara inteligente" o "sensor inteligente". Si están separados, la cámara se conecta a una computadora o a un dispositivo especial para procesar las imágenes.
Aunque la mayoría de las veces se usan imágenes 2D de luz visible, también existen otras formas de capturar imágenes, como:
- Imágenes multiespectrales: Capturan luz en diferentes longitudes de onda.
- Imágenes hiperespectrales: Capturan aún más detalles del espectro de luz.
- Imágenes infrarrojas: Usan luz infrarroja.
- Imágenes 3D: Para ver objetos en tres dimensiones.
- Imágenes de rayos X: Para ver a través de los objetos.
Las cámaras para visión de máquina necesitan ser muy específicas. Deben funcionar por mucho tiempo, a menudo en espacios pequeños, y tener alta definición y velocidad (fotogramas por segundo o FPS) para capturar detalles y errores en la producción. Interfaces como CoaXPress se usan para transferir esta información rápidamente, alcanzando velocidades muy altas. Es como el dicho "Basura entra, basura sale": si la imagen inicial no es de buena calidad, los resultados del análisis tampoco lo serán. La alta velocidad y calidad de imagen son clave. También se deben considerar las condiciones del ambiente industrial, como la temperatura o los golpes.
Aunque la mayoría de las aplicaciones usan imágenes 2D, las imágenes 3D están creciendo en la industria. El método más común para obtener imágenes 3D es la triangulación basada en escaneo. Un láser proyecta una línea sobre el objeto, y una cámara la ve desde un ángulo diferente. La forma en que la línea se desvía muestra las variaciones de la superficie. Varias líneas escaneadas se unen para crear un "mapa de profundidad" o una "nube de puntos" del objeto.
Procesamiento de Imágenes
Una vez que se captura una imagen, se procesa. Esto lo hacen componentes como la CPU, la GPU o una FPGA. El procesamiento suele tener varias etapas que terminan en el resultado deseado.
Una secuencia típica podría ser:
- Filtros: Modifican la imagen para mejorarla.
- Extracción de objetos: Identifican los objetos de interés.
- Extracción de datos: Miden o leen información de esos objetos (por ejemplo, leer códigos).
- Comunicación de datos: Envían los datos o los comparan con valores esperados para decidir si el objeto "pasa" o "no pasa".
Algunos métodos de procesamiento de imágenes en visión de máquina incluyen:
- Unión/Registro: Combinar imágenes para crear una más grande.
- Filtrado: Mejorar la imagen, por ejemplo, eliminando ruido.
- Umbral: Separar partes de la imagen basándose en su brillo (por ejemplo, convertir a blanco y negro).
- Conteo de píxeles: Contar píxeles claros u oscuros.
- Segmentación: Dividir una imagen digital en partes para que sea más fácil de analizar.
- Detección de bordes: Encontrar los límites de los objetos.
- Análisis de color: Identificar objetos por su color, evaluar la calidad o aislar características.
- Detección de "blobs": Encontrar grupos de píxeles conectados (como un agujero oscuro en un objeto).
- Aprendizaje profundo/Aprendizaje automático: Sistemas que aprenden de muchos ejemplos para tomar decisiones. Esto ha mejorado mucho la visión de máquina, permitiendo clasificar objetos, identificar si pasan o fallan, y leer texto.
- Reconocimiento de patrones: Encontrar, comparar o contar patrones específicos, incluso si están girados o parcialmente ocultos.
- Lectura de códigos: Leer códigos de barras, códigos de matriz de datos o códigos 2D.
- Reconocimiento óptico de caracteres (OCR): Leer texto de forma automática, como números de serie.
- Medición/Metrología: Medir las dimensiones de los objetos (en píxeles, pulgadas o milímetros).
- Comparación con valores esperados: Determinar si un objeto "pasa" o "no pasa" comparando sus características con estándares de calidad.
Resultados y Salidas
Una salida común de los sistemas de inspección automática son las decisiones de "aprobación/rechazo". Estas decisiones pueden activar mecanismos para rechazar productos defectuosos o hacer sonar una alarma. Otras salidas comunes incluyen la posición y orientación de un objeto para guiar robots.
Además, los sistemas pueden generar:
- Datos numéricos de mediciones.
- Datos leídos de códigos y caracteres.
- Conteo y clasificación de objetos.
- Visualizaciones del proceso o resultados.
- Imágenes guardadas.
- Alarmas de sistemas de monitoreo.
- Señales para el control de procesos.
También incluyen interfaces para que los usuarios interactúen y para que los sistemas se conecten y compartan datos automáticamente.
Aprendizaje Profundo en Visión de Máquina
El "aprendizaje profundo" es una técnica que ha existido por más de 20 años, pero su uso en visión de máquina se expandió mucho a finales de la década de 2010. Antes, la visión de máquina tradicional necesitaba que los defectos fueran "simples" de identificar (por ejemplo, un defecto oscuro en una pieza clara). Si no era así, la aplicación era muy difícil. El aprendizaje profundo elimina esta limitación, permitiendo que el sistema "vea" el objeto de una manera más parecida a como lo hace un ser humano.
Esto hace posible realizar aplicaciones automáticas que antes eran imposibles. El sistema aprende de una gran cantidad de imágenes durante una fase de "entrenamiento" y luego realiza la inspección durante su funcionamiento normal, lo que se llama "inferencia".
Guía de Robots con Visión de Máquina
La visión de máquina es muy útil para proporcionar a un robot la información de ubicación y orientación que necesita para agarrar productos correctamente. También se usa para guiar movimientos más sencillos que los de un robot, como un controlador de movimiento de uno o dos ejes. El proceso es similar al de la inspección automática, pero se enfoca en dar al robot la información precisa de posición y orientación.
El Mercado de la Visión de Máquina
La visión de máquina es un mercado importante. En 2006, se estimó que solo en América del Norte representaba un mercado de 1.5 mil millones de dólares. Sin embargo, algunos expertos dicen que la visión de máquina no es una industria por sí misma, sino una combinación de tecnologías y productos que benefician a otras industrias, como la automotriz, la fabricación de bienes de consumo, la agricultura y la defensa.
Galería de imágenes
Véase también
En inglés: Machine vision Facts for Kids