Segmentación de imágenes por umbralización automática en imágenes en blanco y negro
OBJETIVO
El objetivo de la práctica es realizar un estudio comparativo de diversos algoritmos de umbralización automática en imágenes en blanco y negro. Se trabajará con imágenes reales captadas con el sistema títere, con ruido adicional aleatorio (aditivo y sustractivo) sobre un número de pixeles. El alumno deberá destacar el diferente comportamiento de los algoritmos, la robustez de los mismos ante el ruido y la influencia del porcentaje de pieza/fondo en la imagen.
IMÁGENES DE PRUEBA
Las imágenes utilizadas son reales, en color RGB24, de 480 columnas y 360 filas. Los datos suministrados de Giro y Elevación son aproximados. Las imágenes son las siguientes:
Imagen de la PIEZA_AMARILLA, con las siguientes condiciones de captación: Giro=225 ; Elevación=245 ; Zoom=750, 800, 850, 900, 950 ; Color=RGB24
Imagen de la PIEZA 1: Giro=40 ; Elevación=0 ; Zoom=1000 ; Color=RGB24 o BN
Imagen de la PIEZA 2: : Giro=40 ; Elevación=0 ; Zoom=1000 ; Color=RGB24 o BN
PIEZA AMARILLA
PIEZA 1
PIEZA 2
ALGORITMOS UTILIZADOS
Se emplean los siguientes algoritmos (para un repaso detallado, consultar el Tutorial de Visión Artificial), agrupados en los siguientes campos:
Generación y reducción del ruido
Generación de ruido aleatorio ("Algoritmos/Ruido/Generación/Aleatorio")
Mediana del entorno de vecindad ("Algoritmos/Ruido/Reducción/Mediana")
Media del entorno de vecindad ("Algoritmos/Ruido/Reducción/Media")
Opening ("Algoritmos/Morfología/Opening")
Closing ("Algoritmos/Morfología/Closing")
Tratamiento de imágenes en color
Conversión de una imagen de representación RGB a representación HSI ("Color/Conversión/RGBaHSI")
Selección de un canal de una imagen en color ("Color/Canales")
Algoritmos de segmentación. La mayoría de estos algoritmos (todos menos el de umbralización) poseen dos entradas: una para la imagen objeto de análisis y otra para una imagen de referencia. En el desarrollo de la práctica siempre se seleccionará la opción de trabajar sin imagen de referencia (No obstante recordar que para que el bloque se ejecute siempre tiene que haber una imagen en cada entrada, por lo que se recomienda duplicar la imagen de entrada). La salida de cada bloque es la imagen umbralizada (sólo dos niveles: 0 y 255). Cuando se genera un umbral automático, el umbral seleccionado se puede visualizar en la consola.
Umbralización ("Algoritmos/Segmentación/Umbralización") por umbral
Algoritmo Otsu ("Algoritmos/Segmentación/Otsu")
Algoritmo de Conservación de los Momentos ("Algoritmos/Segmentación/ Momentos")
Algoritmo Concavidad del Histograma ("Algoritmos/Segmentación/ Concavidad")
Algoritmo Concavidad Ponderada del Histograma ("Algoritmos/ Segmentación/ConcavidadPonderada")
Algoritmo Maximización de la Entropía ("Algoritmos/Segmentación/ Entropía")
Para evaluar la bondad de los algoritmos de segmentación, y su justificación, se emplearán:
La diferencia cuadrática entre la imagen segmentada por el algoritmo y una imagen teórica de segmentación.
El histograma de una imagen ("Algoritmos/ Histograma")
Por comodidad en el desarrollo de la práctica, se recomienda también el uso de los siguientes algoritmos:
Selección entre varias imágenes de entrada ("Algoritmos/Manipulación/ Selección")
Guardar una imagen en un buffer de trabajo local ("Algoritmos/ Manipulación/GuardaEnBuff")
Leer una imagen de un buffer de trabajo local ("Algoritmos/Manipulación/ LeeDeBuff")
Diferencia entre dos imágenes ("Algoritmos/DosImágenes/Diferencia").
Para más información, consultar el Tutorial sobre Visión Artificial existente en el sistema.
DESCRIPCIÓN DE LA PRÁCTICA
El alumno debe de realizar un estudio comparativo de los algoritmos de segmentación para las siguientes imágenes de partida:
Imagen de la PIEZA_AMARILLA, con distintos zoom: 750, 800, 850, 900, 950
Imagen de la PIEZA_AMARILLA con zoom 850, filtrada (opening + closing + mediana + media)
Imagen de la PIEZA_AMARILLA con zoom 850, con ruido adicional (considerar un ruido aleatorio en 2000 pixeles)
Imagen de la PIEZA_AMARILLA con zoom 850, con ruido adicional (considerar un ruido aleatorio en 2000 pixeles), filtrada (opening + closing + mediana + media)
Imagen de la PIEZA_1
Imagen de la PIEZA_2
Los pasos a desarrollar en la práctica son las siguientes:
Generación de las imágenes en blanco y negro a partir de la imágenes en color. El proceso será capturar la imagen en color, convertirla a representación HSI, para posteriormente seleccionar el tercer color (I= Intensidad o brillo). En la imagen de PIEZA_1 y PIEZA_2, se puede adquirir directamente en Blanco y Negro
Generación de la imagen de segmentación ideal, obtenida empleando la información colorimétrica (sólo para la PIEZA_AMARILLA). Una opción es obtener la imagen (R+G)/2-B, con un umbralización posterior (la selección del umbral la realizará el alumno), según la impresión visual.
Filtrado secuencial de la imagen (opening + closing + mediana + media)
Segmentación automática de la imagen, mediante los distintos métodos propuestos
Evaluación de los algoritmos de segmentación:
Cálculo del histograma para justificar los resultados obtenidos
Error cuadrático entre la imagen obtenida por la segmentación y la imagen ideal, obtenida por segmentación cromática (sólo para las imágenes que provienen de la PIEZA_AMARILLA)
Para las imágenes que provienen de PIEZA_1 y PIEZA_2, la evaluación de la bondad de la selección se hará por criterios visuales.
MÉTODO DE EVALUACIÓN
Los alumnos deberán de entregar un documento resumen del trabajo desarrollado, justificando los pasos seguidos y las conclusiones obtenidas.
El documento debe contener una tabla en la que se detalla los umbrales (con cada método) obtenidos para las siguientes pruebas:
ã Imagen de la PIEZA_AMARILLA, con distintos zoom: 750, 800, 850, 900, 950
Imagen de la PIEZA_AMARILLA con zoom 850, filtrada
Imagen de la PIEZA_AMARILLA con zoom 850, con ruido adicional
Imagen de la PIEZA_AMARILLA con zoom 850, con ruido adicional y filtrada
Imagen de la PIEZA_1
Imagen de la PIEZA_2
El documento debe de contener igualmente un juicio comparativo de los algoritmos (justificándolos en la mayor medida posible), destacando, entre otros lo siguientes puntos:
Robustez de los algoritmos en función del ruido existente en la imagen
Robustez de los algoritmos en función del cambio de relación de tamaño objeto/fondo (a base de variar el zoom de la imagen).
Comportamiento ante un filtrado exigente de la imagen
Los alumnos deberán de mandar al servidor de imágenes las áreas de trabajo generadas para la ejecución de la práctica (se recomienda trocearlas en varias áreas de trabajo). Por comodidad, si se emplea la versión local, se pueden traer en Diskette, o mandarlas por mail a
jsebas@etsii.upm.es