sábado, 3 de noviembre de 2012

Transformada Hough



La transformada de Hough es una técnica de extracción de función usado en análisis de imágenes, visión artificial y procesamiento digital de imágenes. Se basa en el reconocimiento de patrones en imágenes que permite encontrar ciertas formas dentro de una imagen, como líneas, círculos, etc. 

La versión más simple consiste en encontrar líneas. Su modo de operación es principalmente estadístico y consiste en que para cada punto que se desea averiguar si es parte de una línea se aplica una operación dentro de cierto rango, con lo que se averiguan las posibles líneas de las que puede ser parte el punto. Esto se continúa para todos los puntos en la imagen, al final se determina qué líneas fueron las que más puntos posibles tuvieron y esas son las líneas en la imagen.


El caso más sencillo de transformada de Hough es la transformación lineal para la detección de líneas rectas. En el espacio de la imagen, la línea recta se puede describir como y = mx + b , y puede ser trazada gráficamente para cada par de puntos de imagen ( x , y ). En la transformada de Hough, una idea principal es considerar las características de la línea recta en términos de el parámetro de la pendiente m y el parámetro de intersección b . Basándose en este hecho, la línea recta y = mx + b puede ser representado como un punto ( b , m ) en el espacio de parámetros. Sin embargo, uno se enfrenta al problema de que las líneas verticales dan lugar a valores sin límites de los parámetros m y b. Por lo que es mejor usar un par diferente de parámetros, las coordenadas polares, denotando  y , para las líneas en la transformada de Hough. 

El parámetro  representa la distancia entre la línea y el origen , mientras que es el ángulo del vector desde el origen a este punto más cercano. Usando esta parametrización, la ecuación de la recta se puede escribir como:



Implementación

El resultado de la transformada de Hough se almacena en una matriz que a menudo se llama un acumulador. Una dimensión de esta matriz son los ángulos θ y la otra dimensión son las distancias r, y cada elemento tiene un valor sabe cuántos puntos / píxeles están situados en la línea con parámetros (r, θ). Así el elemento con el valor más alto indica qué línea que está mejor representado en la imagen de entrada.




Ver más en Huogh Transform

1 comentario: