¿QUÉ ES LA VISIÓN ARTIFICIAL?
La visión artificial está muy ligada a la inteligencia artificial, aunque también está ligada a otras áreas como son el procesamiento de la señal o el reconocimiento de patrones. Se puede decir que la parte del proceso que está más relacionado con temas de inteligencia artificial es el reconocimiento en sí de la imagen una vez ha sido procesada (adquisición, segmentación de la imagen, detección de contornos, …). Un sistema de visión ha de poder distinguir qué elementos hay en la imagen, eso lleva a procesos de razonamiento, algoritmos de resolución de problemas (habitualmente satisfacción de restricciones), representación del conocimiento y tareas de aprendizaje automático.
Muchos son los problemas específicos en los que se aplica la visión artificial, por ejemplo, en el reconocimiento óptico de caracteres (OCR) o en interfaces biométricas (reconocimiento de caras, cámaras inteligentes). La robótica está bastante ligada a esta área, sobre todo la robótica industrial con aplicaciones bastante interesantes (y difíciles) como por ejemplo la conducción de coches.
La realidad para los seres humanos consta de 3 dimensiones espaciales, sin embargo, nuestros ojos como las cámaras o sensores con las que las computadoras pueden tomar perspectiva del mundo real solo pueden recibir imágenes en 2 dimensiones. El ser humano al contar con visión binocular y un cerebro que puede lograr sin problema la fusión sensorial, es capaz de percibir las 3 dimensiones y así poder ubicase en un espacio.
Por otro lado, una computadora solo puede recibir imágenes en 2 dimensiones. Para las personas una imagen vale más que mil palabras, ya que puede percibir e interpretar muchas conclusiones a partir de una sola imagen. Para una computadora, una imagen solo consta de bits y esto reduce significativamente la posibilidad de una interpretación. Es por esto que surge la rama llamada Visión Artificial, también conocida como visión computacional o procesamiento de imágenes. Esta rama utiliza la captación y procesamiento de señales con el fin de que una computadora pueda entender y así poder describir y llegar a resultados.
Nuestro cerebro para percibir y reconocer objetos realiza una serie de tareas automáticamente, y por lo mismo aun no podemos descifrar que hace para así simular estos comportamientos. Es por esto que existen distintas técnicas para recuperar la dimensión que perdimos (profundidad).
No hay comentarios:
Publicar un comentario