DATE:
2015-11-12
UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/497
UNESCO SUBJECT: 3304.99 Otras ; 3325.02 Televisión Por Cable ; 2209.90 Tratamiento Digital Imágenes ; 2405 Biometría
DOCUMENT TYPE: doctoralThesis
ABSTRACT
La visión artificial es una disciplina transversal ampliamente estudiada
en las últimas décadas. Los sistemas de visión artificial han sido
implantados con éxito en procesos industriales tales como automatización,
inspección o control de calidad, en sistemas de vigilancia o
de seguridad, en procesos médicos, etc. Sus objetivos y ventajas van
desde la mejora en la velocidad de los procesos a la automatización
de tareas que no pueden hacerse de otro modo.
Sin embargo, a día de hoy, los sistemas de adquisición y las condiciones
de entorno siguen siendo un factor muy importante a la hora
de marcar las limitaciones de uso del sistema. Es frecuente encontrar
procesos en los que no es posible interferir, por lo que no se pueden
obtener las condiciones de iluminación, espacio, ausencia de obstáculos,
etc., necesarias para la implantación de un sistema de visión.
En la presente Tesis Doctoral abordaremos el problema de analizar
y desarrollar técnicas de visión artificial robustas capaces de funcionar
en entornos no controlados. Para ello nos centraremos en varios
campos de aplicación, en los que propondremos varias contribuciones
con el objetivo de mejorar el rendimiento de los sistemas en entornos
realistas: adquisición de imagen, lectura de texto y reconocimiento
facial.
En primer lugar, nos centraremos en el problema de la adquisición
de imágenes de la mayor calidad posible para las posteriores etapas
de procesado. Este es un aspecto fundamental para poder mejorar el
rendimiento de los sistemas. Propondremos aquí un mecanismo de
evaluación de calidad de imagen orientado al ajuste inicial de sistemas
de adquisición para visión artificial. Este es un método que se
engloba dentro de las técnicas de medida de calidad relativa de imagen.
En segundo lugar, abordaremos un escenario de lectura automática
de texto, orientado a la automatización en la lectura de instrumentación
digital en procesos de calibración. Propondremos aquí varias
contribuciones. En primer lugar presentaremos un método para la
localización automática de texto en pantallas de dispositivos. A continuación
pasaremos a presentar un método en el ámbito del reconocimiento
de caracteres, en donde propondremos una serie de características
blandas para la clasificación. Finalmente, propondremos un
sistema de lectura completo (end-to-end) con el objetivo de automatizar
la lectura de pantallas de dispositivos digitales, alcanzando unas
prestaciones adecuadas para su uso en escenarios realistas.
En tercer lugar, nos centraremos en el problema del reconocimiento
facial en dispositivos móviles. El reconocimiento facial es una disciplina dentro de la visión artificial en la que se han realizado grandes
avances en los últimos tiempos. Con la aparición de smartphones y
tablets en los últimos cinco años, la aplicación del reconocimiento facial
al control de acceso y seguridad de la información en movilidad
ha cobrado un enorme interés. Estos entornos de movilidad son escenarios
no controlados especialmente complejos, tanto por sus condiciones
cambiantes como por sus restricciones computacionales. Propondremos
aquí varias contribuciones. En primer lugar se propondrá
un método de localización precisa de ojos para aplicación a reconocimiento
facial en condiciones realistas. En el mismo ámbito, también
se propondrán un marco de evaluación exigente que permita la comparación
justa de algoritmos de localización de ojos en condiciones
no controladas. A continuación, se propondrá un método de verificación
de vida colaborativo para su uso como medida contra ataques
de suplantación de identidad en sistemas de acceso móvil mediante
reconocimiento facial. Finalmente, se realizará una evaluación de rendimiento
de algoritmos de procesado en dispositivo móvil para su
uso en reconocimiento facial y se propondrá un esquema de reconocimiento
completo y robusto, capaz de funcionar íntegramente en el
dispositivo.
Finalmente, revisaremos la transferencia tecnológica alcanzada con
las investigaciones realizadas y las contribuciones propuestas, mostrando
así la versatilidad y aplicabilidad de los trabajos realizados
en escenarios reales que van desde la automatización industrial a la
seguridad en movilidad. Computer vision is a transversal discipline extensively studied in the
last decades. Computer vision systems have been successfully introduced
in industrial processes, such as automation, inspection or quality
control, in surveillance or security processes, in medical applications,
etc. Its goals and advantages range from the improvement in
speed to the automation of tasks that cannot be done otherwise.
However, nowadays the acquisition systems and the environment
conditions are still a very important factor to set the limitations of the
system use. It is common to find processes in which it is not possible
to interfere, so the lighting and space conditions, absence of obstacles
and other necessary conditions to introduce a computer vision system
cannot be achieved.
In this Thesis the problem of achieving robust computer vision techniques
in uncontrolled environments will be addressed. To do so, we
will focus in several application fields in which we will propose different
contributions aiming to improve the performance of the systems
in realistic environments.
Firstly, we will focus on the acquisition stage and the problem of
capturing the best image possible, for being used in the following
stages. This is an essential aspect for us to be able to improve the efficiency
of the systems. We will propose an image quality assessment
method intended to the initial adjustment of acquisition systems.
Secondly, we will address an automatic text reading scenario, focused
on the automation of digital instrumentation reading in calibration
processes. We will propose here several contributions. Firstly
we will present a method for automatic localization of text in digital
screens. Next, we will present a method in the field of character recognition,
in which a series of soft features for classification will be
proposed. And finally, we will propose an end-to-end reading system
with the aim of automating the reading in digital devices, achieving
good performance suitable for its use in real scenarios.
Thirdly, we will focus on the problem of face recognition in mobile
devices. Facial recognition is a computer vision discipline in which
big advances have been made in the last years. The growth of the
smartphone and tablet market in the last five years encouraged the
interest in using face recognition for information access control and
security in these devices. These mobile environments are especially
complex uncontrolled scenarios, not only due to the changing conditions,
but also because of the computing restrictions. Several contributions
will be proposed in this area. Firstly, a precise eye localization
method for facial recognition under realistic conditions will be suggested. In the same sphere, a challenging benchmark will be designed.
This will allow the fair comparison between algorithms for
eye localization under realistic conditions. Next, a collaborative liveness
detection method for its use against identity theft attacks will
be proposed. Finally, we will make a performance evaluation of facial
recognition processing algorithms in mobile devices. We will propose
a whole and robust recognition scheme, able to work completely
embedded in the device.
Finally we will review the technology transfer achieved through the
research and the proposed contributions in this Thesis. We will show
the versatility and applicability of the developed work in realistic
scenarios, covering from industrial automation to other scenarios like
mobile security.