Cuando la policía de Londres (Reino Unido) probó hace poco un nuevo sistema de reconocimiento facial, cometió errores preocupantes y vergonzosos. Durante el Carnaval de Notting Hill, su moderna tecnología realizó 35 coincidencias falsas entre viandantes y sospechosos ya conocidos y buscados por la policía. Un ciudadano inocente fue arrestado por error.
La introducción de sistemas de vídeovigilancia en espacios públicos se ha justificado con la promesa de que contribuirían a una sociedad más segura. Sin embargo, los importantes avances tecnológicos de las últimas décadas todavía no son suficientes para lidiar con situaciones reales.
Las limitaciones de esta tecnología hacen que la vídeovigilancia aún dependa de vigilantes sentados en cuartos oscuros, que observan múltiples pantallas durante horas. Esto es del todo inadecuado para proteger la seguridad de los habitantes de una ciudad, los usuarios de un aeropuerto o los clientes de un centro comercial.
En España el uso de cámaras de seguridad es más reducido que en otros países de nuestro entorno. Por ejemplo, Reino Unido cuenta con más de 6 millones de cámaras en sus calles. Aun así, su uso está aumentando en lugares muy frecuentados por turistas y en ocasiones especiales (como en la última Semana Santa de Sevilla).
Por otra parte, la introducción de cámaras portátiles llevadas por miembros de las fuerzas y cuerpos de la seguridad del Estado no solo crea más vídeos que deben ser analizados. También datos más complejos, debido al movimiento constante de las cámaras.
Falta fiabilidad
Hoy en día, la vídeovigilancia automatizada se limita a tareas en entornos más o menos controlados. La detección de intrusos en una propiedad, el recuento de personas en un espacio y el reconocimiento de matrículas se pueden llevar a cabo con bastante precisión.
Por otro lado, el análisis de multitudes y la identificación de individuos en la calle no son fiables porque los espacios al aire libre y las condiciones en las que los vídeos son obtenidos son muy cambiantes. Para mejorar su análisis automatizado se necesita software que maneje esta variabilidad en lugar de tratarla como un inconveniente.
Para afrontar el problema es necesario un cambio de enfoque. Existe un área acostumbrada al manejo de enormes cantidades de datos cambiantes: la genómica.
‘Mutaciones’ en vídeo
Nuestras investigaciones más recientes sugieren que el análisis de vídeos podría mejorar bastante gracias a los avances informáticos realizados en una disciplina diferente: el análisis de secuencias de ADN. ¿Cómo? Tratando un vídeo como una escena que evoluciona de la misma manera que lo hace el ADN. Mediante la aplicación de técnicas ya contrastadas en el campo de la genómica podemos transformar la vídeovigilancia automatizada y mejorar sus resultados.
Desde la secuenciación de los tres mil millones de componentes que forman el ADN del genoma humano en 2001, la producción de datos genómicos ha aumentado a un ritmo exponencial. La gran cantidad de datos cambiantes a analizar ha conllevado una gran inversión de dinero y recursos para desarrollar software especializado para su tratamiento.
Hoy los científicos pueden acceder con facilidad a servicios de análisis del genoma para todo tipo de aplicaciones, desde combatir enfermedades y diseñar servicios médicos personalizados, hasta resolver los misterios de la historia humana.
El análisis genómico estudia la evolución de los genes a través de las mutaciones que se producen con el tiempo. Esto es muy similar al objetivo de la vídeovigilancia, que interpreta la evolución de una escena para detectar y seguir personas y sus acciones, en movimiento.
La llegada de la ‘videómica’
La conclusión es que si se trataran las diferencias entre las imágenes de un vídeo como mutaciones se podrían aplicar técnicas similares a las empleadas para el análisis genómico. Las primeras evaluaciones de este principio videómico han proporcionado evidencias de su validez y de su potencial.
Nuestro grupo de investigación ha demostrado que los vídeos se pueden analizar incluso cuando son grabados con una cámara móvil. Al identificar los movimientos de la cámara como mutaciones, estos pueden ser compensados para que una escena aparezca como si la cámara estuviera fija.
Además, estas técnicas han permitido producir modelos de una persona empleando múltiples imágenes previas de las mismas. Este es el primer paso hacia la construcción de un modelo estadístico que integraría cualquiera de las posturas y expresiones faciales de una persona.
Con más investigación, nuestra estrategia podría alcanzar la revolución de vigilancia visual que se prometió hace muchos años. Si se adoptara el principio de la videómica, la próxima década podría traer cámaras mucho más inteligentes. En este caso, sería mejor que no olvidáramos que será más fácil ser identificados en un vídeo.
Francisco Flórez Revuelta, Profesor Titular de la Universidad de Alicante, Universidad de Alicante y Jean-Christophe Nebel, Associate Professor in Pattern Recognition, Kingston University
Este artículo fue publicado originalmente en The Conversation. Lea el original.