Mejora de resultados en caras: Clasificador KNN

Durante el periodo de pruebas de la aplicación vimos que el sistema de reconocimiento de caras era bastante inestable. Ante pequeños cambios en la orientación de la cara o de iluminación, los resultados cambiaban drásticamente. Por ello optamos por mejorar el algoritmo de decisión implementando un sistema de clasificación KNN. Clasificador KNN Un clasificador KNN…

Cálculo de resultados

En esta entrada vamos a explicar cuales han sido los criterios de evaluación del sistema de reconocimiento de locutor y los pasos que hemos realizado para mejorar los resultados. Equal Error Rate En general los sistemas de reconocimiento biométrico tienen aplicaciones muy diferentes. Normalmente suelen utilizarse para permitir el acceso a algún recurso. En este…

Procesado de Audio v2.0

Ya hemos especificado en entradas anteriores los problemas que estamos teniendo para entrenar los modelos de forma correcta. Los errores continuos debidos a incompatibilidades de formato entre procesos y el reducido número de modelos sobre todo en mujeres hacen imposible funcionar con el sistema básico que desarrollamos para el primer hito. Así, la nueva arquitectura…

Procesado de Imágenes IV: Sistema completo

Igual que hicimos para explicar el sistema de reconocimiento de voz, vamos a subir esta entrada en la que mostramos el diagrama de bloques utilizado como arquitectura de nuestro sistema. Queda claro que en este caso, el proceso es mucho más sencillo. El único problema de diseño más allá del recortado de caras, es presentar…

Procesado de imagenes III: FaceCrop

Como ya hemos dicho en entradas anteriores, el proyecto que estamos utilizando para identificar caras es Pyfaces. Pyfaces es una aplicación simple de reconocimiento de caras que permite desarrollar aplicaciones de reconocimiento de una forma rápida y sencilla. Sin embargo, el principal problema que tiene es que necesita que las imagenes que se le pasen…

Procesado de Imagenes II: Blanco y Negro

Como hemos comentado en la entrada anterior, para poder ejecutar correctamente el código de Pyfaces es necesario que las imágenes estén en blanco y negro. Las imágenes que nosotros tomamos con la webcam están a color, por lo que será necesario un paso previo para que se conviertan a escala de grises. La aplicación para…

Procesado de Imagenes I: Primeros pasos con Pyfaces

A estas alturas del proyecto hemos comenzado a tratar con el procesado de caras. En este caso, a diferencia de la voz donde estamos implementando el sistema completo de reconocimiento, utilizaremos un sistema ya desarrollado de código libre. En principio el software que utilizaremos es Pyfaces. Esta aplicación, escrita en python implementa un sistema básico…

Procesado de Audio IV: Entrenamiento de modelos

Como ya hemos explicado en anteriores entradas, una pieza fundamental del reconocimiento de locutores a partir de i-vectores es el entrenamiento del sistema. Este entrenamiento se traduce en la generación de dos recursos, el modelo UBM y la matriz T. Para la obtención de estos ficheros es necesario partir de una gran base de datos…