TFIPDL


Las redes neuronales profundas constituyen, en la actualidad, la base de la mayor parte de las aplicaciones de inteligencia artificial. Esto es debido, por un lado, al incremento de la capacidad de procesamiento de las máquinas y, por otro, a la capacidad que tienen de aprender de forma automática a partir de un conjunto apropiado de ejemplos. Algunas de las redes neuronales más utilizadas, especialmente en problemas de procesamiento de imagen e identificación de objetos, son las denominadas redes neuronales convolucionales. Esencialmente, estas redes consisten en la repetición de dos etapas: la convolución, que permite identificar características relevantes de los ejemplos considerados; y el pooling, que permite reducir el tamaño de los datos. Ambos procesos se llevan usualmente a cabo utilizando siempre las mismas funciones matemáticas, independientemente de cuál sea el problema específico considerado.

En este proyecto nos hemos planteado estudiar la posible mejora de los resultados obtenidos con una red neuronal profunda en problemas de detección de objetos mediante el diseño de funciones específicas de convolución y pooling adaptadas a este problema en concreto. Para ello, hemos desarrollado en paralelo el análisis teórico de las propiedades que cabe esperar de dichas funciones y el desarrollo experimental de una red neuronal profunda para el problema indicado. El proyecto es un primer paso para la identificación de las técnicas más apropiadas para cada problema específico, lo que abre la puerta a posibles mejoras significativas en las aplicaciones industriales en un futuro próximo.

 

De los resultados obtenidos se deduce que las modificaciones del pooling, salvo en casos muy concretos, no conducen a una mejora excesiva. En cambio, el estudio realizado sugiere que las modificaciones en la convolución pueden ser muy relevantes, ya que el uso de funciones que tengan en cuenta las relaciones entre características de los datos pueden permitir mejorar el rendimiento de las redes convolucionales. Sin embargo, estos cambios resultan muy complejos de implementar debido tanto a dificultades computacionales como a la necesidad de desarrollar nuevas técnicas matemáticas que puedan traducirse al código de las redes e incluidas de forma apropiada en sus mecanismos de aprendizaje.

 

De todas formas, este proyecto supone solo la primera parte de un trabajo ambicioso en el que esperamos obtener desarrollos de redes neuronales profundas completamente originales capaces de adaptarse de forma muy eficiente a problemas de imagen propios de la automoción, como son la detección de componentes o el procesamiento a tiempo real de imagen.


  • Año: 2019
  • Sector estratégico: Movilidad eléctrica y conectada
  • Líder del proyecto: Universidad Pública de Navarra
  • Socios del proyecto: NAITEC
X