Expertos crean nuevo modelo de aprendizaje automático

Un nuevo modelo de aprendizaje automático, nutrido con videos y audios grabados de un bebé desde los seis meses hasta su segundo cumpleaños, ha aportado nuevos conocimientos sobre la adquisición del habla en la infancia. Los resultados de este trabajo de investigadores de la Universidad de Nueva York ofrece información sobre cómo aprendemos palabras y conceptos, además servirá para desarrollar sistemas de IA que usen el lenguaje de forma más parecida a la humana.

Para avanzar en este ámbito, un equipo de la Universidad de Nueva York (NYU, por sus siglas en inglés) decidió desarrollar un nuevo modelo de aprendizaje automático, no a partir de datos masivos, sino con el ejemplo de la experiencia de cómo aprende a hablar un único niño, al que llamaron «bebé S».

Los autores diseñaron un experimento que consistió en entrenar un sistema de IA multimodal a través de los ojos y los oídos de «bebé S». Para ello utilizaron grabaciones de vídeo de una cámara frontal que recogieron desde que tenía seis meses hasta su segundo cumpleaños. Y examinaron si el modelo podía aprender palabras y conceptos presentes en la experiencia cotidiana de un niño.

El investigador de la universidad estadounidense y primer firmante del estudio, Wai Keen Vong explicó que en su ensayo utilizaron el conjunto de datos SAYCam, “un recurso muy rico e interesante que consiste en vídeos capturados con cámaras montadas en la cabeza en niños en desarrollo”.

“Nos centramos en un solo niño (bebé S) porque era el que tenía la mayor cantidad de datos del habla transcritos y esto nos facilitaba la tarea de modelarlo. Todo ser humano necesita aprender a hablar a partir de su propia información –y no de la de otros–, por lo que explorar si es posible adquirir aspectos del lenguaje con un modelo computacional, a partir de la información sensorial de un solo niño, es una forma única de abordar esta cuestión”, subrayó el científico y experto en IA.

Las conclusiones del estudio demuestran que el modelo, o red neuronal, puede aprender un número considerable de palabras y conceptos con el uso de fragmentos limitados de la experiencia del niño. Los videos solo captaron alrededor del uno por ciento de las horas de vigilia de «bebé S», pero fue suficiente para nutrir su modelo.

Fuente: Sinc

VTV/DS/lm/DB