Inspirándose en el cerebro humano, investigadores belgas desarrollan una nueva generación de sensores

El cerebro humano es mucho más eficiente que las computadoras más poderosas del mundo. Un cerebro humano con un volumen medio de unos 1.260 cm3 consume alrededor de 12W (vatios) de potencia.

Usando esta maravilla biológica, la persona promedio aprende una gran cantidad de caras en muy poco tiempo. Entonces puede reconocer una de esas caras de inmediato, independientemente de la expresión. Las personas también pueden mirar una imagen y reconocer objetos de un número aparentemente infinito de categorías.

Compare eso con la supercomputadora más poderosa del mundo, Frontier, que se ejecuta en el Laboratorio Nacional de Oak Ridge y abarca 372 m.2 y consumiendo 40 millones de vatios de potencia en su punto máximo. Frontier procesa cantidades masivas de datos para entrenar modelos de inteligencia artificial (IA) para reconocer una gran cantidad de rostros humanos, siempre que los rostros no muestren expresiones inusuales.

Pero el proceso de entrenamiento consume mucha energía, y aunque los modelos resultantes se ejecutan en computadoras más pequeñas, siguen usando mucha energía. Además, los modelos generados por Frontier solo pueden reconocer objetos de unos pocos cientos de categorías, por ejemplo, persona, perro, automóvil, etc.

Los científicos saben algunas cosas sobre cómo funciona el cerebro. Saben, por ejemplo, que las neuronas se comunican entre sí mediante picos (umbrales de potencial acumulado). Los científicos han utilizado sondas cerebrales para examinar en profundidad la corteza cerebral humana y registrar la actividad neuronal. Esas medidas muestran que una neurona típica se dispara solo unas pocas veces por segundo, lo que es una activación muy escasa. En un nivel muy alto, este y otros principios básicos son claros. Pero la forma en que las neuronas computan, la forma en que participan en el aprendizaje y la forma en que se hacen y rehacen las conexiones para formar recuerdos sigue siendo un misterio.

Sin embargo, es probable que muchos de los principios en los que los investigadores están trabajando hoy sean parte de una nueva generación de chips que reemplacen las unidades de procesamiento de computadora (CPU) y las unidades de procesamiento de gráficos (GPU) dentro de 10 años o más. También es probable que los diseños de las computadoras cambien, alejándose de lo que se llama la arquitectura de von Neumann, donde el procesamiento y los datos están en diferentes ubicaciones y comparten un bus para transferir información.

Las nuevas arquitecturas, por ejemplo, ubicarán el procesamiento y el almacenamiento, como en el cerebro. Los investigadores están tomando prestado este concepto y otras características del cerebro humano para hacer que las computadoras sean más rápidas y más eficientes energéticamente. Este campo de estudio se conoce como computación neuromórfica y gran parte del trabajo se está realizando en el Centro Interuniversitario de Microelectrónica (Imec) en Bélgica.

“Tendemos a pensar que el comportamiento de picos es el nivel fundamental de computación dentro de las neuronas biológicas. Se están realizando cálculos mucho más profundos que no entendemos, probablemente hasta el nivel cuántico”, dice Ilja Ocket, gerente de programas de Computación neuromórfica en Imec.

Más contenido para leer:  Scottish university hit by Rhysida ransomware gang

“Incluso entre los efectos cuánticos y el modelo de comportamiento de alto nivel de una neurona, existen otras funciones intermedias, como los canales iónicos y los cálculos dendríticos. El cerebro es mucho más complicado de lo que sabemos. Pero ya hemos encontrado algunos aspectos que podemos imitar con la tecnología actual, y ya estamos obteniendo una gran recompensa”.

Existe un espectro de técnicas y optimizaciones que son parcialmente neuromórficas y ya han sido industrializadas. Por ejemplo, los diseñadores de GPU ya están implementando algo de lo que se ha aprendido del cerebro humano; y los diseñadores de computadoras ya están reduciendo los cuellos de botella mediante el uso de pilas de memoria multicapa. El paralelismo masivo es otro principio bioinspirado que se usa en las computadoras, por ejemplo, en el aprendizaje profundo.

Sin embargo, es muy difícil para los investigadores en computadoras neuromórficas hacer avances en la informática porque ya hay demasiado impulso en torno a las arquitecturas tradicionales. Entonces, en lugar de intentar causar interrupciones en el mundo de las computadoras, Imec ha centrado su atención en los sensores. Los investigadores de Imec están buscando formas de “dispersar” los datos y explotar esa escasez para acelerar el procesamiento en los sensores y reducir el consumo de energía al mismo tiempo.

“Nos enfocamos en sensores que son de naturaleza temporal”, dice Ocket. “Esto incluye audio, radar y lidar. También incluye visión basada en eventos, que es un nuevo tipo de sensor de visión que no se basa en marcos, sino que funciona según el principio de su retina. Cada píxel envía una señal de forma independiente si detecta un cambio significativo en la cantidad de luz que recibe.

“Tomamos prestadas estas ideas y desarrollamos nuevos algoritmos y nuevo hardware para respaldar estas redes neuronales de picos. Nuestro trabajo ahora es demostrar cuán baja potencia y baja latencia puede ser cuando se integra en un sensor”.

Spiking de redes neuronales en un chip

Una neurona acumula información de todas las otras neuronas a las que está conectada. Cuando el potencial de membrana alcanza cierto umbral, el axón, la conexión que sale de la neurona, emite un pico. Esta es una de las formas en que su cerebro realiza los cálculos. Y esto es lo que Imec hace ahora en un chip, utilizando redes neuronales de picos.

“Usamos circuitos digitales para emular el comportamiento de fugas, integración y disparo de las neuronas de picos biológicos”, dice Ocket. “Tienen fugas en el sentido de que mientras se integran, también pierden un poco de voltaje en su membrana; se están integrando porque acumulan picos que entran; y se disparan porque la salida se dispara cuando el potencial de membrana alcanza cierto umbral. Imitamos ese comportamiento”.

El beneficio de ese modo de operación es que hasta que los datos cambien, no se generan eventos y no se realizan cálculos en la red neuronal. En consecuencia, no se utiliza energía. La escasez de picos dentro de la red neuronal ofrece intrínsecamente un bajo consumo de energía porque la computación no ocurre constantemente.

Más contenido para leer:  En línea representa el 25% de las ventas minoristas tres meses seguidos

Se dice que una red neuronal con picos es recurrente cuando tiene memoria. Un pico no solo se calcula una vez. En cambio, repercute en la red, creando una forma de memoria que permite que la red reconozca patrones temporales, de manera similar a lo que hace el cerebro.

Utilizando la tecnología de red neuronal de picos, un sensor transmite tuplas que incluyen la coordenada X y la coordenada Y del píxel que está disparando, la polaridad (si está disparando hacia arriba o hacia abajo) y el tiempo en que se dispara. Cuando no pasa nada, nada se transmite. Por otro lado, si las cosas cambian en muchos lugares a la vez, el sensor crea muchos eventos, lo que se convierte en un problema debido al tamaño de las tuplas.

Para minimizar este aumento en la transmisión, el sensor realiza un filtrado al decidir el ancho de banda que debe emitir en función de la dinámica de la escena. Por ejemplo, en el caso de una cámara basada en eventos, si todo en un marco cambia, la cámara envía demasiados datos. Un sistema basado en marcos manejaría eso mucho mejor porque tiene una velocidad de datos constante. Para superar este problema, los diseñadores ponen mucha inteligencia en los sensores para filtrar datos, una forma más de imitar la biología humana.

“La retina tiene 100 millones de receptores, que es como tener 100 millones de píxeles en el ojo”, dice Ocket. “Pero la fibra óptica que atraviesa tu cerebro solo transporta un millón de canales. Entonces, esto significa que la retina realiza una compresión de 100 veces, y esto es un cálculo real. Se detectan ciertas características, como movimiento de izquierda a derecha, de arriba a abajo o pequeños círculos. Estamos tratando de imitar el algoritmo de filtrado que va en la retina en estos sensores basados ​​en eventos, que operan en el borde y envían datos a una computadora central. Podría pensar en el cálculo que se lleva a cabo en la retina como una forma de IA de borde”.

La gente ha estado imitando las neuronas en punta en el silicio desde la década de 1980. Pero el principal obstáculo que impidió que esta tecnología llegara a un mercado o a cualquier tipo de aplicación real fue el entrenamiento de redes neuronales de picos de manera tan eficiente y conveniente como se entrenan las redes neuronales profundas. “Una vez que establece una buena comprensión matemática y buenas técnicas para entrenar redes neuronales de picos, la implementación del hardware es casi trivial”, dice Ocket.

En el pasado, las personas construían picos en sus chips de red y luego hacían muchos ajustes para que las redes neuronales hicieran algo útil. Imec adoptó otro enfoque, desarrollando algoritmos en software que mostraban que una configuración dada de neuronas de pico con un conjunto dado de conexiones funcionaría a un cierto nivel. Luego construyeron el hardware.

Más contenido para leer:  Dell EMC: Storage giant shifts gear to cloud operating models

Este tipo de avance en software y algoritmos no es convencional para Imec, donde el progreso suele adoptar la forma de innovación de hardware. Otra cosa que no era convencional para Imec era que hacían todo este trabajo en CMOS estándar, lo que significa que su tecnología puede industrializarse rápidamente.

El futuro impacto de la computación neuromórfica

“La próxima dirección que estamos tomando es hacia la fusión de sensores, que es un tema candente en automoción, robótica, drones y otros dominios”, dice Ocket. “Una buena manera de lograr una percepción 3D de muy alta fidelidad es combinar múltiples modalidades sensoriales. Las redes neuronales salpicadas nos permitirán hacer eso con baja potencia y baja latencia. Nuestro nuevo objetivo es desarrollar un nuevo chip específicamente para la fusión de sensores en 2023.

“Nuestro objetivo es fusionar múltiples flujos de sensores en una representación 3D coherente y completa del mundo. Al igual que el cerebro, no queremos tener que pensar en lo que proviene de la cámara frente a lo que proviene del radar. Vamos por una representación intrínsecamente fusionada.

“Esperamos mostrar algunas demostraciones muy relevantes para la industria automotriz, y para la robótica y los drones en todas las industrias, donde el rendimiento y la baja latencia de nuestra tecnología realmente brillan”, dice Ocket. “Primero, estamos buscando avances para resolver ciertos casos de esquina en la percepción automotriz o la percepción robótica que no son posibles hoy en día porque la latencia es demasiado alta o el consumo de energía es demasiado alto”.

Otras dos cosas que Imec espera que ocurran en el mercado son el uso de cámaras basadas en eventos y la fusión de sensores. Las cámaras basadas en eventos tienen un rango dinámico muy alto y una resolución temporal muy alta. La fusión de sensores podría tomar la forma de un solo módulo con cámaras en el medio, algunas antenas de radar a su alrededor, tal vez un lidar, y los datos se fusionan en el propio sensor, utilizando redes neuronales de picos.

Pero incluso cuando el mercado adopta redes neuronales en sensores, es posible que el público en general no esté al tanto de la tecnología subyacente. Eso probablemente cambiará cuando la primera cámara basada en eventos se integre en un teléfono inteligente.

“Digamos que quiere usar una cámara para reconocer los gestos de sus manos como una forma de interfaz hombre-máquina”, explica Ocket. “Si eso se hiciera con una cámara normal, miraría constantemente cada píxel en cada fotograma. Tomaría un marco y luego decidiría qué está sucediendo en el marco. Pero con una cámara basada en eventos, si no sucede nada en su campo de visión, no se lleva a cabo ningún procesamiento. Tiene un mecanismo de activación intrínseco que puede explotar para comenzar a computar solo cuando hay suficiente actividad proveniente de su sensor”.

Las interfaces hombre-máquina de repente podrían volverse mucho más naturales, todo gracias a la detección neuromórfica.

Nuestro objetivo fué el mismo desde 2004, unir personas y ayudarlas en sus acciones online, siempre gratis, eficiente y sobre todo fácil!

¿Donde estamos?

Mendoza, Argentina

Nuestras Redes Sociales