banner
Centro de Noticias
No encontrará este nivel de calidad a un mejor precio.

Abriendo la caja negra

Apr 05, 2024

Cada segundo del día nos presenta opciones, desde decidir qué ponernos por la mañana hasta elegir un menú para la cena. Ya sea que una decisión sea trivial o cambie la vida, la toma de decisiones es un elemento fundamental de la experiencia humana.

Siempre es fácil preguntarse si una persona tomó la decisión correcta. A veces es imposible saberlo hasta que se revelan las consecuencias más tarde. El profesor Aviral Shrivastava (izquierda) y el candidato doctoral Shail Dave (derecha) están trabajando en una investigación para mejorar el diseño de la exploración espacial, un componente crucial en el diseño de aceleradores de aprendizaje profundo que optimizan la eficiencia con la que las computadoras ejecutan algoritmos de inteligencia artificial. Foto de Erika Gronek/ASU Descargar imagen completa

En los dominios de la arquitectura de hardware y software, los ingenieros utilizan una tecnología llamada exploración del espacio de diseño para ayudar a evaluar las opciones durante el proceso de diseño de la arquitectura informática para identificar el diseño de mejor rendimiento entre las opciones disponibles.

La tecnología de exploración espacial de diseño puede elegir una opción preferida en función de los resultados deseados, como la velocidad, el consumo de energía y la precisión. La tecnología se puede aplicar a una variedad de aplicaciones, desde software de reconocimiento humano o de objetos hasta microelectrónica de alto nivel.

El aprendizaje profundo, un método de inteligencia artificial inspirado en el cerebro humano, enseña a las computadoras a procesar datos. Los diseños de aceleradores de aprendizaje profundo, que son computadoras que se especializan en ejecutar eficientemente algoritmos de aprendizaje profundo para inteligencia artificial, se basan en la exploración del espacio de diseño para elegir entre sus extensas listas de opciones. Debido a que algunos de estos diseños de aceleradores tienen miles de millones de opciones para evaluar, los procesos de optimización existentes pueden tardar días o incluso semanas en completarse, incluso cuando se evalúa solo una pequeña fracción de las opciones.

El proceso se complica aún más por las exploraciones de cajas negras, en las que se basan los aceleradores de aprendizaje profundo para tomar decisiones. Las exploraciones de cajas negras están diseñadas para procesar información sin revelar ningún detalle sobre su razonamiento.

Shail Dave, candidato a doctorado en ingeniería informática en la Escuela de Computación e Inteligencia Aumentada, parte de las Escuelas de Ingeniería Ira A. Fulton de la Universidad Estatal de Arizona, está trabajando para solucionar este problema con un diseño explicable de exploración espacial, un marco de algoritmos y sistemas. que permitirá a los investigadores y diseñadores de procesadores comprender el razonamiento detrás de los diseños de aceleradores de aprendizaje profundo mediante el análisis y la mitigación de los cuellos de botella que ralentizan el proceso.

"Por lo general, los diseños de hardware y software se exploran y optimizan mediante mecanismos de caja negra, como algoritmos evolutivos o enfoques basados ​​en inteligencia artificial, como el aprendizaje por refuerzo y la optimización bayesiana", dice Dave. "Estos mecanismos de caja negra requieren cantidades excesivas de pruebas debido a su falta de explicabilidad y razonamiento involucrados en cómo la selección de una configuración de diseño afecta la calidad general del diseño".

Al agilizar el proceso de toma de decisiones del acelerador, la investigación de Dave permite que los métodos de diseño tomen decisiones mucho más rápido, tomando sólo unos minutos en comparación con los días o semanas que pueden tardar los modelos existentes en procesar esta información. Como resultado, los modelos de optimización del diseño son más pequeños, más sistemáticos y utilizan menos energía.

La investigación de Dave ofrece una alternativa que no solo mejora la eficiencia de la búsqueda, sino que también ayuda a los ingenieros a alcanzar resultados óptimos y obtener información sobre las decisiones de diseño. Al comprender el razonamiento detrás de las opciones de diseño y los obstáculos relacionados, el método puede analizar los puntos de diseño disponibles en cada paso del proceso y determinar las opciones buenas y malas antes de ofrecer su decisión, que la tecnología toma deliberadamente después de evaluar las opciones más prometedoras disponibles. .

Dave señala que sus algoritmos también pueden ajustar los parámetros de diseño en varios casos de uso. Por ejemplo, los algoritmos pueden presupuestar la energía de las baterías para lograr la máxima eficiencia en dispositivos que varían en tamaño, desde un teléfono inteligente hasta potentes procesadores en una supercomputadora, mientras finalizan el procesamiento de la aplicación en el tiempo deseado.

En particular, el algoritmo de Dave puede explorar soluciones de diseño que son relevantes para múltiples aplicaciones, como aquellas que difieren en funcionalidad o características de procesamiento, y al mismo tiempo aborda sus ineficiencias en la ejecución del producto. Esto es importante porque muchas de las aplicaciones actuales basadas en inteligencia artificial requieren procesamiento multimodal, lo que significa que es posible que sea necesario utilizar un diseño de acelerador para completar múltiples tareas.

"Lo mejor de este trabajo es que formaliza cómo aprovechar la información de un sistema para tomar decisiones informadas y se puede aplicar en una amplia variedad de usos y diferentes industrias donde estos sistemas objetivo necesitan mejoras y explicabilidad en el proceso", dice Dave. "Estamos analizando cómo obtener el mejor rendimiento para cualquier configuración de arquitectura determinada con diferentes restricciones, dependiendo de lo que el usuario priorice como necesidad más importante".

El artículo de Dave sobre esta investigación, titulado "Explainable-DSE: An Agile and Explicable Exploration of Efficient Hardware/Software Codesigns of Deep Learning Accelerators usando Bottleneck Analysis", ha sido aceptado en la Conferencia Internacional 2024 de la Association for Computing Machinery sobre soporte arquitectónico para lenguajes de programación. y Sistemas Operativos, o ASPLOS, un foro académico de primer nivel para la investigación multidisciplinaria de sistemas informáticos que abarca hardware, software y la interacción entre los dos campos.

Además, la investigación de Dave obtuvo el segundo lugar en la categoría de posgrado del Concurso de Investigación para Estudiantes de la Asociación de Maquinaria de Computación 2022, reconociendo su trabajo como uno de los estudiantes de investigación en ciencias de la computación e ingeniería más importantes del mundo.

Aviral Shrivastava, profesor de informática e ingeniería en las escuelas de Fulton y mentor y colaborador de Dave en la investigación, dice que está orgulloso de ver a Dave celebrado por su arduo trabajo.

"Se necesita un estudiante muy motivado para lograr este tipo de éxito", dice Shrivastava. “Hay mucha reflexión, complejidad y detalle en una investigación como esta. Realmente necesitas trabajar con investigadores sólidos, y Shail ha sido uno de ellos en mi equipo”.

Dave y Shrivastava también están trabajando juntos para aplicar esta investigación a la industria de semiconductores con el programa de hardware de inteligencia artificial para Semiconductor Research Corporation, que aborda los desafíos existentes y emergentes en las tecnologías de la información y la comunicación y apoya la investigación para superar el desafío de transformar el diseño y la fabricación. de futuros microchips.

Shrivastava señala que uno de los impactos beneficiosos de esta investigación en el mundo real es que reduce drásticamente los requisitos de energía y la huella de carbono producida por este trabajo en comparación con los modelos y procesos existentes.

"El entrenamiento de redes neuronales puede tener la misma huella de carbono que un vuelo transatlántico", dice Shrivastava. "Poder reducir la huella de carbono general haciendo que esta tecnología sea más eficiente tendrá un gran impacto global".

Con su importante impacto ambiental positivo y su capacidad para guiar los procesos de toma de decisiones de manera más efectiva, Shrivastava considera que el impacto de la investigación tendrá implicaciones en casi todos los campos e industrias.

"Al diseñar estos aceleradores de una manera más formal, sistemática y automática, evitamos que la gente tenga que buscar interminablemente en el espacio sin ninguna orientación", afirma. "Esta tecnología ofrece una forma introspectiva, inteligente y reveladora de dar sentido a toda la información disponible".

Especialista en Comunicaciones, Escuelas de Ingeniería Ira A. Fulton

602-543-1590 [email protected]