La investigación sobre interpretabilidad va viento en popa y la IA sigue mejorando. Me llamo Thomas y estás viendo... ¡el Informe de Progreso de la IA Segura! La interpretabilidad puede llamarse "la neurociencia de la IA". Miramos en el cerebro de la IA para entender por qué y cómo dan ciertos resultados. La seguridad de la IA suele centrarse en el paradigma de los circuitos. Sin embargo, un nuevo estudio de 300 artículos sobre interpretabilidad muestra otros 20 paradigmas dentro de este campo con resultados igualmente prometedores.
La vanguardia de la interpretabilidad - S37
La vanguardia de la interpretabilidad - S37
La vanguardia de la interpretabilidad - S37
La investigación sobre interpretabilidad va viento en popa y la IA sigue mejorando. Me llamo Thomas y estás viendo... ¡el Informe de Progreso de la IA Segura! La interpretabilidad puede llamarse "la neurociencia de la IA". Miramos en el cerebro de la IA para entender por qué y cómo dan ciertos resultados. La seguridad de la IA suele centrarse en el paradigma de los circuitos. Sin embargo, un nuevo estudio de 300 artículos sobre interpretabilidad muestra otros 20 paradigmas dentro de este campo con resultados igualmente prometedores.