Como Aprendemos - Stanislas Dehaene (PDF)
Document Details
Uploaded by Deleted User
Stanislas Dehaene
Tags
Related
Summary
This book explores the fascinating topic of learning from a neuroscientific perspective. It delves into the biological basis of learning, including neuronal processes and the impact of factors like childhood sensitivity. The book offers practical advice for improving education based on Dehaene's research.
Full Transcript
¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene 1 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Reseña «El ce...
¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene 1 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Reseña «El cerebro humano es una máquina extraordinaria, capaz de transformarse a sí misma a partir de la experiencia y de albergar talentos que nos vuelven únicos como especie: lenguaje, lectura, matemáticas, creación artística. La más asombrosa de sus facultades es sin dudas la del aprendizaje, aquella que nos permite no solo adaptarnos a las circunstancias, sino también lanzarnos con entusiasmo en busca de lo desconocido. Un bebé aprende más rápido y más profundo que cualquier dispositivo de inteligencia artificial. Y por si esto fuera poco, los seres humanos han inventado un medio de inconmensurable eficacia para expandir su fabulosa capacidad. ¿Robots inteligentes? ¿Supercomputadoras? No: la escuela, esa poderosa institución de alcance masivo que acelera el desarrollo de nuestras habilidades y la transmisión del conocimiento acumulado por generaciones. Reuniendo aportes de las neurociencias, la psicología cognitiva, la informática y la pedagogía, ¿Cómo aprendemos? explora en detalle las investigaciones acerca del aprendizaje y sus fundamentos biológicos: ¿cuáles son los procesos neuronales implicados?, ¿por qué la infancia y la juventud son tan sensibles?, ¿podemos seguir aprendiendo toda la vida?, ¿cuánto hay de innato y cuánto de adquirido en los dominios más relevantes de nuestro conocimiento? ¿Todos somos iguales a la hora de aprender? ¿Cuál es el rol de la memoria, de la atención? ¿Qué papel cumplen la nutrición, el sueño 2 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene o la actividad física en el desarrollo? ¿Qué función tiene el error? Pero Stanislas Dehaene, célebre neurocientífico y presidente del Consejo Científico de Educación Nacional de Francia, no se queda en el laboratorio: para que todos podamos aprender a aprender, plantea con claridad las consecuencias prácticas de estos descubrimientos. Entre ellas, destaca el valor intrínseco del juego, el placer y la socialización, pero también de la concentración, la práctica continuada y la evaluación. De la mano de los cuatro pilares del aprendizaje –la atención, el compromiso activo, el buen feedback y la consolidación–, lleva recomendaciones precisas para implementar en la familia y en la escuela de manera cotidiana.» 3 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Índice Este libro (y esta colección) Introducción a las ciencias del aprendizaje Parte I. ¿Qué es aprender? 1. Siete definiciones del aprendizaje 2. Por qué nuestro cerebro aprende mejor que las máquinas actuales Parte II. Cómo aprende nuestro cerebro 3. El saber invisible: las sorprendentes intuiciones de los bebés 4. El nacimiento de un cerebro 5. Lo que adquirimos 6. Reciclen su cerebro Parte III. Los cuatro pilares del aprendizaje 7. La atención 8. El compromiso activo 9. El error es productivo y dar un buen feedback es garantía de mejores aprendizajes 10. La consolidación Conclusión Agradecimientos Bibliografía Créditos de material gráfico 4 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Este libro (y esta colección) Adorable puente se ha creado entre los dos. Gustavo Cerati, “Puente” Un primer saber […] necesario para la formación docente, desde una perspectiva progresista [:] Enseñar no es transferir conocimiento, sino crear las posibilidades para su propia producción o construcción. Paulo Freire, Pedagogía de la autonomía Cuanto más estudio el cerebro humano, más me impresiona. Stanislas Dehaene, en este mismo libro En muchas universidades del mundo existen facultades o escuelas de Ciencias de la Educación; por supuesto, siguen las líneas clásicas y las más renovadoras de los últimos siglos en cuanto a pedagogía y otras disciplinas sociales y humanas. Pero a veces da la sensación de que dejaron en suspenso algunas ciencias y que, pasados ya los tiempos de Piaget, hubo cierto divorcio con el trabajo 5 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene de laboratorio. ¿Qué fue de los experimentos, las evidencias y los conocimientos que la psicología cognitiva, la computación y, muy especialmente, las neurociencias aportan para mejorar nuestras experiencias de aprendizaje y de enseñanza? Mientras vemos naufragar programas educativos, mientras nos quedamos con más errores o mitos que pruebas, nos llegan noticias de los enormes avances de los estudios acerca de nuestra conciencia, el procesamiento de la información en el cerebro o la plasticidad neuronal que deberíamos aprovechar cuanto antes en las aulas. Al otro lado del río, el estudio del cerebro viene prometiendo una revolución en nuestro conocimiento de cómo y por qué hacemos lo que hacemos y hasta cómo mejorar nuestro desempeño en diversos órdenes de la vida. Así, aunque los frutos son muy recientes, la tentación de vincular la investigación con el mundo educativo siempre ha sido importante. Pero el pasaje nunca es tan simple y la expectativa es tan grande que esas promesas se exponen al riesgo de resultar engañosas. Lo cierto es que durante muchos años los grandes logros de los laboratorios neurocientíficos se quedaban allí… en el laboratorio y, aunque supiéramos cada vez más sobre la memoria, la motivación o el alerta, las consecuencias no se veían en las aulas. Quizá por esto mismo, en la década de 1990 –ayer nomás– apareció un trabajo de John Bruer llamado ―Neurociencias y educación: un puente demasiado lejos‖. La respuesta llegó ya avanzado este siglo, con investigaciones que respondían ―es tiempo de construir el puente‖, delineando cómo por fin la escuela podía 6 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene considerarse un campo para aplicar los frutos de la cerebrología. Uno de los constructores del puente es Stanislas Dehaene, sin duda uno de los más importantes neurocientíficos contemporáneos. Con un rigor y un carisma a toda prueba, nos convence de que si existe un destino para los humanos, es el de aprender, tanto con lo que traemos de fábrica como con ese acelerador de mentes que llamamos escuela. Pero allí, en esa escuela, debemos considerar también el funcionamiento de la memoria (necesaria aunque no goce de la mejor prensa), el rol de la atención, la importancia del sueño y hasta de una buena alimentación. Y, también, explorar ciertas patologías del desarrollo como ventanas abiertas que nos permiten contemplar y comprender las funciones cerebrales. Si de aprendizaje se trata, no podemos dejar de lado a las máquinas, que prometen (o amenazan con) entender procesos cada vez más complejos e incluso enseñarse a sí mismas, configurando modelos del mundo que se acercan a la realidad y que algunos agitan como un fantasma. Sin embargo, el autor nos tranquiliza recordando que –al menos por ahora– detrás de toda gran máquina hay siempre un gran ser humano. Y que ese mismo ser humano procesa datos, aprende y resuelve problemas mil veces más rápido que cualquier inteligencia artificial que quiera hacerle sombra. Y es que, en el fondo, ¿por qué aprendemos? ¿Tenemos un instinto de aprendizaje? Podemos considerar las investigaciones clásicas sobre el canto de los pájaros para proponer que sí, lo tenemos. Muchos pajaritos suelen aprender sus músicas de otros tutores a los que imitan, para 7 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene luego agregar un toque personal que les permitirá desempeñarse mejor en la Ópera entre los árboles. Cual pajaritos, los bebés parecen venir de fábrica con ese instinto, lo que los lleva velozmente a hablar, cantar, comer caramelos o desarmar los juguetes. Las investigaciones de Dehaene y sus colegas demuestran inequívocamente que el cerebro de los bebés ya cuenta con herramientas aritméticas, lingüísticas y con un GPS muy refinado: el bebé es, desde el comienzo, una máquina de aprender. Crecer es, quizá, exagerarse a uno mismo, poner en práctica ese plan innato que se va enriqueciendo a lo largo de la vida. Como en el Aleph de Borges, el cerebro en desarrollo puede ser ―uno de los puntos del espacio que contienen todos los puntos‖ (algo que Dehaene nos aclara cuando encuentra en la teoría de Thomas Bayes la posibilidad de pensar al niño como a una suerte de estadístico). Uno de los hallazgos prácticos de este libro es la propuesta de los cuatro pilares del aprendizaje, que permiten mejorar de verdad la educación. Ya los conocerán en detalle, pero vale la pena al menos enumerarlos para que esos principios virtuosos empiecen a abrirse camino en sus neuronas: la atención, ese mecanismo que nos permite darle importancia y amplificar ciertas señales e ignorar otras, el compromiso activo, o curiosidad, que nos obliga a tener cerebros exigentes y motivados en el aula, la detección y corrección de errores (el buen feedback que se aleja diametralmente del castigo frente al error) y 8 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene la consolidación, esto es, la puesta en marcha de los diversos pasos en la formación de las memorias. Con esos cuatro jinetes del aprendizaje, y desplegando la evidencia empírica que funda cada una de sus afirmaciones, Dehaene pone a la vista cuáles son las consecuencias prácticas de sus investigaciones. Por si fuera poco, luego de este extraordinario paseo por los recovecos del cerebro que aprende, también conoceremos a otro Dehaene, el que se calza el traje de hacedor –no por nada es el presidente del primer Consejo Científico del Ministerio de Educación de Francia– y recuerda que la educación pública debe ser siempre una de las primeras prioridades del Estado. Así, en la conclusión nos regala trece recomendaciones para optimizar el potencial de los niños en el proceso de enseñanza y aprendizaje. Del laboratorio y la mente del autor al aula y a nuestras casas, sin escalas. Adorable puente se ha creado entre las neurociencias y la educación. Stanislas Dehaene es ese puente. Este libro es ese puente. Podemos cruzar tranquilos. La Serie Mayor de Ciencia que ladra es, al igual que la Serie Clásica, una colección de divulgación científica escrita por científicos que creen que ya es hora de asomar la cabeza por fuera del laboratorio y contar las maravillas, grandezas y miserias de la profesión. Porque de eso se trata: de contar, de compartir un saber que, si sigue encerrado, puede volverse inútil. Ciencia que ladra… no muerde, sólo da señales de que cabalga. 9 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Diego Golombek 10 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Para Aurore, que acaba de nacer, y para todas aquellas y todos aquellos que fueron bebés alguna vez Introducción a las ciencias del aprendizaje En septiembre de 2008, el encuentro con un niño fuera de lo común me forzó a revisar mis ideas sobre el aprendizaje. Estaba visitando uno de los hospitales de la Rede Sarah de Brasilia, esos centros de salud de arquitectura blanca que desarrolló João Filgueiras, inspirado en la estética de Oscar Niemeyer. Esa red de nueve unidades se especializa en la ―rehabilitación‖ neurológica; desde hace unos diez años mi laboratorio (NeuroSpin, dependiente del Inserm)1 sostiene proyectos en colaboración con ella. Su directora, la destacada psicóloga y neurocientífica Lúcia Braga, me propuso conocer a uno de los pacientes: Felipe, un niño de 7 años que había transcurrido la mitad de su vida en el hospital. Según me explicó Lúcia, a los 4 años este niño había recibido una bala perdida (por desgracia, en Brasil no es algo tan infrecuente). El proyectil le seccionó la médula espinal, de modo que lo dejó casi completamente paralizado en los cuatro miembros, es decir, cuadripléjico. La bala también arrasó con las áreas visuales de la corteza: Felipe quedó 1 Instituto Nacional de Salud e Investigación Médica francés. [N. de E.] 11 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene ciego. Para ayudarlo a respirar, se le hizo una traqueotomía en la base del cuello. Desde hace tres años, vive en una habitación del hospital, encerrado en su cuerpo inerte. En el pasillo que me lleva a su habitación, me preparo mentalmente para enfrentarme a un niño con una gran discapacidad. Y me encuentro con… Felipe, un pequeño como todos los de 7 años, con el rostro lleno de vida, conversador y de una curiosidad inagotable. Habla a la perfección, con un vocabulario rico, y me pregunta con picardía sobre las palabras de mi lengua materna, el francés. Descubro que es un apasionado de los idiomas y que nunca pierde la ocasión de enriquecer su vocabulario trilingüe (portugués, inglés y español). Si bien es ciego y está inmovilizado en la cama, viaja con su imaginación y se distrae creando sus propios cuentos; el equipo del hospital lo alienta en la tarea. En pocos meses, Felipe aprendió a dictar sus historias a un asistente y luego a escribirlas con ayuda de un teclado conectado a una terminal informática y a una placa de sonido. Los pediatras y los terapeutas del lenguaje de esa institución, deslumbrados, se turnan junto a la cama de Félipe para transformar esos relatos en verdaderos libros táctiles ilustrados con imágenes en relieve que él palpa con orgullo, con la poca sensibilidad de que dispone. Sus libros hablan de héroes y heroínas, de montañas y de lagos que jamás volverá a ver, pero con los que sueña como cualquier otro niño pequeño. El encuentro con Felipe me conmocionó y al mismo tiempo me 12 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene persuadió a optar por una exploración de lo que, sin lugar a dudas, es el mayor talento de nuestro cerebro: la capacidad de aprender. En efecto, este niño plantea a la vez una hermosa lección de esperanza y un desafío para la neurociencia. ¿Cómo puede ser que las facultades cognitivas resistan a una alteración tan grande del entorno? ¿Por qué Felipe y yo podemos compartir los mismos pensamientos, aunque tengamos experiencias sensoriales tan diferentes? ¿Cómo logran distintos cerebros humanos converger en los mismos conceptos, sin importar cómo ni cuándo los aprendan? Muchos neurocientíficos son empiristas: consideran, como John Locke, que el cerebro obtiene sus conocimientos de su ambiente. Según ellos, la principal propiedad de los circuitos corticales es la plasticidad, la capacidad de adaptarse. En efecto, las células nerviosas ajustan permanentemente sus sinapsis en función de la información de entrada que reciben. Pero en este caso, dado el impedimento del ingreso de información visual y motriz, Felipe debería haberse convertido en un ser profundamente diferente. ¿Por obra de qué milagro logró desarrollar facultades cognitivas estrictamente normales? El caso de Felipe está lejos de ser un hecho aislado: todos conocen las historias de Helen Keller o de Marie Heurtin, las dos fueron sordas y ciegas de nacimiento que, tras duros años de aislamiento 13 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene social, aprendieron lengua de señas y lograron desarrollarse como pensadoras y escritoras brillantes. 2 A lo largo de estas páginas, ustedes y yo tendremos otros encuentros que, según espero, cambiarán por completo sus ideas sobre el aprendizaje. Conocerán a Emmanuel Giroux, ciego desde los 11 años, eximio matemático especializado en geometría. Parafraseando al zorro de El Principito de Saint-Exupéry, Emmanuel afirma convencido: ―En geometría, lo esencial es invisible a los ojos; solo se puede ver bien con la mente‖. ¿Cómo llega este hombre ciego a pasearse ágilmente por los abstractos espacios de la geometría algebraica, a manipular planos, esferas y poliedros, sin haberlos visto siquiera una vez? Descubriremos que utiliza los mismos circuitos cerebrales que otros matemáticos, con la única salvedad de que su corteza visual, lejos de permanecer inactiva, se recicló también para hacer matemáticas. Además, les presentaré a Nico, un joven pintor que, durante una visita al museo Marmottan-Monet de París, logró hacer una excelente copia del famoso cuadro de Monet Impresión, sol naciente (figura 1). ¿Qué tiene esto de excepcional? Nada, excepto que su cerebro no posee más que un solo hemisferio, el izquierdo: ¡cuando Nico tenía 3 años le fue extirpada casi la totalidad del hemisferio 2 Recomiendo las películas The Miracle Worker (Arthur Penn, 1962) [que en castellano se conoce con distintos títulos: El milagro de Ana Sullivan, Ana de los milagros, Un milagro para Helen o La maestra milagrosa] y Marie Heurtin (Jean-Pierre Améris, 2014) [El lenguaje del corazón o bien La historia de Marie Heurtin]; así como los libros Arnould (1900) y Keller (1903). 14 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene derecho! Su cerebro, entonces, aprendió a alojar en un solo hemisferio todos sus talentos: el habla, la lectura y la escritura, el dibujo, la pintura, la informática e incluso la esgrima, deporte del que es campeón internacional en silla de ruedas. Por favor, olviden todo lo que crean saber acerca de los respectivos roles de los dos hemisferios, porque la vida de Nico prueba que es completamente posible convertirse en un artista sin ayuda del hemisferio derecho: la plasticidad cerebral parece obrar milagros. En nuestra travesía visitaremos también los siniestros orfanatos de Bucarest donde se tenía a los niños en un estado de cuasiabandono desde su nacimiento. Al ampliar un poco nuestro rango de observación, notaremos que tiempo después, pese a todo, algunos de ellos, que fueron adoptados antes de cumplir 1 o 2 años, tuvieron una trayectoria escolar casi normal. 15 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Figura 1. La plasticidad neuronal a veces logra compensar déficits impresionantes. Desde sus 3 años, el joven pintor Nico no posee más que un hemisferio de su cerebro, el izquierdo. Esto no le impidió volverse un artista consumado, capaz de pintar excelentes copias (abajo, su versión de Impresión, sol naciente, cuadro de Manet) y obras propias (arriba). 16 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Todos estos ejemplos revelan la extraordinaria resiliencia del cerebro humano: ni siquiera un trauma grave como la ceguera, la pérdida de un hemisferio o el aislamiento social logra extinguir la chispa del aprendizaje. El lenguaje, la lectura, las matemáticas, la creación artística: todos estos talentos singulares de la especie humana, que ningún otro primate posee, resisten un daño masivo como la pérdida de un hemisferio, de la vista o de la motricidad. Aprender es un principio vital, y el cerebro humano tiene un enorme potencial para la plasticidad: para modificarse por sí solo y adaptarse. Pero en este itinerario descubriremos también contraejemplos trágicos, casos en los cuales el aprendizaje parece congelarse. Tomemos el ejemplo de la alexia pura, la imposibilidad de leer la mínima palabra. Investigué en persona qué les sucedía a muchos adultos, excelentes lectores, a quienes un minúsculo accidente cerebrovascular, limitado a una región muy pequeña del cerebro, volvió incapaces de descifrar incluso palabras tan simples como ―pez‖ o ―mar‖. Recuerdo a una mujer brillante, trilingüe, lectora fiel del diario Le Monde, que se afligía porque, luego de su lesión cerebral, cada página del diario parecía escrita en hebreo. Su motivación para reaprender a leer estaba a la altura del desasosiego que había soportado. Sin embargo, dos años de esfuerzos no le permitieron superar el nivel de lectura de un niño de primer grado, que vocaliza letra por letra y tiene dificultades con cada palabra. ¿Por qué ya no podía aprender? ¿Y por qué algunos niños disléxicos, discalcúlicos o dispráxicos sienten la misma desesperanza radical al 17 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene encarar la adquisición de la lectura, el cálculo o la escritura, mientras que otros transitan esos campos sin problema? La plasticidad cerebral parece caprichosa: a veces se repone de déficits enormes y a veces deja con una discapacidad permanente a niños y adultos por demás motivados e inteligentes. ¿Depende de circuitos específicos? Y esos circuitos, ¿pierden su plasticidad a lo largo de los años? La plasticidad, ¿se puede reactivar? ¿Cuáles son las reglas que la gobiernan? ¿Cómo hace el cerebro de niñas y niños para ser tan eficaz desde el nacimiento y a lo largo de la infancia? ¿Qué algoritmos implantados por la evolución permiten que nuestros circuitos cerebrales elaboren una representación del mundo? ¿Comprender esos algoritmos nos garantizaría aprender mejor y más rápido? ¿Podríamos inspirarnos para construir máquinas más eficaces, inteligencias artificiales que nos imiten o incluso nos superen? Estas son algunas de las preguntas a las cuales este libro intenta dar respuesta, desde una perspectiva decididamente multidisciplinaria, valiéndose de los hallazgos recientes en los campos de las ciencias cognitivas y de las neurociencias, pero también de la inteligencia artificial y de la educación. §. ¿Por qué el aprendizaje? Es más que lógico tomar como punto de partida la indagación de por qué debemos aprender. La existencia misma de la facultad del 18 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene aprendizaje nos plantea una serie de preguntas. ¿No sería mejor que nuestros hijos supieran hablar y reflexionar desde el primer día, como Atenea, de quien cuenta la leyenda que salió del cráneo de Zeus provista de una armadura completa, casco y lanza, dando un grito de guerra? ¿Por qué no nacemos precableados, con un software programado de antemano y dotado de todos los conocimientos necesarios para nuestra supervivencia? En la lucha por la supervivencia que describe Charles Darwin, un animal que naciera maduro, con mayor conocimiento que los otros, ¿no debería al fin y al cabo ganar y propagar sus genes? Y entonces, ¿por qué la evolución habrá inventado el aprendizaje? Mi respuesta es muy sencilla: el precableado completo del cerebro no es posible ni deseable. ¿De verdad es algo imposible? Sí, porque si nuestro ADN debiera especificar todos los detalles de nuestros conocimientos, simplemente no dispondría de la capacidad de almacenamiento necesaria. Nuestros 23 cromosomas incluyen 3.000.000.000 de pares de ―letras‖ A, C, G, T: las moléculas adenina, citosina, guanina y timina. ¿Qué cantidad de información implica esto? La información se mide en bits: una decisión binaria, 0 o 1. Visto que cada una de las cuatro letras del genoma codifica 2 bits (podemos codificarlos como 00, 01, 10 y 11), esto da un total de 6.000.000.000 de bits. A primera vista, parece un número importante, pero atención: en las computadoras actuales contamos en bytes, que son secuencias de 8 bits. El genoma humano se reduce, entonces, a cerca de 750 19 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene megabytes: ¡el contenido de una pequeña memoria USB! Y este cálculo elemental ni siquiera contempla la gran cantidad de redundancias que tienen cabida en nuestro ADN. A partir de esta modesta dote de informaciones heredadas de millones de años de evolución, nuestro genoma –inicialmente reducido a una sola célula, el óvulo fecundado– logra organizar todo el cuerpo, cada molécula de cada una de las células del hígado, los riñones, los músculos, y por supuesto, el cerebro: 86.000.000.000 de neuronas, billones de conexiones, sí, miles de miles de millones… ¿cómo podría definirlas una por una? Si damos por sentado que cada conexión solo codifica 1 bit –lo cual es, por cierto, una subestimación–, la capacidad de nuestro cerebro está en el rango de los 100 terabytes (alrededor de 1014 bits), es decir, unas 15.000 veces más que la información contenida dentro del genoma humano. Nos vemos ante una paradoja: ¡el fabuloso palacio que es nuestro cerebro tiene capacidad para almacenar al menos quince mil veces más detalles que los planos del arquitecto que se usaron para construirlo! No veo más que una explicación: la estructura general del palacio se construye según las líneas rectoras del arquitecto (nuestro genoma), mientras que los detalles se dejan a cargo del contratista que los adapta al terreno (el entorno). Precablear un cerebro humano en todos sus detalles sería rigurosamente imposible; por ende, el aprendizaje debe prolongar la obra de los genes. Este simple argumento contable, sin embargo, no es suficiente para 20 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene explicar por qué el aprendizaje está universalmente extendido en el mundo animal. En efecto, hasta los organismos simples y desprovistos de corteza, como la lombriz, la mosca de la fruta o los pepinos de mar, aprenden una buena cantidad de sus comportamientos. Tomemos por ejemplo el Caenorhabditis elegans, el pequeño gusano del grupo que llamamos ―nematodos‖. En los últimos veinte años, este animalito de pocos milímetros se volvió una estrella de los laboratorios, en parte porque su arquitectura posee un increíble determinismo biológico y puede ser analizada hasta en sus menores detalles: la mayor parte de los individuos cuenta con un total exacto de 959 células, de las cuales 302 son neuronas. Todas sus conexiones son conocidas y reproducibles. Y sin embargo, aprende (Bessa y otros, 2013; Kano y otros, 2008; Rankin, 2004). En un comienzo, los investigadores lo consideraban una suerte de autómata solo capaz de nadar hacia delante o hacia atrás, pero luego notaron que poseía al menos dos formas de aprendizaje: por habituación y por asociación. La habituación significa que el organismo se adapta a la presencia repetida de un estímulo (por ejemplo, una molécula en el agua) y finalmente ya no responde a él. La asociación, por otro lado, consiste en describir y retener en la memoria qué elementos del ambiente predicen las fuentes de alimento o de peligro. Quedó comprobado que este gusano es un campeón de la asociación, capaz de recordar que en el pasado determinados gustos, olores o temperaturas estaban asociados al alimento (bacterias) o a moléculas repulsivas (el olor 21 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene del ajo), y de utilizar esa información para elegir un camino óptimo a través de su ambiente. Con tan pocas neuronas, el comportamiento de este gusano bien podría haber estado precableado por completo. Si no lo está, es porque adaptarse a las condiciones específicas en que vive resulta ventajoso para su supervivencia. Incluso dos organismos genéticamente idénticos no nacen siempre en el mismo ecosistema. En el caso del nematodo, la capacidad de adaptar rápidamente su comportamiento a la densidad, la química y la temperatura del lugar donde está le permite ser más eficiente. Por lo general, todos los animales deben adaptarse con rapidez a las condiciones imprevisibles de su existencia efectiva. Desde luego, la selección natural, el algoritmo increíblemente eficiente de Darwin, logra adaptar cada organismo a su nicho ecológico, pero lo hace con una lentitud desoladora: antes de que una mutación favorable pueda aumentar la supervivencia, hace falta que varias generaciones mueran en el intento. La facultad del aprendizaje, por su parte, actúa mucho más rápido: puede modificar el comportamiento en unos pocos minutos. Y es esto lo interesante del aprendizaje: la posibilidad de ajustarse, lo más rápido posible, a condiciones imprevisibles. Por todos esos motivos, hubo una evolución en el aprendizaje. A lo largo del tiempo, los animales provistos de una capacidad siquiera rudimentaria de aprender tuvieron mayores oportunidades de supervivencia que aquellos que tenían conductas inamovibles. 22 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Además, eran más propensos a transmitir la información a la generación siguiente, que para entonces ya disponía de algoritmos de aprendizaje. Con esto, la selección natural propició el surgimiento del aprendizaje. De por sí, los algoritmos implican el descubrimiento de un buen recurso: es útil dejar que ciertos parámetros cambien enseguida para acomodarse mejor a las condiciones más variables de su ambiente. Algunos factores de la física del mundo son estrictamente invariables: la gravitación es universal y la propagación de la luz o de los sonidos en el aire no cambian de un día para el otro, y he aquí por qué –¡afortunadamente!– no tenemos necesidad de aprender a hacer crecer las orejas, los ojos, o los laberintos del sistema vestibular que miden la aceleración de nuestro cuerpo: todas estas propiedades se codifican genéticamente. En cambio, muchos otros parámetros como el espacio entre los ojos, el peso y la longitud de brazos y piernas o el tono de la voz, varían, y por ese motivo el cerebro debe aprenderlos. Nuestro cerebro es resultado de una solución de compromiso: mucho de innato (heredamos de la larga historia evolutiva gran parte de la circuitería responsable de codificar las grandes categorías intuitivas con las cuales subdividimos el mundo en imágenes, sonidos, movimientos, objetos, animales, personas, causas…), pero quizá todavía más de adquirido, gracias a ese sofisticado algoritmo que nos permite refinar esas competencias precoces en función de nuestra experiencia. 23 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene §. Homo docens Con todos esos elementos a nuestro alcance, si hiciera falta resumir en una sola palabra el talento que caracteriza a nuestra especie, optaría por el verbo ―aprender‖. Más que ser integrantes de la especie Homo sapiens, formamos parte de Homo docens, la especie que se enseña a sí misma. Lo que sabemos del mundo, en su mayor parte, no es algo que se nos haya dado: lo aprendimos del ambiente o del entorno. Ningún otro animal pudo descubrir como nosotros los secretos del mundo natural. Gracias a la extraordinaria flexibilidad de sus aprendizajes, nuestra especie logró salir de su sabana natal para cruzar desiertos, montañas, océanos y, en apenas varios miles de años, conquistar las islas más remotas, las grutas más profundas, los hielos marinos más inaccesibles e inhóspitos, y hasta la luna. Desde la conquista del fuego y la fabricación de herramientas hasta la invención de la agricultura, la navegación (marina, aérea y extraplanetaria) o la fisión nuclear, la historia de la humanidad no es otra cosa que una reinvención constante. La fuente secreta de todos estos logros es una sola: la extraordinaria facultad de nuestro cerebro de formular hipótesis y seleccionarlas para transformar algunas de ellas en conocimientos sólidos acerca del ambiente. Nuestra especie hizo del aprendizaje su especialidad. En el cerebro, miles de millones de parámetros son libres de adaptarse al medio, la lengua, la cultura, los padres, la alimentación… Esos parámetros son elegidos cuidadosamente: dentro del cerebro, la evolución 24 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene definió, con precisión, qué circuitos están precableados y cuáles están abiertos al ambiente. En nuestra especie, la incidencia del aprendizaje es particularmente vasta, porque la infancia se prolonga muchos años. Gracias al lenguaje y a las matemáticas, nuestros dispositivos de aprendizaje tienen la posibilidad de transitar amplios espacios de hipótesis que se incrementan en una combinatoria potencialmente infinita, incluso si siempre se apoyan sobre bases fijas e invariables, heredadas de la evolución. En fecha más reciente, la humanidad descubrió que esta notable capacidad de aprendizaje puede verse aún más fortalecida con ayuda de una institución: la escuela. La pedagogía activa es un privilegio de nuestra especie: ningún otro animal se toma el tiempo de enseñarles nuevos talentos a sus hijos, deliberadamente, prestando atención a sus dificultades y errores. La invención de la escuela, que sistematiza la instrucción informal presente en todas las sociedades humanas, supuso un incremento significativo en el potencial cerebral. Comprendimos que necesitábamos aprovechar esta pródiga plasticidad del cerebro del niño para inculcarle un máximo de informaciones y talentos. A lo largo de los años, las posibilidades de la escolarización no dejaron de ganar eficacia: comenzaron cada vez más temprano, desde el jardín de infantes, y se extendieron cada vez más. E incluso cada vez más mentes se benefician de una enseñanza superior en la universidad, auténtica sinfónica neuronal en que los circuitos cerebrales ponen a tono y potencian sus mejores talentos. 25 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Hoy en día, la educación puede considerarse el principal acelerador de nuestro cerebro. Su lugar privilegiado, que recuerda por qué debe situarse entre los primeros puestos de las inversiones del Estado, se justifica fácilmente: sin ella, los circuitos corticales serían diamantes en bruto. La complejidad de las sociedades contemporáneas debe su existencia a las múltiples mejorías que la educación aportó a nuestra corteza: la lectura, la escritura, el cálculo, el álgebra, la música, las nociones de tiempo y espacio, el refinamiento de la memoria… ¿Sabían, por ejemplo, que la capacidad de memoria de corto plazo de un analfabeto, la cantidad de sílabas o de cifras que puede repetir, es casi una tercera parte de la de una persona escolarizada? ¿O qué medidas tales como el coeficiente intelectual se incrementan varios puntos por cada año adicional de educación y alfabetización? §. Aprender a aprender La educación multiplica las ya considerables facultades del cerebro, pero ¿podría ser incluso mejor? En la escuela, la universidad o el trabajo, forzados a adaptarnos cada vez más rápido, hacemos malabares con nuestros algoritmos cerebrales de aprendizaje. Sin embargo, ese despliegue espectacular sucede de modo intuitivo, sin jamás haber aprendido a aprender. Nadie nos explicó las reglas que hacen que el cerebro memorice y comprenda o, por el contrario, olvide y se equivoque. Es una pena, porque los datos abundan. Un excelente sitio inglés, el de la 26 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Education Endowment Foundation (EEF), aporta largas listas de las más exitosas intervenciones pedagógicas. 3 Y una de las más eficaces, según ellos, es la metacognición, vale decir, el hecho de conocer mejor el funcionamiento cognitivo. Saber aprender es uno de los factores más importantes del éxito escolar. Por suerte, hoy en día sabemos mucho acerca de cómo funciona el aprendizaje. A lo largo de los últimos treinta años, la investigación en las fronteras de la ciencia de la computación, la neurobiología y la psicología cognitiva, permitió comprender los algoritmos que utiliza el cerebro, los circuitos involucrados, los factores que modulan su eficacia y los motivos de su tan excepcional eficiencia en los humanos. El funcionamiento de la memoria, el papel que desempeña la atención, la importancia del sueño son descubrimientos igualmente ricos en consecuencias para todos nosotros. Me ocuparé de cada una de estas cuestiones a lo largo de estas páginas. Por eso, espero que cuando cierren este libro sepan mucho más sobre sus propios procesos de aprendizaje. Me parece fundamental que cada niño, cada adulta, tenga plena conciencia del potencial de su propio cerebro y también, por supuesto, de sus límites. Al realizar una disección sistemática de los algoritmos mentales y los mecanismos cerebrales, las ciencias cognitivas contemporáneas recuperan y actualizan la célebre máxima de los 3 Invito a visitar ese sitio web,. 27 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Siete Sabios, inscripta en el Oráculo de Delfos: ―Conócete a ti mismo‖. Hoy en día, ya no es cuestión de practicar la introspección, sino de conocer mejor la refinada mecánica neuronal que da lugar a los pensamientos, para así dominarla mejor y ponerla al servicio de nuestras necesidades, metas y deseos. La emergente ciencia del aprendizaje es de especial importancia para quienes hacen de la enseñanza su actividad profesional: docentes y educadores. Tengo la profunda convicción de que no podemos enseñar de una manera conveniente sin poseer un modelo mental de lo que ocurre dentro de la cabeza del niño: cuáles son sus intuiciones, correctas o erróneas, cuáles son las etapas por las que debe pasar en su avance y qué factores lo ayudan a desarrollar sus capacidades. Si bien las neurociencias cognitivas no tienen todas las respuestas, gracias a ellas en la actualidad sabemos que todos los niños comienzan la vida con una arquitectura cerebral similar: un cerebro de Homo sapiens, que difiere radicalmente de los de otros simios. Desde luego, no niego que los cerebros varían: tanto las peculiaridades de nuestros genomas como las excentricidades de nuestro desarrollo cerebral aseguran distintas fuerzas y velocidades de aprendizaje. Con todo, el bloque básico de circuitos es el mismo en cada cual (y otro tanto sucede con la organización de los algoritmos de aprendizaje). Entonces, hay principios fundamentales que cada modalidad de enseñanza, si pretende ser eficaz, debe respetar. En este libro, daremos numerosos ejemplos. Las 28 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene habilidades que los niños muy pequeños tienen para el lenguaje, la aritmética, la lógica o la estimación de probabilidades demuestran la existencia de intuiciones precoces y abstractas sobre las cuales debe apoyarse la enseñanza. Todas ellas se potencian si se enfoca la atención, se adopta un compromiso activo, se reconocen y rectifican los errores (lo que se conoce como feedback) y se practica un ciclo de experimentación durante el día y de consolidación a la noche. Esos son para mí los cuatro pilares del aprendizaje, porque, como veremos, los encontramos desde que se echan los cimientos del edificio del algoritmo universal del aprendizaje humano, presente en todos los cerebros, tanto en la infancia como en la edad adulta. Al mismo tiempo, nuestros cerebros presentan variaciones individuales, y en algunos casos extremos puede aparecer una patología. La realidad de las patologías del desarrollo como la dislexia, la discalculia, la dispraxia o los trastornos de atención ya está confirmada por completo, y hay estrategias para detectarlas y compensarlas. Uno de los objetivos de este libro es dar mayor difusión a estos conocimientos, en busca de que cada docente, así como cada familia, pueda derivar las consecuencias y adaptar su manera de enseñar. Por supuesto, hay variaciones muy grandes entre lo que los distintos niños saben, pero eso nunca significa que dejen de tener los mismos algoritmos de aprendizaje. Así, los recursos o ―trucos del oficio pedagógico‖ que resultan más efectivos con todos los niños son aquellos que tienden a serlo también con quienes tienen déficits de aprendizaje: 29 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene solo hay que aplicarlos con mayor enfoque, paciencia, sistematicidad y tolerancia al error. El último factor es decisivo. Si bien la detección del error y la consiguiente respuesta son indispensables, muchos niños pierden confianza, motivación y curiosidad porque en vez de una corrección reciben un castigo. Hay que prestar mucha atención para desvincular por completo error y castigo (y todavía queda mucho por decir acerca del triste papel que desempeñan las distintas instancias escolares en la perpetuación de esta confusión). Las emociones negativas aplastan el potencial de aprendizaje de nuestro cerebro, mientras que un entorno que haya desterrado el miedo y la amenaza puede reabrir las puertas de la plasticidad neuronal. No habrá un verdadero progreso en el campo de la educación si a la vez no se integran las facetas cognitiva y emocional del desarrollo del cerebro, dos ingredientes indispensables desde la perspectiva de la neurociencia cognitiva actual. §. El desafío de las máquinas Hoy en día, la inteligencia humana se enfrenta a un nuevo desafío: ya no es la única que sabe aprender. En todos los campos del saber existen algoritmos que desafían a nuestra especie, porque aprenden a reconocer los rostros o las voces, a transcribir el habla, a traducir las lenguas extranjeras, a controlar las máquinas, e incluso a jugar al ajedrez o al go (y muchas veces aprenden todo eso mejor que nosotros). Los algoritmos de machine learning nutren una industria 30 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene multimillonaria que, cada vez más, se inspira en el cerebro humano. ¿Cómo funcionan estos algoritmos artificiales? ¿Sus principios pueden ayudarnos a comprender qué es el aprendizaje? ¿Lograron ya imitar el funcionamiento de nuestro cerebro o todavía les queda mucho por aprender? Si bien los avances actuales de la informática son fascinantes, sus límites son claros. Los algoritmos convencionales de deep learning no hacen otra cosa que imitar una pequeña parte del funcionamiento del cerebro: la que corresponde a las primeras etapas del tratamiento sensorial, los famosos 200 o 300 milisegundos (ms) durante los cuales el cerebro opera de un modo no consciente. Eso no quiere decir que este tratamiento sea superficial: en una fracción de segundo, nuestro cerebro puede reconocer un rostro o una palabra y, en este segundo caso, además asociarla a un contexto, comprenderla e integrarla a una pequeña frase… Sin embargo, este proceso todavía es estrictamente ascendente – bottom-up en inglés–, vale decir, sin una verdadera capacidad de reflexión. Solo en una segunda etapa, tanto más lenta, consciente y reflexiva, nuestro cerebro logra desplegar todas sus capacidades de razonamiento, de inferencia, de flexibilidad que las máquinas actuales todavía están lejos de igualar. Incluso las arquitecturas informáticas más avanzadas están muy por debajo de la capacidad de las crías humanas a la hora de construir modelos abstractos del mundo. Aun dentro de su dominio preferencial, el reconocimiento veloz de 31 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene las formas, los algoritmos actuales chocan con un segundo problema: son mucho menos eficaces que el cerebro humano. Y en el estadío que alcanzó en la actualidad, el machine learning consiste en poner a funcionar procesadores en millones, e incluso miles de millones, de pruebas de práctica. Esa modalidad pierde de vista la economía de los datos, ya que considera que machine learning es sinónimo de big data: sin una enorme cantidad de información, los algoritmos no consiguen extraer conocimientos abstractos generalizables a situaciones nuevas. En síntesis, no hacen el mejor uso de los datos. Y en este virtual certamen, el bebé más pequeño se lleva las palmas sin mayores esfuerzos de su parte; no necesita más que una o dos repeticiones para aprender una palabra nueva. Su cerebro saca el mayor provecho de una porción extremadamente escasa de datos, capacidad que todavía resulta elusiva para los procesadores de última generación. Los algoritmos neuronales de aprendizaje suelen alcanzar un cómputo cercano al óptimo. A menudo, consiguen extraer la verdadera esencia aun de una observación ínfima. Si desean alcanzar el mismo desempeño, los investigadores en informática deben inspirarse en los numerosos trucos del aprendizaje que la evolución integró en nuestro cerebro: la atención, por ejemplo, que nos permite seleccionar y amplificar una información pertinente; o bien el sueño, un algoritmo mediante el cual el sistema nervioso central hace la síntesis de los aprendizajes del día. Comienzan a ver la luz máquinas provistas de estas 32 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene propiedades, y su desempeño no deja de crecer. Sin duda, serán ellas las que, mañana, competirán con nuestra mente. Una teoría emergente, llamada ―teoría del cerebro estadístico‖, explica que el cerebro humano todavía es superior a las máquinas porque actúa como un estadístico; constantemente atento a probabilidades e incertidumbres, optimiza su capacidad de aprendizaje. Un teorema matemático lo verifica: solo la manipulación de probabilidades –es decir, de las incertidumbres sobre lo que aprendimos–, permite obtener el máximo provecho de cada información. Parece que a lo largo de su evolución nuestro cerebro descubrió este truco que consiste en tener un registro constante de la incertidumbre asociada a cada información, y actualizarlo durante cada aprendizaje. Numerosos datos experimentales respaldan esta hipótesis. Hasta los bebés comprenden las probabilidades, y estas parecen profundamente inscriptas en los circuitos cerebrales. Cada niño actúa como un pequeño científico en ciernes: a sus espaldas, su cerebro formula hipótesis, verdaderas teorías científicas que cada experiencia pone a prueba. El razonamiento sobre las probabilidades –también inconsciente, pero con fuerte arraigo en la lógica de nuestros aprendizajes– permite rechazar gradualmente las hipótesis falsas y conservar solo las teorías que funcionan. A diferencia de otras especies animales, los seres humanos parecen poseer algoritmos muy particulares para formular teorías del mundo exterior. Solo el Homo sapiens logra generar de manera sistemática 33 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene pensamientos simbólicos abstractos y actualizar su plausibilidad ante nuevas observaciones. En la actualidad, nuevos algoritmos –llamados ―bayesianos‖ en honor al reverendo Thomas Bayes (1701-1761), quien bosquejó esta teoría ya en el siglo XVIII– comienzan a formalizar e implementar esta visión del aprendizaje. Apuesto a que van a revolucionar el machine learning; de hecho, veremos que ya son capaces de obtener información abstracta con una eficacia próxima a la de un científico humano. **** Ya podemos levar anclas y explorar juntos lo que hoy en día comprendemos del aprendizaje. Les propongo un viaje en tres etapas. En la primera parte, titulada ―¿Qué es aprender?‖, analizaremos las teorías actuales del aprendizaje a la luz de su implementación concreta en las computadoras. Será el momento de formalizar lo que significa aprender. Y la idea es sencilla: aprender es configurar, en los circuitos de silicio o neurales, un modelo interno del mundo que nos rodea. Cuando uno camina por una ciudad desconocida, arma en su mente un mapa de su aspecto externo, un modelo en miniatura de sus calles y pasajes. Lo mismo sucede cuando una niña empieza a aprender a andar en bicicleta y perfila en sus circuitos neurales una simulación inconsciente a propósito del modo en que las acciones ejercidas sobre los pedales y el manubrio afectan la estabilidad de la bicicleta misma. Y de un modo similar, 34 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene un algoritmo informático de aprendizaje de reconocimiento facial adquiere plantillas de rasgos posibles respecto de ojos, narices, bocas y sus combinaciones. Pero ¿cómo generamos un modelo mental adecuado? Como veremos, la mente de quien aprende puede compararse con una máquina gigantesca con millones de parámetros regulables, cuyos valores de ajuste definen en conjunto qué se aprende (por ejemplo, qué calles pueden llegar a figurar en el mapa mental del barrio). En el cerebro, los parámetros son sinapsis (las conexiones entre neuronas, que pueden variar en potencial); en la mayoría de las computadoras actuales, son los ―pesos‖, vale decir, las probabilidades ponderables de cada hipótesis factible. Así, tanto en los cerebros como en las máquinas, aprender requiere buscar la combinación óptima de parámetros que, una vez reunidos, definen cada detalle del modelo mental. En este sentido, el del aprendizaje es un problema de búsqueda a gran escala. Por eso, analizar cómo operan los algoritmos en las computadoras actuales puede ser de gran ayuda para entender cómo funciona el aprendizaje en el cerebro humano. Mediante la comparación de los desempeños de los algoritmos informáticos con los de nuestro cerebro, in silico versus in vivo, comenzaremos a entrever cómo el aprendizaje, para ser óptimo, debe apoyarse sobre un uso razonado de las probabilidades y de las estadísticas. Por supuesto, los matemáticos y los especialistas en ciencia computacional no consiguieron (todavía) diseñar algoritmos 35 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene tan poderosos como los del cerebro humano. Sin embargo, empiezan a destinar cada vez más atención a pensar cuál es el algoritmo de aprendizaje de eficiencia óptima para su uso en cualquier sistema. Entre los modelos del todo innato y el todo adquirido, emerge uno nuevo: el del cerebro bayesiano, un verdadero estadístico neuronal. Esta teoría postula una clara división del trabajo entre naturaleza y crianza. Nuestros genes, en el seno del cerebro en desarrollo, establecen vastos espacios de hipótesis a priori, así como los mecanismos que permiten adaptarlos a los inputs del mundo exterior, y el ambiente selecciona, entre estas hipótesis, las que mejor se corresponden con ese mundo. Así, el repertorio de hipótesis está especificado genéticamente, mientras que su selección depende de la experiencia. ¿Esta teoría se corresponde verdaderamente con el funcionamiento del cerebro? ¿Cómo se implementa el aprendizaje en nuestros circuitos biológicos? ¿Qué se modifica en el cerebro cuando adquirimos nuevas habilidades? En la segunda parte, ―Cómo aprende nuestro cerebro‖, pondremos proa hacia la psicología y las neurociencias. El foco del catalejo quedará sobre la cuna del bebé humano, una auténtica máquina de aprender, muchas veces imitada pero jamás igualada. Los datos recientes demuestran que el niño es este estadístico en ciernes que predice la teoría bayesiana. Sus intuiciones fulgurantes en los ámbitos del lenguaje, de la geometría, de los números o de las estadísticas confirman que no existe algo como una pizarra en blanco, una tabula rasa. Desde el 36 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene nacimiento, los circuitos neuronales del niño están bien organizados y proyectan hipótesis sobre el mundo exterior. Pero también poseen un considerable margen de plasticidad, que se traduce en una permanente ebullición de cambios a escala celular. Dentro de esta máquina estadística, lo innato y lo adquirido, lejos de oponerse, se combinan, dando como resultado un sistema estructurado pero plástico, capaz de autorrepararse en caso de una lesión cerebral tanto como de reciclar sus circuitos para aprender a leer o a hacer matemáticas. En la tercera parte, ―Los cuatro pilares del aprendizaje‖, detallaré algunos de los trucos que hacen del cerebro el dispositivo de aprendizaje más eficaz que conocemos en la actualidad. Cuatro mecanismos esenciales modulan masivamente nuestra capacidad de aprender. En primer lugar, la atención: un conjunto de circuitos neuronales que seleccionan, amplifican y propagan las señales a las que damos importancia, y multiplican por cien o por mil su representación en la memoria. En segundo lugar, el compromiso activo: en los hechos, un organismo pasivo aprende poco y nada, porque el acto de aprender exige del cerebro la generación activa de hipótesis, con motivación y curiosidad. En tercer lugar, y como complemento natural del compromiso activo, la detección y corrección de errores, en un buen feedback: cada vez que nos sorprendemos porque el mundo contradice nuestras expectativas, las señales de error se propagan por todo el cerebro y se ocupan de corregir los modelos mentales, eliminar las hipótesis inadecuadas y 37 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene estabilizar las más pertinentes. Por último, el cuarto factor es la consolidación: con el paso del tiempo, el cerebro compila lo adquirido y lo transfiere a la memoria de largo plazo, con el objetivo de liberar los recursos para otros aprendizajes. La repetición desempeña un papel esencial en esta consolidación, y también el sueño, que, lejos de ser un período de inacción, constituye un momento privilegiado durante el cual el cerebro repite y recodifica las adquisiciones del día. Estos cuatro pilares del aprendizaje tienen validez universal. No importa si somos bebés, niños o adultos: los desplegamos a cualquier edad. Por este motivo debemos aprender a dominarlos; solo así podemos aprender a aprender. En la conclusión, revisaré las consecuencias prácticas de los avances científicos. Cambiar las prácticas en la escuela, la familia o la oficina no es necesariamente tan complicado como pensamos. Existen algunas ideas muy sencillas acerca del juego, el placer, la curiosidad, la socialización, la concentración o incluso el sueño que pueden consolidar aún más lo que ya es el mayor talento de nuestro cerebro: la capacidad de aprender que ejercemos y ejercitamos constantemente. 38 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Parte I ¿Qué es aprender? La inteligencia puede considerarse como la capacidad de convertir información en bruto en conocimientos útiles y explotables. Demis Hassabis, fundador de la empresa de IA DeepMind (2017) ¿Qué es aprender? Este verbo posee la misma raíz latina que ―aprehender‖: tomar, atrapar, asir. Aprender, entonces, es asir con el pensamiento: llevarse una porción de realidad, un modelo de la estructura del mundo. Como bien dice Demis Hassabis (gerente general de la empresa inglesa DeepMind, filial de Google, y uno de los investigadores más activos en inteligencia artificial), aprender consiste en transformar la información que recibimos en un conjunto de conocimientos útiles y explotables. Gracias al aprendizaje, los datos en bruto que impactan nuestros sentidos se convierten en ideas abstractas, refinadas y lo suficientemente generales como para que podamos explotarlas en situaciones novedosas: en ciencias cognitivas, esos conjuntos de ideas reciben el nombre de ―modelos internos‖. En las páginas siguientes, revisaremos lo que la inteligencia artificial y las ciencias cognitivas nos enseñaron acerca del funcionamiento de estos modelos internos, tanto en máquinas como 39 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene en cerebros, y de la forma en que la representación de la información se transforma con el aprendizaje. Comenzaremos por examinar las redes de neuronas convencionales, modelos informáticos inspirados en el cerebro humano. ¿Cómo hacen para ajustar sus parámetros para modelar el mundo exterior? Veremos que, pese a su éxito, de momento no logran asir más que una fracción de las capacidades del cerebro humano. Como por encanto, al reseñar los distintos trucos de que se valieron los ingenieros para propiciar que poco a poco las máquinas aprendiesen, haremos aparecer una imagen más nítida de los fabulosos cómputos que los niños deben realizar mientras aprenden a ver, hablar o escribir. El lenguaje y las matemáticas requieren mucho más que una red de neuronas: necesitan una verdadera lengua interior, capaz de combinar los conceptos y de seleccionar entre estas combinaciones en función de su plausibilidad estadística. La perspectiva que emergerá de allí es la de un cerebro estadístico, que formula hipótesis como un científico y las adopta o rechaza en función de los datos que recibe. Y en los hechos, como veremos, el cerebro del niño no cede la delantera: pese a sus logros, los algoritmos de aprendizaje actuales solo abarcan una fracción de las capacidades del cerebro humano. Al entender con exactitud dónde deja de funcionar la metáfora del machine learning y en qué instancia incluso un cerebro infantil supera a la computadora más potente, delinearemos con claridad qué significa ―aprender‖. 40 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Capítulo 1 Siete definiciones del aprendizaje Contenido: §. Aprender es ajustar los parámetros de un modelo mental §. Aprender es aprovechar la explosión combinatoria §. Aprender es minimizar los errores §. Aprender es explorar el espacio de lo posible §. Aprender es optimizar una función de recompensa §. Aprender es acotar el espacio de investigación §. Aprender es proyectar hipótesis a priori Retomo y reitero la pregunta: ¿qué significa ―aprender‖? Como definición inicial y más amplia, sostengo que aprender es construir un modelo interno del mundo exterior. Incluso si no nos damos cuenta, nuestro cerebro es portador de miles de esos modelos internos (desde una perspectiva metafórica, equivalen a maquetas, modelos a escala, más o menos fieles a la realidad que representan). Tenemos todo en la cabeza: por ejemplo, un plano de nuestro barrio o un mapa mental de nuestra casa u oficina, podemos cerrar los ojos y verlos con el pensamiento. Por supuesto, nadie nació con este mapa mental, sino que cada cual tuvo que adquirirlo mediante el aprendizaje. La riqueza de estas representaciones mentales –en su mayoría, inconscientes– supera la imaginación. Disponemos, por ejemplo, de un amplio modelo mental de la lengua castellana, que en este 41 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene momento les permite comprender las palabras que leen y adivinar que ―platsovski‖ no es una palabra de su idioma, mientras que ―sextante‖ sí lo es y ―blascón‖ podría serlo. Nuestro cerebro también alberga muchos modelos del cuerpo propio: se vale de ellos para codificar dónde están sus miembros, cómo dirigirlos, a qué velocidad moverlos, cómo mantener el equilibrio… Otros modelos mentales representan el conocimiento de los objetos y de nuestras interacciones con ellos: cómo sostener un lápiz, escribir o andar en bicicleta. Otros nos traen las mentes de los demás, un enorme catálogo mental de las personas que nos son próximas, de su aspecto, su voz, sus gustos y sus tics. Estos modelos mentales pueden generar simulaciones hiperrealistas del universo que nos rodea. ¿Alguna vez notaron que el cerebro suele proyectar los más auténticos reality shows virtuales (valga la supuesta paradoja), en los cuales es posible caminar, moverse, bailar, visitar lugares nuevos, tener conversaciones brillantes o sentir emociones profundas? ¡Esos son sus sueños! Es fascinante tomar conciencia de que todos los pensamientos (a menudo muy complejos) que nos llegan durante los sueños son solo producto del libre funcionamiento de los modelos internos del mundo. Pero también soñamos la realidad cuando estamos despiertos: nuestro cerebro proyecta permanentemente sobre el mundo exterior hipótesis, marcos de interpretación que le dan sentido al flujo de datos que nos llega por los sentidos. Por eso, sin que lo sepamos, cada imagen que aparece en nuestra retina es ambigua: cada vez 42 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene que vemos un plato, por ejemplo, la imagen es compatible con una cantidad infinita de elipses. Si vemos el plato como redondo, incluso a pesar de que por los datos sensoriales en bruto nos presentan la figura de un óvalo, se debe a que nuestro cerebro aporta datos adicionales: aprendió que la silueta circular es la interpretación más pertinente. Entre bastidores, las áreas sensoriales constantemente computan a partir de probabilidades, y solo el modelo más probable logra acceder a la conciencia. En última instancia, lo que da sentido al flujo de datos que llega a nosotros desde las percepciones son las proyecciones obradas por el cerebro. Si no existiera un modelo interno, estos datos en bruto serían ininteligibles. El aprendizaje permite que el cerebro atrape una porción de la realidad que antes le era ajena y la use para construir un nuevo modelo del mundo. Puede ser una porción de la realidad exterior, si es cuestión de aprender historia, botánica o el plano de una ciudad, pero también de la realidad interna, ya que buscamos aprender a coordinar los gestos y a concentrar los pensamientos con el objetivo de tocar el violín. En estos dos casos, nuestro cerebro internaliza un aspecto nuevo de la realidad: ajusta sus circuitos con intención de apropiarse de un campo que antes no dominaba. Desde luego, esos ajustes tienen que ser muy ingeniosos. La fuerza del aprendizaje reside en su capacidad de acomodarse al mundo externo y de corregir en caso de error; pero el cerebro de quien aprende ¿de qué modo ―sabe‖ cómo actualizar su modelo interno cuando, digamos, 43 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene se desorienta en su barrio, se cae de su bicicleta, pierde una partida de ajedrez o chapurrea la palabra ―anfractuosas‖? §. Aprender es ajustar los parámetros de un modelo mental Ajustar un modelo mental a veces es muy sencillo. ¿Cómo hacemos, por ejemplo, para tender la mano y alcanzar un objeto que vemos? Ya en el siglo XVII, René Descartes lo había presentido: debemos aprender a transformar la información visual en órdenes musculares (figura 2). Pueden experimentarlo ustedes mismos en pocos segundos: intenten tomar una varilla mientras llevan puestos los anteojos de otra persona (de ser posible, una muy miope). Mejor todavía, si pueden, consigan anteojos con lentes prismáticos o, sin más, prismas, que desplacen la visión una decena de grados hacia la izquierda, e intenten tomar un objeto. Verán que su primer intento es completamente fallido: a causa de los prismas, su mano aterriza muy a la derecha del palo que, sin embargo, ustedes ven. Poco a poco, adecuan sus movimientos, desplazándolos hacia la izquierda. Con un proceso de ensayo y error, sus movimientos se vuelven cada vez más exactos: su cerebro ha aprendido a compensar el desajuste de los ojos. Ahora quítense los anteojos y tomen la varilla: ¡los sorprenderá ver que su mano se dirige al lado equivocado, demasiado a la izquierda! ¿Qué ocurrió? Durante este breve aprendizaje, el cerebro ajustó su modelo interno de la visión. Un parámetro de este modelo, que corresponde al desfase entre la escena visual y la orientación del 44 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene cuerpo, fue recalibrado. El cerebro se comportó como un tirador de élite, que primero realiza un disparo de prueba y luego ajusta la altura de su mira para así lograr mayor precisión. Este aprendizaje es muy rápido: bastan algunos ensayos para corregir el desfase entre el movimiento y la visión. Sin embargo, la nueva regulación no es compatible con la anterior; de aquí proviene el error sistemático que todos cometimos cuando nos quitamos los prismas y volvimos a tener una visión normal. Es innegable que este aprendizaje es un poco particular, porque no requiere ajustar más que un solo parámetro: el ángulo de visión. Por este motivo es tan rápido. La mayor parte de los aprendizajes son tanto más elaborados y demandan el ajuste de varias decenas, centenas y hasta miles de millones de parámetros (cada una de las sinapsis que determinan la actividad de nuestros circuitos). Sin embargo, el principio siempre es el mismo: todo consiste en investigar, entre un sinfín de regulaciones posibles del modelo interno, aquellas que mejor se corresponden con el estado del mundo exterior. Consideremos ahora el aprendizaje de un idioma como el japonés. Cuando el cerebro de un bebé japonés aprende su lengua materna, ajusta gradualmente su modelo de la lengua a las características del idioma japonés. Intenten imaginar una máquina dotada de millones de regulaciones en todos los niveles. Algunas de estas regulaciones, en el nivel de la entrada auditiva, determinan el inventario de consonantes y de 45 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene vocales que utiliza el japonés, y las reglas que permiten componerlas. Figura 2. Aprender es ajustar los parámetros de un modelo del mundo. Aprender a señalar con el dedo, por ejemplo, consiste en ajustar el desfase entre la visión y la acción: cada error permite corregir la puntería. En la red neuronal artificial el principio es el 46 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene mismo, pero los ajustes son infinitamente más numerosos. Reconocer qué número está presente en una imagen requiere ajustar millones de conexiones. También en este caso, todos los errores – aquí, un incremento de la activación del número 8– permiten corregir su valor y, de este modo, mejorar el desempeño en el siguiente intento. El bebé que nace dentro de una familia japonesa debe descubrir qué categorías de sonidos son utilizadas en esa lengua, y dónde ubicar las fronteras entre ellas. Uno de los parámetros, por ejemplo, concierne a la distinción entre los sonidos /R/ y /L/: esta es crucial en castellano, pero no en japonés, que no hace diferencia alguna entre una ―elección‖ y una ―erección‖… Cada bebé, entonces, debe fijar un conjunto de parámetros que, colectivamente, precisan qué categorías son pertinentes para su lengua materna. Un procedimiento de aprendizaje similar se reproduce en todos los niveles: desde los patrones de sonido hasta el vocabulario, la gramática y el significado. El cerebro está organizado como una estructura de modelos de la realidad anidados –uno dentro del otro, como las muñecas rusas; y aprender significa utilizar la información que ingresa para fijar los parámetros en cada nivel de esa estructura jerárquica. Tomemos un ejemplo de un nivel superior: la adquisición de las reglas de la gramática. Otra diferencia entre el japonés y el castellano que el bebé debe aprender está relacionada con el orden de las palabras. En una oración bimembre canónica, con un sujeto, un verbo y un objeto directo, la lengua castellana 47 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene sitúa primero el sujeto, luego el verbo y, por último, su objeto directo: ―Juan come una manzana‖. En japonés, en cambio, el orden más usual es sujeto, luego objeto, luego verbo: ―Juan manzana come‖. El orden se invierte también para las preposiciones (que, lógicamente, se llaman posposiciones), los posesivos y muchos otros grupos de palabras. Así, la oración ―Mi tío visita museos en París‖ se convierte en una que puede parecernos un galimatías digno del venerable Yoda, de La guerra de las galaxias: ―Tío mi París en museos visita‖, lo que tiene mucho sentido para un hablante japonés. Todas estas diferencias no son independientes unas de otras. Ciertos lingüistas piensan que se originan en un solo y mismo parámetro llamado ―posición del núcleo‖: la palabra que otorga su categoría a un grupo –es decir, su núcleo– se sitúa siempre en posición inicial en español ( en París, mi tío, visita museos) pero en último lugar en japonés (París en, tío mi, museos visita). Por cierto, este parámetro binario marca distinciones entre muchas lenguas, incluso sin vínculo histórico entre ellas (por ejemplo, el apache, que es una de las lenguas ―atabascanas‖, sigue las mismas reglas que el japonés). Así, con el fin de adaptarse al castellano o al japonés, es suficiente con que el niño ajuste el parámetro ―posición del núcleo‖ en su modelo interno de la lengua. §. Aprender es aprovechar la explosión combinatoria 48 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene ¿Es verosímil que el aprendizaje de las lenguas se reduzca a la selección de algunos parámetros? Si eso nos parece difícil de creer, es porque no imaginamos la extraordinaria cantidad de posibilidades que se abren cuando se incrementa, siquiera un poco, la cantidad de parámetros ajustables. Esto se denomina ―explosión combinatoria‖: el aumento exponencial que se produce cuando se combina apenas un puñado de posibilidades. Supongamos que la gramática de las lenguas del mundo pudiera describirse con algo así como cincuenta parámetros binarios, según postulan algunos lingüistas. Eso da como resultado 250 combinaciones, es decir, ¡más de mil billones, o un 1 seguido de quince ceros! Las reglas sintácticas de las tres mil lenguas del mundo caben con facilidad en este gigantesco espacio de las lenguas posibles. Sin embargo, en nuestro cerebro no hay cincuenta parámetros ajustables, sino una cantidad sorprendentemente mayor: 86.000.000.000 de neuronas, cada una de ellas provista de una decena de miles de contactos sinápticos con fuerzas que pueden variar. El espacio de representaciones que se abre es poco menos que infinito. Las lenguas humanas aprovechan estas posibilidades de combinación en todos los niveles. Tomemos el ejemplo del léxico mental, es decir, el conjunto de las palabras que conocemos y cuyo modelo llevamos con nosotros. Cada cual aprendió, en su lengua materna, alrededor de 50.000 palabras con los significados más diversos. Es un número grande, cierto, pero parece escaso frente a las cantidades prodigiosas que ofrece la combinatoria. 49 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Si consideramos que estas 50.000 palabras en promedio tienen 3 sílabas, cada una formada por alrededor de 2 fonemas, tomados entre los 24 fonemas del castellano, la codificación binaria de todas esas palabras requiere menos de 2.000.000 de elecciones binarias elementales (los bits, a los cuales se asigna el valor de 0 o 1). Digámoslo de otro modo: todo nuestro conocimiento del diccionario podría almacenarse en un pequeño archivo informático de 250 kilobytes (cada byte corresponde a 8 bits). A continuación, sería posible comprimir este léxico mental en un tamaño tanto menor si tuviéramos en cuenta las numerosas redundancias que rigen a las palabras. Si tomamos seis letras al azar para lograr una cadena como ―xfdrga‖, estas no forman una palabra del castellano. Las palabras reales están compuestas por una pirámide de sílabas que se ensamblan de acuerdo con reglas estrictas. Y esto es así en todos los niveles: las frases o las oraciones son combinaciones regulares de palabras que, a su vez, son combinaciones regulares de sílabas que, a su vez, son combinaciones regulares de fonemas. En cada nivel, las combinaciones son simultáneamente amplias (porque elegimos entre varias decenas o centenas de elementos) y acotadas (porque solo determinadas combinaciones están permitidas). Aprender una lengua es descubrir los parámetros que rigen esas combinaciones en todos los niveles. En conclusión, el cerebro humano segmenta el problema del aprendizaje mediante la construcción de un modelo jerárquico de múltiples niveles. Esto es más que obvio en el caso de la lengua – 50 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene desde los sonidos elementales hasta la oración e incluso el discurso–, pero el mismo principio de análisis jerárquico se reproduce en todos los sistemas sensoriales. Determinadas áreas cerebrales captan las regularidades de bajo nivel: ven el mundo a través de una ventana temporal y espacial muy pequeña, y analizan las regularidades más nimias. Por ejemplo, en el área visual primaria, la primera región de la corteza en recibir los estímulos visuales, cada neurona no analiza más que una porción muy pequeña de la retina. Solo ve el mundo a través del ojo de una aguja y, como resultado, descubre las regularidades de muy bajo nivel, como la presencia de una línea oblicua en movimiento. Millones de neuronas hacen el mismo trabajo en diferentes puntos de la retina, y sus outputs se convierten en los inputs del nivel siguiente, que entonces detectará ―regularidades de regularidades‖, y así sucesivamente. En cada nivel, la escala aumenta: el cerebro busca las regularidades en rangos cada vez más amplios, tanto en el tiempo como en el espacio. En las sucesivas instancias de esta jerarquía emerge la capacidad de detectar objetos o conceptos cada vez más complejos: una línea, un dedo, una mano, un brazo, un cuerpo humano… No, dos… Son dos personas que se miran cara a cara, es un apretón de manos… ¡Es el primer encuentro entre Charles Chaplin y Buster Keaton! §. Aprender es minimizar los errores 51 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Los algoritmos informáticos que llamamos ―redes de neuronas artificiales‖ se inspiran directamente en la organización jerárquica de la corteza. Al igual que ella, organizan una pirámide de capas sucesivas: cada una intenta descubrir regularidades más profundas que la capa previa. Debido a que estas capas consecutivas organizan la información entrante de forma cada vez más profunda, también se las llama ―redes profundas‖. Cada capa, por sí misma, solo puede descubrir una parte extremadamente simple de la realidad exterior (es del tipo de problemas que las matemáticas califican como ―linealmente separables‖; en este caso, cada neurona solo puede separar la información en dos categorías A y B trazando una estricta división entre ellas). En cambio, si se unen muchas de esas capas, se obtiene un dispositivo de aprendizaje sumamente robusto, capaz de descubrir estructuras complejas y de ajustarse a problemas muy diversos. Las redes de neuronas artificiales de última generación, que cuentan con el avance de los microchips, también son profundas, en el sentido de que incluyen decenas de capas sucesivas –cada vez más alejadas de la entrada sensorial, y más astutas– capaces de identificar en sus inputs propiedades cada vez más abstractas. Tomemos el ejemplo del algoritmo ―LeNet‖, creado por el pionero francés de las redes neuronales, Yann LeCun (figura 3; véase LeCun y otros, 1998). Desde los años noventa, esta red de neuronas alcanza desempeños notables en el reconocimiento de caracteres manuscritos. Durante 52 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene años, el correo canadiense lo utilizó para el procesamiento automático de los códigos postales. ¿Cómo funciona? Figura 3. Aprender es construir una estructura de representaciones apropiadas al problema planteado. En la red GoogLeNet, que aprende a reconocer imágenes, millones de parámetros se ajustan para que cada nivel de la estructura detecte determinado factor de la realidad. 53 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene En el nivel más bajo, las neuronas artificiales son sensibles a los patrones y a las texturas. A medida que se asciende en la jerarquía, las neuronas responden a formas más complejas. El algoritmo recibe como input, en forma de píxeles, la imagen de un carácter escrito y propone, como output, una interpretación tentativa: uno de los diez dígitos o de las veintiséis letras posibles. La red artificial posee una jerarquía de unidades de procesamiento que se parecen un poco a las neuronas y que forman capas sucesivas. Las primeras capas están conectadas directamente a la imagen: aplican filtros que reconocen fragmentos de rectas y curvas. Cuanto más se avanza en la jerarquía, mayores y más complejos se vuelven estos filtros. Las unidades más elevadas aprenden a reconocer porciones cada vez más amplias de la imagen: la curva de un 2, el remate de una O, o las líneas paralelas de una Z… hasta llegar, a la salida, a neuronas artificiales que responden a un carácter con independencia de su posición y de las peculiaridades de sus trazos. Todas estas propiedades no están impuestas por un programador: son resultado de millones de conexiones entre las unidades. Una vez ajustadas por un algoritmo automatizado, estas conexiones definen el filtro que cada neurona aplica a sus inputs: hacen que una neurona responda al dígito 2 y otra al 3. ¿Cómo se ajustan estos millones de conexiones? De la misma manera que en el caso de los anteojos con lentes prismáticos: en 54 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene cada prueba, la red da una respuesta tentativa, constata que ha cometido un error e intenta ajustar sus parámetros para reducirlo en la prueba siguiente. Cada respuesta errónea provee información valiosa. Por su signo (como un gesto muy a la derecha o muy a la izquierda), el error indica lo que en verdad hacía falta realizar para tener éxito. Si nos remontamos a la fuente de ese error, la máquina es capaz de descubrir cómo debía (y debe) establecer los parámetros para evitar equivocarse. Volvamos al ejemplo del deportista que ajusta la mira de su rifle. El procedimiento de aprendizaje es elemental. El tirador dispara y constata que ha enfocado unos centímetros (más exactamente, 5) a la derecha. Ahora tiene una información esencial, tanto sobre la amplitud (5 cm) como sobre el signo del error (demasiado a la derecha). Esta información le permite corregir el tiro. Si es un poco avispado, sabe en qué dirección debe realizar la corrección: si la bala se desvió hacia la derecha, hace falta mover la mira un poco a la izquierda. Incluso si no es tan astuto, puede hacer intentos al azar y constatar que, si mueve la mira hacia un lado, el error aumenta, mientras que si la mueve hacia el otro, disminuye. Así, por prueba y error, el tirador puede determinar cómo reducir la magnitud del error. Al ajustar la mira para afinar su puntería, nuestro eximio deportista –tal como Monsieur Jourdain, el burgués gentilhombre de Molière, que al hablar ―hacía‖ prosa sin saberlo– está aplicando un algoritmo de aprendizaje sin siquiera conocerlo. Está calculando implícitamente lo que los matemáticos llamamos la 55 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene ―derivada‖ o el ―gradiente del sistema‖, y hace lo que denominamos un ―descenso del gradiente‖: aprende a mover la mira de su rifle en la dirección más eficiente en busca de reducir la probabilidad de cometer un error. La mayoría de las redes neuronales que se utilizan en la inteligencia artificial actual –y más allá de sus millones de inputs, outputs y parámetros ajustables– funciona de la misma forma que nuestro tirador: observa sus errores y los aprovecha para ajustar su estado interno en la dirección que considera mejor para disminuir el error. En muchos casos, ese aprendizaje está totalmente guiado: por un lado, le decimos con exactitud a la red qué respuesta debería haber activado en la salida (―es un 1, no un 7‖); por otro lado, sabemos con precisión en qué dirección ajustar los parámetros si hay un error (un cálculo matemático permite saber exactamente qué conexiones ajustar cuando la red activa demasiado el output ―7‖ en respuesta a una imagen del dígito ―1‖). En el lenguaje del machine learning esto es conocido como ―aprendizaje supervisado‖ (porque alguien, a quien podríamos llamar el supervisor, conoce la respuesta correcta que debe dar el sistema) y ―retropropagación de errores‖ (porque los errores se reenvían a la red con el objetivo de modificar los parámetros). El procedimiento es sencillo: intento dar una respuesta, me dicen lo que debería haber respondido, mido mi error y, en busca de reducirlo, corrijo todos mis parámetros. En cada etapa, doy apenas un pequeño paso, hago una pequeña corrección en la dirección correcta. Debido a este proceso el machine 56 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene learning puede resultar increíblemente lento: aprender una actividad compleja, como jugar al Tetris, exige aplicar determinada receta miles, millones e incluso miles de millones de veces. En un espacio que abarca una multitud de parámetros ajustables, descubrir el ajuste óptimo de cada tornillo y de cada bulón puede insumir mucho tiempo. Ya en la década de 1980 el funcionamiento de las primeras redes de neuronas artificiales se basaba sobre este principio de corrección gradual de los errores. Los progresos de la informática permitieron extender esta idea a redes neuronales gigantescas, que incluyen centenas de millones de conexiones ajustables. Estas redes neuronales profundas están integradas por una sucesión de etapas que, a cada paso, se ajustan al problema planteado. A modo de ejemplo, la figura 3 muestra el sistema GoogLeNet, derivado de la arquitectura LeNet propuesta por Yann LeCun, que ganó una de las más importantes competencias internacionales en reconocimiento de imágenes. Expuesto a miles de millones de imágenes, este sistema aprendió a separarlas en casi mil categorías distintas: rostros, paisajes, barcos, autos, perros, insectos, flores, señales viales, etc. Cada nivel de su jerarquía se ajustó a una faceta útil de la realidad: las unidades de nivel bajo responden selectivamente a rasgos o a texturas, y a medida que se sube en la jerarquía, las neuronas responden más selectivamente a formas complejas: figuras geométricas (círculos, curvas, estrellas), partes de objetos (bolsillo de pantalón, asa de una 57 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene taza, par de ojos…), e incluso objetos enteros (edificios, rostros, arañas…; Olah y otros, 2017). En un intento por minimizar los errores, el algoritmo de descenso del gradiente descubrió que esas formas son las más útiles para la categorización de las imágenes. Pero si la misma red hubiera estado expuesta a textos o a partituras musicales, habría sido ajustada de un modo diferente y habría aprendido a reconocer palabras, notas musicales o cualquier otra forma recurrente en este nuevo entorno. La figura 4, por ejemplo, muestra cómo se autoorganiza una red de este tipo cuando se le pide que se especialice para el reconocimiento de miles de dígitos manuscritos (Guerguiev y otros, 2017). En el nivel más bajo, los datos están mezclados: existen formas muy parecidas, como un 3 y un 8, que pese a todo haría falta diferenciar, y, a la inversa, existen formas muy diferentes, como varias versiones del 8 con el bucle de arriba abierto o cerrado, que sin embargo habría que agrupar. En cada etapa, la red artificial de neuronas progresa en abstracción, hasta agrupar correctamente todos los ejemplares de un mismo dígito. Gracias al procedimiento de reducción de errores, se descubrió una jerarquía de índices que resuelve el reconocimiento de cifras manuscritas. Y ciertamente es muy notable que con solo corregir los errores propios se pueda descubrir una jerarquía completa de claves adecuadas para el problema en cuestión. 58 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Figura 4. ¿Cómo aprende a categorizar los dígitos manuscritos una red neuronal profunda? Este tema es difícil, porque un mismo dígito puede escribirse de cientos de maneras diferentes. En el nivel más bajo de la jerarquía neuronal (abajo a la derecha), todos los dígitos están mezclados, y aquellos que se parecen entre sí, como los 9 y los 4, se confunden. 59 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene A medida que se asciende en la jerarquía, las neuronas logran agrupar todas las imágenes de un mismo dígito y separarlas con límites claros. Hoy en día, el concepto de aprendizaje por retropropagación de los errores reside en la base de una gran cantidad de aplicaciones informáticas. Sobre él se asienta la capacidad de nuestros smartphones de reconocer su voz, o el novedoso talento de los autos inteligentes para distinguir a los peatones de las señales de tránsito; así, podemos colegir la posibilidad de que nuestro cerebro use una versión de este. Sin embargo, la retropropagación o feedback del error viene en varias presentaciones, pensadas para cada usuaria o usuario. El área del aprendizaje artificial progresó enormemente en treinta años, y los investigadores descubrieron gran cantidad de trucos que facilitan el aprendizaje. Sin darles un orden de prioridad, pasemos revista a algunos de ellos; veremos que nos dicen mucho sobre nosotros mismos y sobre el modo en que aprendemos. §. Aprender es explorar el espacio de lo posible Uno de los problemas con el procedimiento de corrección de errores que acabo de describir es que puede quedar atrapado en un conjunto de parámetros que no es el mejor. Imaginen una pelota de golf que rueda sobre el césped, siempre siguiendo la línea con la pendiente más pronunciada: es posible que quede bloqueada en una pequeña depresión del suelo, sin alcanzar necesariamente el punto más bajo de toda la superficie, el óptimo absoluto. Del mismo modo, 60 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene a veces el algoritmo de descenso del gradiente se ve trabado en un punto del cual no puede salir. Eso es lo que llamamos un ―mínimo local‖, un pozo en el espacio de los parámetros, una trampa de la cual el algoritmo no logra salir porque le parece imposible hacerlo mejor. En ese momento, el aprendizaje se estanca, porque todos los cambios parecen contraproducentes: cada uno de ellos aumenta la tasa de error. El sistema estima haber aprendido todo lo que podía aprender. Ignora que en realidad existen, un poco más lejos en el espacio de los parámetros, otras combinaciones mejores. El algoritmo de descenso del gradiente no los ―ve‖, porque se niega a subir la pendiente una vez más para volver a descender mejor del otro lado del hoyo. Como un miope, apenas ve a una corta distancia de su punto de partida y, por lo tanto, puede perderse configuraciones distantes pero mejores. ¿Este problema les parece demasiado abstracto? Piensen en una situación concreta: ustedes van a hacer las compras al mercado, donde pasarán algo de tiempo buscando los productos más baratos. Avanzan por un sector, pasan al primer vendedor, que les parece que está fuera de precio, evitan al segundo, que siempre es muy caro, y finalmente se detienen en el tercer puesto, que decididamente tiene mejores precios que los precedentes. Pero ¿quién les dice que en el pasillo de al lado, o tal vez incluso en el pueblo de al lado, los precios no serían todavía más interesantes? Detenerse en el mejor precio local no garantiza encontrar el mínimo global. 61 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene Como enfrentan a menudo esta dificultad, los informáticos emplean una serie de trucos. La mayor parte consiste en introducir una dosis de azar en la búsqueda de los mejores parámetros. La idea es simple: en vez de buscar solo en un sector del mercado, paseamos de modo aleatorio; en vez de dejar que la pelota de golf descienda suavemente por la pendiente, le damos algo de efecto, que reduce sus posibilidades de quedarse bloqueada en un hueco. En ciertas ocasiones, los algoritmos de búsqueda estocástica 4 operan con una configuración distante y parcialmente aleatoria, de modo que, si existe una solución mejor, tengan la posibilidad de encontrarla. En la práctica, podemos introducir una porción de esas fluctuaciones de varias maneras: configurar o actualizar los parámetros al azar, diversificar el orden de los ejemplos, agregar un poco de ruido a las entradas del sistema, o incluso utilizar solo una fracción aleatoria de las conexiones. Todas estas ideas mejoran el ímpetu del aprendizaje. Algunos algoritmos de machine learning se inspiran también en el algoritmo darwiniano que rige la evolución de las especies: durante la optimización de los parámetros, incluyen mutaciones y cruces aleatorios de las soluciones descubiertas previamente. Tal como en biología, la tasa de estas mutaciones debe ser controlada con sumo 4 Esto es, tal como lo define el propio Dehaene (2006), que contemplan fluctuaciones indiscriminadas. En su presencia, el cerebro -o, según señala el presente libro, la red neuronal- ―debe comportarse como un estadístico que recopila múltiples muestras antes de llegar a una conclusión sólida‖. [N. de E.] 62 Preparado por Patricio Barros ¿Cómo aprendemos? www.librosmaravillosos.com Stanislas Dehaene cuidado para así explorar nuevas soluciones sin perder demasiado tiempo en intentos precarios y riesgosos. Otro algoritmo se inspira en las fraguas, donde los obreros aprendieron a optimizar las propiedades del metal al ―refundirlo‖. Cuando se quiere forjar una espada excepcionalmente dura, el método del refundido consiste en cocerla muchas veces, a temperaturas cada vez más bajas, para aumentar las posibilidades de que los átomos se dispongan en una configuración regular. En la actualidad este procedimiento se extrapoló a la informática: el algoritmo de recocido simulado introduce cambios aleatorios en los parámetros, con una temperatura virtual que decrece gradualmente. La posibilidad de un evento fortuito es elevada al principio, pero se reduce poco a poco hasta que el sistema alcanza una regulación óptima. Los informáticos descubrieron que todos estos trucos son muy eficaces, por lo que no debería sorprendernos que algunos de ellos se hayan internalizado en nuestro cerebro a lo largo de la evolución. La exploración al azar, la curiosidad estocástica y la generación aleatoria de descargas neuronales desempeñan un papel primordial en el aprendizaje en el Homo sapiens. Tanto cuando tocamos rock, jugamos a piedra, papel o tijera, improvisamos sobre un standard de jazz o pensamos posibles soluciones para un problema matemático, el azar es un ingrediente esencial de la solución. Como veremos más adelante, mientras el niño está en modo ―aprendizaje‖ –es decir, mientras juega–, explora decenas de posibilidades con