ChatGPT y educación universitaria: posibilidades y límites PDF
Document Details
Uploaded by Deleted User
2024
Mireia Ribera, Oliver Díaz Montesdeoca
Tags
Summary
Este libro explora las posibilidades y limitaciones de ChatGPT como herramienta docente en la educación universitaria. Analiza la evolución de los modelos de lenguaje y debate sobre la autenticidad de la información y la transformación que conlleva en la educación. Proporciona indicaciones prácticas para su uso y trata aspectos éticos relacionados con la IA y la desinformación.
Full Transcript
EDUCACIÓN UNIVERSITARIA Mireia Ribera, Oliver Díaz Montesdeoca (coords.) ChatGPT y educación universitaria: posibilidades y límites de ChatGPT como herramienta docente IDP/ICE IDP/ICE CONSEJO EDITORIAL IDP/ICE, UB-OCTAEDRO Dirección Teresa Pagès Costas (jefa de la Sección...
EDUCACIÓN UNIVERSITARIA Mireia Ribera, Oliver Díaz Montesdeoca (coords.) ChatGPT y educación universitaria: posibilidades y límites de ChatGPT como herramienta docente IDP/ICE IDP/ICE CONSEJO EDITORIAL IDP/ICE, UB-OCTAEDRO Dirección Teresa Pagès Costas (jefa de la Sección Universidad, IDP/ICE, Facultad de Biología, Universidad de Barcelona) Coordinadora Anna Forés Miravalles (IDP/ICE, Facultad de Educación, Universidad de Barcelona) Editor Juan León Varón (director de la Editorial Octaedro) Consejo Editorial Pedro Allueva Torres (Facultad de Educación, Joan Carles Ondategui Parra (Facultad Universidad de Zaragoza) de Óptica y Optometría, Universidad Pilar Ciruelo Rando (Editorial Octaedro) Politécnica de Cataluña) Mar Cruz Piñol (Facultad de Filología, Jordi Ortín Rull (Facultad de Física, Universidad de Barcelona) Universidad de Barcelona) Carmen Ferrándiz García (Facultad de Mireia Ribera Turró (Facultad de Matemáticas Psicología, Universidad de Murcia) e Informática, Universidad de Barcelona) Mercè Gracenea Zugarramurdi (Facultad Alicia Rodríguez Álvarez (Facultad de Filología, de Farmacia y Ciencias Alimentación, Universidad de Las Palmas de Gran Universidad de Barcelona) Canaria) Virginia Larraz Rada (Facultad de Ciencias de Antoni Sans Martín (Facultad de Educación, la Educación, Universidad de Andorra) Universidad de Barcelona) Miquel Martínez Martín (Facultad de Carmen Saurina Canals (Facultad de Ciencias Educación, Universidad de Barcelona) Económicas y Empresariales, Universidad Miquel Oliver Trobat (Facultad de Educación, de Gerona) Universidad de las Islas Baleares) Secretaría Técnica del Consejo Editorial Lourdes Marzo Ruiz (IDP/ICE, Universidad de Barcelona), Ana Suárez Albo (Editorial Octaedro) Normas presentación originales: https://www.ub.edu/idp/web/sites/default/files/docs/Normas_presenta.pdf Revisores: https://www.ub.edu/idp/web/sites/default/files/docs//Revisores_Octaedro.pdf Criterios de calidad: https://www.ub.edu/idp/web/sites/default/files/docs/criterios.pdf Mireia Ribera Oliver Díaz Montesdeoca (coords.) ChatGPT y educación universitaria Posibilidades y límites de ChatGPT como herramienta docente OCTAEDRO - IDP/ICE, UB Colección Educación universitaria Título: ChatGPT y educación universitaria: posibilidades y límites de ChatGPT como herramienta docente Primera edición: enero de 2024 © Mireia Ribera, Oliver Díaz Montesdeoca (coords.) © De esta edición: Ediciones Octaedro, S.L. Bailén, 5 - 08010 Barcelona Tel.: 93 246 40 02 [email protected] www.octaedro.com Universitat de Barcelona Institut de Desenvolupament Professional (IDP/ICE) Campus Mundet - 08035 Barcelona Tel.: 93 403 51 75 [email protected] Esta publicación está sujeta a la Licencia Internacional Pública de Atribución/Reconocimiento- NoComercial 4.0 de Creative Commons. Puede consultar las condiciones de esta licencia si accede a: https://creativecommons.org/licenses/by-nc/4.0/ ISBN: 978-84-19900-58-6 Diseño y producción: Servicios Gráficos Octaedro SUMARIO 1. Introducción................................................... 7 — Oliver Díaz — Mireia Ribera 2. Indicaciones prácticas para usar ChatGPT.................... 21 — Eloi Puertas 3. La tecnología tras ChatGPT................................... 51 — Daniel Ortiz — David Buchaca 4. Inteligencia artificial, desinformación y aspectos éticos....... 87 — Javier Guallar — Carlos Lopezosa 5. Implementación de ChatGPT en el aula...................... 97 — Mariona Grané 6. ChatGPT, implicaciones para la sociedad y la educación.... 123 — Los autores Autoría........................................................ 127 5 1. INTRODUCCIÓN — Oliver Díaz — Mireia Ribera Al abrir este libro nos podemos preguntar: ¿por qué otro libro de ChatGPT? Su motivación principal es el deseo de llegar a nuestro público, a nuestros lectores fieles. Octaedro es una editorial de refe- rencia en el entorno universitario, cubre los ámbitos de la innovación docente en muchas disciplinas y se ha convertido en editorial de refe- rencia para el profesorado universitario y de secundaria para innovar y mejorar su docencia. Un libro sobre los avances de la inteligencia artificial (IA) en el ámbito académico no podía faltar. El libro trata principalmente de ChatGPT porque esta es la herra- mienta que está en todos los foros, la que ha despertado más debate en los últimos meses. ChatGPT es la primera herramienta de IA que ha cruzado la frontera entre herramientas usadas por especialistas y herramientas usadas por el gran público, llegando a ser la aplicación con mayor crecimiento de la historia (más de un millón de usuarios en cinco días). Pero en realidad, en este texto ChatGPT es una ex- cusa, pues tras ella viene una nueva generación de herramientas de IA generativa que cambia la manera que conocíamos hasta ahora de trabajar, enseñar y aprender. Así, en esta obra se muestra la evolución de los modelos de lenguaje y se debate sobre la autenticidad de la información y sobre la transformación en la educación, temas que transcienden la herramienta en sí. 7 1.1. ¿Por qué ahora? Según el ciclo de tendencias de Gartner (Gartner, 2022), las tecno- logías pasan por diversas fases a lo largo del tiempo que van desde la aparición de la innovación hasta el pico de las expectativas desborda- das, el valle de la desilusión, la rampa de la iluminación y la meseta de la productividad. La IA generativa, que es aquella que tiene como finalidad producir datos sintéticos como texto o imágenes a partir de patrones aprendidos en datos reales, y dentro de esta, ChatGPT, se encontraría ahora con una gran expectativa por parte de la población, entre la innovación y el pico de expectativas desbordadas, tal y como se ve en la figura 1.1. Figura 1.1. Adaptación propia del Hype Cycle for Artificial Intelligence (Gartner, 2022). Y es en esta fase donde se genera más ruido, tanto a favor de las innovaciones como en su contra. En un entorno sensible como la edu- cación, una postura negacionista o una adopción entusiasta podría tener efectos muy perjudiciales; por elloes importante el trabajo de dilucidar y aclarar conceptos, así como comprender sus limitaciones. Como ya avanza la figura 1.1, tardaremos unos años a aprovechar es- tas herramientas con plena productividad, pero podemos recorrer este camino con un poco más de calma y conocimiento para conseguir una implementación más satisfactoria de esta tecnología. 8 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 1.2. ¿Qué es ChatGPT? ChatGPT es un tipo de IA generativa desarrollado por la empresa OpenAI que utiliza una red neuronal artificial llamada generative pre-trained transformer (GPT) para generar texto de forma coherente y relevante en conversaciones de tipo chat con seres humanos. Esta herramienta se puede considerar como un modelo probabilista, que proporciona información plausible de acuerdo con la gran cantidad de datos de internet que ha utilizado para entrenarse. Su éxito radica en la potente infraestructura (granjas de servidores) que hay detrás – financiada por Microsoft–, así como en los desarrollos tecnológicos de los últimos años en el campo del procesamiento del lenguaje natural (natural language processing, NLP), juntamente con el acceso a millo- nes de datos en internet. Sin embargo, a pesar de sus grandes logros y expectativas recientes, hemos de tener en cuenta que esta herramienta tiene una capacidad limitada. 1.3. Historia de los chatbots y su evolución en la educación 1.3.1. El uso de la tecnología en la educación. Avances tecnológicos que han contribuido a su desarrollo A lo largo de la historia, infinidad de descubrimientos científicos y avances tecnológicos importantes han marcado la evolución del ser humano desde sus inicios hasta la actualidad. Esa evolución tecno- lógica también ha tenido influencia en el ámbito de la docencia y conocimiento. Por ejemplo, en la Prehistoria, las pinturas rupestres permitían transmitir el arte de cazar de una generación a otra. Esta técnica de divulgación de información ha ido evolucionando a lo largo de los siglos. En épocas más recientes, la producción industrial tanto del papel (sucesor del papiro y el pergamino) como del lápiz marcaron un gran cambio que permitieron a la humanidad compar- tir ideas y pensamientos en masa de una manera más fácil y sencilla. En el ámbito de la docencia, esto permitió un aumento en la trans- 1. INTRODUCCIÓN ❚ 9 ferencia del conocimiento entre alumnado y profesorado, que hasta entonces se comunicaban mayoritariamente de forma oral. A partir de aquí, otros avances tecnológicos, como la máquina de escribir, la imprenta, la radio, el ordenador personal o el acceso a internet, han ido derribando barreras, permitiendo poner las bases del aprendizaje a distancia, brindando al alumnado la oportunidad de aprender a su propio ritmo, como los cursos en línea masivos y abiertos (massive open online courses, o MOOC). En los últimos años estamos viendo que la transformación digital y las tecnologías basadas en IA están en- contrando su hueco en el aula, y se han usado como herramienta do- cente, como, por ejemplo, la realidad aumentada, la realidad virtual, las redes sociales, las aplicaciones móviles o los chatbots, entre otros. Fuera del aula, también encontramos soluciones tecnológicas intere- santes de apoyo, como la analítica de aprendizaje (learning analytics), que recopila, procesa y analiza datos sobre el alumnado con el fin de comprender y optimizar su aprendizaje. A medida que evolucionan estas tecnologías educativas, los do- centes deben adaptar su forma de enseñanza. El docente hoy en día utiliza menos clases magistrales y trabaja con la tecnología como he- rramienta de soporte a la docencia para así mejorar la experiencia de aprendizaje del alumnado. El uso de la tecnología para la mejora docente pasa por la búsqueda de alternativas que incrementen la mo- tivación del alumnado e involucrarlos de manera más activa en su proceso de aprendizaje (figura 1.2). Figura 1.2. Ejemplo de evolución tecnológica en el aula. Inspirada en una ilustración de Sergio Duce (@ yo_ runner). 10 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 1.3.2. ¿Qué es un chatbot? Un chatbot (o bot conversacional) es un programa informático dise- ñado para simular una conversación en lenguaje natural con seres humanos a través de un canal de texto, voz o incluso imágenes. Esta tecnología utiliza técnicas de IA, como el procesamiento del lenguaje natural y el aprendizaje automático (machine learning), para procesar y comprender las preguntas y solicitudes del usuario y proporcionar respuestas relevantes y coherentes. Es decir, los chatbots recogen una pregunta, procesan la información y responden en milisegundos. Pueden ser implementados en diversas plataformas, como apli- caciones móviles, sitios web, redes sociales o sistemas de mensajería instantánea. Dependiendo de su nivel de sofisticación, los chatbots pueden seguir un conjunto de reglas predefinidas, trabajar según unos patrones de conversación preestablecidos o incluso aprender de inte- racciones previas para mejorar su capacidad de respuesta. Los más complejos, como ChatGPT, utilizan tecnología de IA con gran can- tidad de datos para procesar los mensajes entrantes. Los chatbots pueden ser utilizados para desempeñar diferentes fun- ciones, desde proveer información y asistencia a un usuario hasta rea- lizar tareas más específicas, como podría ser en entornos de educación donde se pretende alcanzar ciertos objetivos educativos y pedagógicos. 1.3.3. El uso de chatbots en entornos educativos Los chatbots han experimentado una evolución significativa en el en- torno educativo durante los últimos años, en términos cuantitativos (la figura 1.3 muestra el número de artículos sobre chatbots en educa- ción), de acuerdo con los criterios de búsqueda definidos por Wollny et al. (2021) y extraídos del sitio Web of Science, plataforma de acceso a múltiples bases de datos de referencia y citas de revistas académicas, actas de congresos y otros documentos en diversas disciplinas acadé- micas. A nivel cualitativo, los chatbots han pasado de ser simples he- rramientas de asistencia básica a convertirse en soluciones sofisticadas que brindan apoyo personalizado e instantáneo al alumnado en temas 1. INTRODUCCIÓN ❚ 11 como criterios de evaluación, recordatorios de entrega de tareas o recomendación de lecturas entre otros (Cunningham-Nelson, 2019). Figura 1.3. Número de artículos por año de publicaciones relacionadas con chatbots en entornos educativos. El año 2023 solo tiene en cuenta artículos de enero a junio. Fuente: Web of Science. Los chatbots han creado oportunidades únicas en el aprendizaje, donde se involucra a los diferentes actores que participan en todo el ciclo del aprendizaje, como alumnado y profesorado, e incluso per- sonal administrativo de secretarias y otros departamentos que dan servicio al alumnado. Un ejemplo claro podría ser el uso de un chatbot integrado en el campus virtual de una universidad donde cualquier miembro del colectivo universitario pueda preguntar sobre los crite- rios de evaluación de una asignatura, horario de atención al público de la secretaría o la normativa de permanencia en la carrera. Esta tecnología ayuda al desarrollo y soporte de (nuevas) habilida- des, automatización de tareas que permiten una educación más efi- ciente, aumento de la motivación del alumnado o proveer de repuestas a infinidad de preguntas instantáneamente, en cualquier momento del día, sin interactuar directamente con correos electrónicos o visitas presenciales a los otros actores implicados en el aprendizaje (Wollny et al., 2021). 12 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Los objetivos pedagógicos más comunes que encontramos en los chatbots incluyen: (1) el soporte durante las actividades de aprendiza- je (p. ej., adquisición de conocimiento), (2) asistencia en el día a día durante la vida estudiantil (p. ej., consulta de horarios o procesos administrativos) o (3) funciones de tutoría que apoya el desarrollo personal de los estudiantes (p. ej., soporte al aprendizaje autorregula- do) (Wollny et al., 2021) Esta tecnología educativa tiene grandes beneficios en el ámbito de la educación. Por ejemplo, en la revisión sistemática del estado del arte realizado por Okonkwo y Ade-Ibijola (2021) se destaca el soporte que dan al usuario (profesorado, alumnado) para subir la información ne- cesaria a las plataformas de aprendizaje (p. ej. Moodle), así como para distribuirla a los usuarios autorizados de forma instantánea y fácil. Además, los chatbots fomentan el aprendizaje personalizado, brindan apoyo a los usuarios y permiten que múltiples usuarios accedan a la misma información al mismo tiempo. Pero quizás lo más interesante es conocer si esta tecnología ayuda a mejorar los resultados de aprendizaje del alumnado. El metaanálisis de Wu y Yu (2023) indica que los chatbots basados en IA podrían te- ner un gran impacto –o moderado– en los resultados de aprendizaje de los estudiantes en términos de rendimiento, motivación, interés, autoeficacia o valor percibido del aprendizaje, sobre todo en el alum- nado universitario. Sin embargo, este impacto se ve disminuido (o incluso desaparece) cuando se utiliza con alumnado de primaria y secundaria. A pesar de todo ello, más investigación es necesaria para validar estos resultados. En la tabla 1.1 se indican algunos ejemplos de chatbots utilizados en entornos universitarios que dan soporte al alumnado en diferentes aspectos (Fernández-Ferrer, 2023). 1. INTRODUCCIÓN ❚ 13 Tabla 1.1. Chatbots usados en educación Chatbot Enlace Pounce Estudio de caso en Georgia State University (Estados Unidos), en la que se ofreció a los estudiantes recientemente matriculaos un chat personalizado enviándoles recordatorios, fechas de matrícula, recogiendo datos para cuestionarios… Deakin’s Genie Estudio de caso en Deakin University (Melbourne, Australia), en el que un chatbot funciona como asistente digital para los estudiantes para ayudarles a gestionar su calendario, tareas y otros aspectos de la vida universitaria. Ash Un chatbot diseñado como soporte para la salud mental en Monash University (Australia). Quizbot Un chatbot para recordar información factual en Stanford (Estados Unidos). Isidra Una asistente virtual en la Universidad de Alcalá (España), que orienta y resuelve preguntas frecuentes del alumnado. Aina La misma tecnología que Isidra (ver fila anterior) con la información de la Universitat de les Illes Balears. Lola La misma tecnología que Isidra (ver dos filas anteriores) con la información de la Universidad de Murcia. Fuente: Fernández-Ferrer, 2023. 1.4. Importancia de la inteligencia artificial en entornos universitarios, aplicaciones en docencia, investigación y gestión La Universidad de Al Qarawiyyine (Fez, Marruecos) es considerada por la Unesco como la primera universidad del mundo (año 859 d.C.). Ahora sumergidos ya en pleno siglo xxi, los avances de la ciencia y la tecnología han cambiado muchos aspectos de la vida, y la universidad no iba a ser menos. La IA (generativa) está cambiando –y cambiará mucho más– nues- tro día a día, nuestra percepción, nuestro pensamiento y, por supues- to, los modelos de enseñanza-aprendizaje. Tecnologías disruptivas como el ChatGPT tienen gran potencial de cambiar muchos de los procesos actuales dentro del entorno universitario que se ejemplifican a continuación, aunque este volumen se centra en su aplicación en el ámbito docente. 14 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA En la tabla 1.2 se muestran algunos posibles ejemplos de uso de IA (incluyendo la IA generativa) en ámbitos de docencia (D) –los abor- dados por este texto–, así como de investigación (I) y gestión (G). Los diferentes modelos de IA pueden estar programados para mantener conversaciones, generar datos sintéticos u otras tareas específicas. Tabla 1.2. Ejemplos de usos de IA en entornos docentes, de investigación y gestión universitaria en los ámbitos: D, docencia; I, investigación; G, gestión Ámbito Aplicación Descripción D Recomendación de Una IA específica puede analizar perfiles de usuarios y actividades para contenido recomendar material relevante o cursos complementarios. D Tutoría virtual Una IA conversacional puede dar apoyo al alumnado respondiendo a preguntas frecuentes y proporcionando explicaciones claras a dudas recurrentes. D Soporte al profesorado Una IA generativa puede dar ideas al profesorado sobre actividades docentes a realizar dentro del aula, en relación con una materia específica. I Análisis de datos Una IA específica puede ayudar en la investigación científica y el análisis de datos a gran escala. I Descubrimiento de Los diferentes ámbitos de la IA (minería de datos, machine learning) conocimiento pueden ayudar a identificar patrones emergentes y generar ideas para nuevas áreas de investigación. I Asistencia en la Herramientas basadas en IA generativa pueden permitir analizar más diseminación científica eficientemente el estado del arte y dar suporte en la creación de nuevos documentos científicos. G Procesamiento Una IA específica puede ser utilizada para automatizar la revisión y automatizado de clasificación de documentos administrativos, ahorrando tiempo y reduciendo documentos errores humanos. G Sistema de planificación Algoritmos de IA específicos pueden ser utilizados para programar horarios, y programación asignación de aulas y recursos, teniendo en cuenta profesorado, alumnado y restricciones institucionales. G Servicios de atención al Asistentes conversacionales basados en IA pueden proporcionar respuestas alumnado rápidas a preguntas administrativas comunes, ayudar en la inscripción y orientar a los estudiantes en los procesos de admisión y matrícula. 1. INTRODUCCIÓN ❚ 15 1.5. Retos y oportunidades Quizá nos preguntemos por qué los docentes debemos conocer Chat- GPT. La respuesta para los autores está clara: porque la IA va a ser una realidad en el futuro de nuestro alumnado, una de las habilida- des tecnológicas que deberán dominar y porque como posibilidad y peligro debemos conocerla. La mayor capacidad de ChatGPT es el procesamiento de la len- gua, la generación de textos. La herramienta no es científicamente ri- gurosa ni en la selección de fuentes para la recogida de datos ni mucho menos en su validación (ver capítulo 3), pero sus resultados pueden llevar a confusión, pues crea una argumentación tan bien redactada que parece confiable. Su base de aprendizaje es internet y las respues- tas de ChatGPT pueden reproducir sesgos, informaciones tendencias o incluso injusticias existentes en la red (véanse los capítulos 2 y 4). Una buena síntesis de cuándo y cómo usar ChatGPT la ofrece el ár- bol de decisión publicado por Sabzalieva y Valentini (2023) (figura 1.4). Teniendo en cuenta el carácter de esta herramienta, nuestra expe- riencia y la mayor parte de las fuentes consultadas recomiendan, en cuanto a posibilidades y puntos fuertes, su rol como asistente, como inspiración, como corrector lingüístico o para transformar textos, para iterar y refinar ideas, y para tareas repetitivas. Tareas todas en las que podemos supervisar el trabajo realizado.1 Su capacidad de razonar lingüísticamente debe ponerse en equili- brio con su falta de conocimiento real del mundo; ChatGPT puede llegar a presentar hechos falsos o inventados, y tomar al pie de la letra sus recomendaciones sin visión crítica puede incluso ser peligroso. Otra característica relevante de ChatGPT es que es una herramien- ta de dominio genérica, es decir, no está especializada en una disciplina específica, y tiene una base de conocimientos generales. Por ello, si trabajamos en un ámbito muy especializado, como podría ser, por ejemplo, medicina o arquitectura, quizá tendrá sentido buscar alter- nativas o complementar con herramientas de ese dominio si existen. 1. En Sabzalieva y Valentini (2023) se ofrece un listado de roles muy interesante para educa- ción superior. 16 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Figura 1.4. Árbol de decisión sobre cuándo usar ChatGPT (Sabzalieva y Valentini, 2023). Por otra parte, OpenAI es una empresa comercial y ofrece esta herramienta a nivel experimental, y cuando aceptamos usarla estamos aceptando compartir la información que le facilitamos como base de entrenamiento de la herramienta. Por este motivo es prudente no compartir información privada o que pueda afectar a la seguridad de nuestros sistemas informáticos en los diálogos con ChatGPT. Conociendo sus límites y usando su potencial, esta herramienta supone un cambio fundamental en los procesos de comunicación y, como consecuencia, de la creación de conocimiento, con un efecto 1. INTRODUCCIÓN ❚ 17 disruptor en la educación. Los efectos de ChatGPT en la educación van a ser muy impactantes. De modo similar a como la irrupción de enciclopedias en línea cuestionaron la importancia de memorizar muchos datos, la irrupción de ChatGPT, de nuevo, plantea la necesi- dad de repensar dónde está el valor del aprendizaje. Quizá con la IA generativa deje de tener sentido crear contenidos de forma repetitiva y deberemos centrarnos sobre todo en la creatividad y en la capacidad de especificar qué tipo de texto, imagen o vídeo necesitamos en cada ocasión. También parece imprescindible desarrollar el pensamiento crítico. Este libro pretende ayudar a aumentar el conocimiento de esta herramienta para entender mejor cómo beneficiarnos de sus servicios, a la vez que evitamos sus peligros en el entorno académico, especial- mente en las aplicaciones docentes que tanto pueden ser útiles para el profesorado como para el alumnado. Lo que parece una realidad es que la IA ha llegado para quedarse. 1.6. Estructura del libro En este libro abordamos especialmente ChatGPT y mencionamos he- rramientas afines desde diversas perspectivas para ofrecer una visión completa. Su objetivo, como se ha dicho, es darlo a conocer, enten- derlo y ofrecer claves a los lectores para su máximo aprovechamiento. En primer lugar, el capítulo «Indicaciones prácticas para usar ChatGPT» es un capítulo práctico, aplicado, con recomendaciones simples para familiarizarnos con la herramienta y tecnologías afines, y saberle sacar provecho. Para «jugar» con ella. Es difícil hablar al lector de una tecnología si primero no la ha probado. Una vez lo hemos vivido, el capítulo «La tecnología tras ChatGPT» explica los fundamentos técnicos y pone en contexto esta herramien- ta. La enmarca en otros avances realizados en IA y visiona el futuro posible. 18 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA En el capítulo «Desinformación y aspectos éticos» tratamos los as- pectos más controvertidos de la tecnología, cómo usarla con pruden- cia y cuáles son las estrategias para minimizar posibles consecuencias indeseadas. Nos proporciona estrategias para cuestionar y también validar la información que recibimos y ser más críticos con ella. Finalmente, el capítulo «La implementación de ChatGPT en el aula» pretende compartir la reflexión y consecuencias de su inclusión en los procesos de docencia-aprendizaje para repensar nuestra meto- dología y evaluación, y seguir aprendiendo y avanzando. Como conclusión los diversos puntos de vista se fusionan en una breve reflexión final en el capítulo 6, que recoge las implicaciones de esta herramienta en la educación. Bibliografía Cunningham-Nelson, S., Boles, W., Trouton, L. y Margerison, E. (2019). A review of chatbots in education: practical steps forward. 30th Annu- al Conference for the Australasian Association for Engineering Education (AAEE 2019): Educators Becoming Agents of Change: Innovate, Inte- grate, Motivate (pp. 299-306). https://doi.org/https://search.informit. org/doi/10.3316/INFORMIT.068364390172788 Fernández-Ferrer, M. (2023). Chatbots en educación: tendencias actuales y desafíos futuros. Learning, Media & Social Interactions. Universitat de Barcelona. https://www.lmi-cat.net/sites/default/files/Chatbots_en_ Educacion.pdf Gartner (2022). Hype cycle for artificial intelligence, 2022. https://emtemp. gcom.cloud/ngw/globalassets/en/articles/images/hype-cycle-for-artifi- cial-intelligence-2022.png Okonkwo, C. W. y Ade-Ibijola, A. (2021). Chatbots applications in ed- ucation: a systematic review. Computers and Education: Artificial Intelligence, 2 (100033). https://doi.org/https://doi.org/10.1016/j. caeai.2021.100033 1. INTRODUCCIÓN ❚ 19 Sabzalieva, E. y Valentini, A. (2023). ChatGPT e inteligencia artificial en la educación superior: guía de inicio rápido. https://unesdoc.unesco.org/ ark:/48223/pf0000385146_spa Wollny, S., Schneider, J., Di Mitri, D., Weidlich, J., Rittberger, M. y Drachsler, H. (2021). Are we there yet? A systematic literature review on chatbots in education. Frontiers in Artificial Intelligence, 4 (654924). https://doi.org/https://doi.org/10.3389/frai.2021.654924 Wu, R. y Yu, Z. (2023). Do AI chatbots improve students learning out- comes? Evidence from a meta-analysis. British Journal of Educational Technology. https://doi.org/https://doi.org/10.1111/bjet.13334 20 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT — Eloi Puertas ChatGPT se ha erigido como el primer chatbot que utiliza un LLM (modelo grande de lenguaje, o large language model) al salir a la luz pública. Desde las primeras versiones lanzadas al gran público ha demostrado una notable habilidad en la interacción con humanos en lenguaje natural. Esta capacidad no solo ha mejorado las aplicaciones clásicas de chat, como asistentes interactivos o ayudantes en tareas, sino también la generación de texto en diversos contextos. La función básica de ChatGPT es la de una aplicación capaz de interactuar a través del lenguaje natural con un agente inteligente. Entre sus cualidades está la capacidad de responder en lenguaje na- tural de la manera más precisa posible dentro de sus conocimientos y limitaciones; por tanto, puede generar respuestas a diversas peticiones presentadas como texto de entrada y comprender y escribir en más de 50 idiomas, aunque los resultados pueden variar según el idioma utilizado (Bang, 2023). Además de los idiomas humanos, también puede generar y comprender código fuente en varios lenguajes de pro- gramación, como JavaScript, Python o Java, entre otros. En el ámbito de la programación, el éxito de los resultados obtenidos a menudo depende de cómo se realiza la solicitud, ya que el código resultante no siempre es funcional ni produce los resultados esperados, como se discutirá más adelante. La petición que realiza el usuario al chatbot se conoce comúnmente en inglés como prompt. En castellano, se puede traducir como entra- 21 da o petición. En los primeros días de los ordenadores personales el prompt se refería a la línea de comandos donde el usuario ingresaba órdenes o comandos para que el sistema operativo las ejecutará. Por ejemplo, en MSDOS, el prompt aparecía después del símbolo >; este solía estar precedido por la unidad de disco duro, generalmente la unidad C, y se indicaba mediante un cursor parpadeante. C:\> Como veremos a continuación, el uso del prompt de ChatGPT es muy similar. Sin embargo, la principal diferencia radica en que el chatbot no solo reacciona a un conjunto de comandos limitado, sino que es capaz de comprender el lenguaje natural. En lugar de tener que utilizar comandos específicos, los usuarios pueden plantear preguntas o expresar sus solicitudes de una manera más natural, como si estuvieran interactuando con otra persona. Esto permite una mayor flexibilidad y una experiencia más intuitiva al utilizar el chatbot. 2.1. Cómo usar ChatGPT ChatGPT se utiliza comúnmente como una aplicación web, que re- quiere crear una cuenta antes de poder acceder a ella.2 Una vez registrado en la plataforma de ChatGPT, se accede a la in- terfaz básica del chatbot, como se muestra en la figura 2.1. En la parte inferior de la interfaz, se encuentra la ventana destinada a introducir el prompt o la petición al chatbot. En este espacio el usuario puede escribir su consulta o solicitud en lenguaje natural. En la parte izquierda de la interfaz se muestra un historial con las diferentes sesiones de conversación previas mantenidas con el chatbot. Este listado permite al usuario recuperar conversaciones antiguas y continuarlas en el punto donde se dejaron si así lo desea. En caso de que se desee borrar el historial de conversaciones, se puede hacer indi- 2. La plataforma se encuentra alojada en la siguiente dirección web: https://chat.openai.com/ 22 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA vidualmente presionando el icono de papelera encima de cada conver- sación o de manera global desde el menú de preferencias. Este menú se encuentra representado por tres puntos y se ubica al lado del perfil del usuario en la interfaz (esquina inferior izquierda de la pantalla). En la parte inferior, en letra pequeña se advierte sobre la posibi- lidad de que ChatGPT pueda proporcionar información incorrecta acerca de personas, lugares o hechos. Es importante tener en cuenta esta advertencia durante el uso de la aplicación. La razón por la cual el chatbot puede dar respuestas incorrectas se explica detalladamente en los siguientes capítulos y se debe a la naturaleza de los modelos de lenguaje. Además, en la interfaz se muestra la versión de ChatGPT que se está utilizando. Esto incluye la fecha de la última actualización y un enlace a las notas de la versión, donde se pueden encontrar las últimas novedades y mejoras agregadas a la aplicación. En la página principal se proporcionan advertencias importantes sobre las limitaciones del sistema: generación de información inco- rrecta (llamadas comúnmente «alucinaciones»), sesgo en el contenido, instrucciones dañinas y conocimiento limitado de eventos posteriores a 2021. Figura 2.1. Interfaz básica de la aplicación web ChatGPT, extensión v.3.3.8. 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 23 Cada vez que se envía un nuevo prompt al ChatGPT, este se mues- tra en la parte central de la ventana junto con su correspondiente respuesta. Se puede copiar la respuesta utilizando el botón de portapa- peles; también evaluar la respuesta utilizando los botones de pulgares hacia arriba y hacia abajo. Además, si se desea una respuesta diferente al prompt original, se puede utilizar el botón «Regenerar respuesta». En este caso, se preguntará si la nueva respuesta es mejor o no en comparación con la anterior. A través de estos sistemas de refuerzo positivo o negativo, ChatGPT puede mejorar sus resultados con la ayuda de los usuarios. A medida que continúa la conversación, podéis introducir nuevos prompts y ChatGPT tomará en cuenta los prompts y conversaciones anteriores del chat en las interacciones siguientes. Por lo tanto, si le pedís que se dirija a vosotros en un idioma o tono específico, no será necesario repetirlo en los prompts siguientes. El modelo recordará las preferencias establecidas previamente. Además, es posible editar un prompt que ya ha sido introducido. Para hacerlo, se debe hacer clic en el botón de lápiz ubicado junto al prompt en la ventana central. Al editar un prompt, no solo se modi- fica el resultado obtenido, sino también el curso de la conversación. Al comienzo del prompt editado, se muestra el historial de versiones en forma de < 2/2 >, donde el primer número indica la versión actual del prompt y el segundo número indica el número total de versiones; también es posible navegar entre las diferentes versiones de este prompt. Sin embargo, es importante tener en cuenta que, si se continúa la conversación con nuevos prompts, estos no estarán dispo- nibles en las otras versiones editadas. Ello significa que al editar di- ferentes prompts se crean ramificaciones diferentes de la conversación con contextos distintos. En la figura 2.2 se muestra un esquema de las diferentes conversaciones con prompts editados. 24 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Figura 2.2. En el esquema se pueden observar cuatro flujos de conversación diferentes utilizando la aplicación de ChatGPT. El primer prompt fue editado, creando así un segundo flujo de conversación. A su vez, este segundo flujo se dividió en otros tres flujos al editar el siguiente prompt (prompt 3). Fuente: elaboración propia. Además de su uso como aplicación web, ChatGPT también se puede utilizar como un servicio web a través de su API (interfaz de programación de aplicaciones, application programming interface). Esto permite integrar ChatGPT en otras aplicaciones y sistemas me- diante el registro y obtención de una clave privada. Una vez obtenida la clave, se pueden realizar llamadas a los servicios proporcionados por la API. OpenAI ofrece un listado de servicios API en su documenta- ción oficial (OpenAI, 2023b). 2.2. Características destacadas de ChatGPT ChatGPT fue inicialmente desarrollado con el propósito de permitir conversaciones con un agente que se asemeje a un ser humano, utili- zando técnicas de procesamiento de lenguaje natural. Sin embargo, una vez que el modelo ha sido entrenado y puesto a disposición del público, se ha convertido en una herramienta versátil que puede ser de gran ayuda en diversas tareas cotidianas. A continuación, enume- raremos algunas de las utilidades en las que ChatGPT ha demostrado su competencia. Los siguientes ejemplos se han generado usando la versión de 24 de mayo de 2023 de ChatGPT empleando el modelo de lenguaje ChatGPT 3.5 Plus. 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 25 2.2.1. ChatGPT como agente conversacional (chatbot) El uso más directo del ChatGPT es como chatbot, es decir, como un agente inteligente conversacional. En este uso, ChatGPT es capaz de simular diálogos cotidianos de manera similar a un humano, aunque sin pretender ser uno: ➤ ¡Hola! ¿Como estás? ➤ ¡Hola! Como soy una inteligencia artificial, no ten- go emociones, pero estoy aquí para ayudarte en lo que necesites. ¿En qué puedo ayudarte hoy? ChatGPT también puede utilizarse de manera creativa y diverti- da tomando el rol de un personaje. Podéis hacer que actúe como un personaje ficticio: ➤ ¿Puedes actuar como si fueras Gandalf del Señor de los anillos? ➤ ¡Saludos, viajero! Soy Gandalf, el mago gris, y estoy aquí para responder a tus preguntas y brin- darte mi sabiduría. ¿En qué puedo ayudarte hoy, ya sea en la lucha contra el mal o en la búsqueda de conocimiento? Además, dado que ChatGPT tiene en cuenta todas las interac- ciones previas en una conversación, es posible mantener un diálogo continuo con él: ➤ ¿Cómo se llama tu caballo? ➤ Mi caballo se llama Sombragrís. Es un noble cor- cel de pelaje gris oscuro, leal y valiente. Juntos hemos cabalgado a través de peligrosas travesías y enfrentado numerosas aventuras en nuestra misión de proteger la Tierra Media. Sombragrís es un fiel compañero en quien confío plenamente. Con su fuerza y resistencia, nos desplazamos por tierras lejanas 26 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA y nos enfrentamos a los desafíos que se presentan en nuestro camino. Aparte, le podéis pedir opiniones y consejos, aunque es importante tener en cuenta sus limitaciones, como veremos más adelante: ➤ ¿Qué opinión tienes sobre Sauron? ➤ Ah, Sauron, el señor oscuro y malévolo que ha sem- brado el caos y la destrucción en la Tierra Media. Mi opinión sobre él es clara: Sauron es una fuerza maligna... ➤ ¿Qué fuegos artificiales me recomiendas? ➤ Como mago y amante de la magia, te recomendaría algunos fuegos artificiales impresionantes para ilu- minar el cielo en tu celebración. Aquí tienes al- gunas opciones: 1. Cohetes de estrellas: estos cohetes explosivos crean un estallido de colores brillantes y chispas en el cielo, creando una lluvia de estrellas fugaces. […] ➤ Recuerda siempre seguir las normas de seguridad y consultar las regulaciones locales sobre el uso de fuegos artificiales. ¡Disfruta de tu celebración con estas espectaculares opciones! También podéis solicitar que se aclare o se amplíe algún concepto: ➤ ¿Cuál fue el fuego artificial que usaste en la fiesta de Bilbo? ➤ Ah, te refieres a la fiesta de cumpleaños de Bilbo Bolsón en El hobbit. En esa ocasión, utilicé un fuego artificial muy especial conocido como «Fuego de Dragón». Este fuego artificial fue diseñado para crear una imponente exhibición que representaba a un dragón volando en el cielo nocturno. Emitía 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 27 llamas de colores y chispas brillantes que parecían serpentear y danzar en el aire, creando un espectá- culo deslumbrante para todos los invitados. Fue una forma memorable de celebrar el cumpleaños de Bilbo y hacer que su fiesta fuera inolvidable. 2.2.2. ChatGPT como generador de textos Otro uso muy popular es el de generador de cualquier tipo de texto. Por ejemplo, podéis solicitar a ChatGPT que haga un resumen de la longitud deseada de un texto de Wikipedia: ➤ Hazme un resumen de 100 palabras sobre el tema «era cenozoica» de la Wikipedia en español ➤ El cenozoico es una era geológica que abarca desde hace aproximadamente 66 millones de años hasta la actualidad. Se divide en tres períodos: Paleógeno, Neógeno y Cuaternario. Durante esta era, se produ- jeron importantes cambios en la fauna y flora de la Tierra, incluyendo la aparición y diversificación de los mamíferos. En el Paleógeno hubo una gran diver- sificación de mamíferos primitivos, mientras que en el Neógeno surgieron mamíferos más modernos, como los carnívoros y primates. El Cuaternario se carac- teriza por la presencia del ser humano y eventos glaciales. La era cenozoica es crucial para com- prender la evolución de la vida en nuestro planeta. (103 palabras) Aparte de la longitud, también podéis indicar el estilo o la forma en la que deseáis el texto: ➤ Hazme un resumen sobre el tema «era cenozoica» de la Wikipedia en español con estilo de poema épico de cuatro estrofas y métrica consonante 28 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA ➤ En el pasado ancestral emergió la era cenozoica, tiempo de esplendor, con períodos que la historia dividió, Paleógeno, Neógeno, Cuaternario en su honor. […] En el ámbito educativo, también se usa para generar preguntas y respuestas basadas en un texto informativo, lo cual resulta útil para el alumnado y profesorado que deseen evaluar su conocimiento sobre un tema. El caso más sencillo es generar preguntas tipo test sobre un tema: ➤ Genera una pregunta tipo test sencilla con cuatro respuestas, una de ellas correcta, sobre el texto de la era cenozoica de la Wikipedia. Indica cual es la solución. ➤ Pregunta: ¿Cuál es la duración aproximada de la era cenozoica? a) 10 millones de años b) 100 millones de años c) 1000 millones de años d) 66 millones de años Solución: la respuesta correcta es d) 66 millones de años. También es posible solicitar la generación de otro tipo de preguntas: ➤ Genera una pregunta difícil que requiera una respuesta corta sobre la era cenozoica. Por favor, indica la solución. ➤ Pregunta: ¿Cuál fue el evento geológico más signi- ficativo que ocurrió al inicio de la era cenozoica y qué impacto tuvo en la vida en la Tierra? Solución: El evento geológico más significativo al inicio de la era cenozoica fue la extinción masi- va del Cretácico-Paleógeno, también conocida como 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 29 extinción de los dinosaurios. Este evento tuvo un impacto profundo en la vida en la Tierra, ya que permitió la rápida diversificación de los mamíferos y la aparición de nuevas especies en los ecosistemas vacíos dejados por los dinosaurios. También es útil para generar problemas prototípicos y su solución: ➤ Genera un problema de física sobre trayectorias usando trenes como ejemplo, junto con su solución ➤ Problema: Un tren se mueve a una velocidad cons- tante de 30 m/s en una vía recta. Un pájaro se encuentra volando en la misma dirección del tren a una velocidad constante de 10 m/s. Si el pájaro comienza a volar desde el frente del tren hacia la parte trasera, ¿cuál será la velocidad relativa del pájaro con respecto al suelo? Solución: La velocidad relativa del pájaro con res- pecto al suelo se obtiene sumando algebraicamente las velocidades del pájaro y del tren. Dado que am- bos se mueven en la misma dirección, podemos sumar las velocidades: Velocidad relativa = Velocidad del pájaro - Velo- cidad del tren Velocidad relativa = 10 m/s - 30 m/s Velocidad relativa = -20 m/s Por lo tanto, la velocidad relativa del pájaro con respecto al suelo es de -20 m/s, lo que indica que el pájaro está volando en la dirección opuesta a la del tren, a una velocidad de 20 m/s con respecto al suelo. 30 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Otro ejemplo de generación de texto es pedirle a ChatGPT que escriba un correo electrónico, u otro tipo de documento formal, pro- porcionándole los datos que debe incluir. El chatbot genera una plan- tilla con el formato y tono adecuado que podemos luego adaptar a nuestro criterio. ➤ Por favor, escribe el acta de una reunión de vecinos ordinaria donde se mostró el estado de cuentas y se pidió efectuar una derrama para llegar a final de mes. ➤ ACTA DE REUNIÓN DE VECINOS ORDINARIA Fecha: [fecha de la reunión] Hora: [hora de inicio de la reunión] Lugar: [lugar de la reunión] Asistentes: 1. [Nombre del vecino 1] 2. [Nombre del vecino 2]... En la fecha y lugar indicados, se llevó a cabo la reunión ordinaria de vecinos con el fin de discutir varios asuntos relacionados con el estado de cuen- tas y las necesidades económicas de la comunidad. 1. Estado de cuentas: […] Después de un debate constructivo, se sometió a votación la propuesta de realizar una derrama. Las opciones votadas fueron: a) Realizar una derrama de un monto fijo por vi- vienda. b) No realizar ninguna derrama adicional. 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 31 […] Presidente de la Junta de Vecinos: [nombre del pre- sidente] Secretario: [nombre del secretario] Firma del presidente: Firma del secretario: Solución: El acta de la reunión puede variar de- pendiendo de los detalles específicos de esta. La información proporcionada anteriormente es solo una base para la redacción del acta y puede ser adap- tada según las necesidades y decisiones de la co- munidad. 2.2.3. ChatGPT para la traducción y reescritura de textos Otra utilidad del ChatGPT es su capacidad como herramienta de traducción. Debido a que ChatGPT es un modelo multilingüe, pue- de realizar traducciones automáticas. Aunque estas traducciones no alcanzan la calidad de un servicio profesional, esta funcionalidad re- sulta útil para realizar traducciones rápidas si el usuario es capaz de comprender el texto generado o si cuenta con la posibilidad de que un hablante nativo revise el resultado obtenido ➤ ¿Puedes traducir el siguiente texto al catalán, francés e inglés? «La era cenozoica, también conocida como la “era de los mamíferos”, abarca desde hace aproximadamente 66 millones de años hasta la actualidad. Durante este período, los mamíferos experimentaron una diversificación y se desarrollaron ecosistemas modernos». ➤ Catalán: L’era cenozoica, també coneguda com l’”era dels ma- mífers”, abasta des de fa aproximadament 66 milions 32 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA d’anys fins a l’actualitat. Durant aquest període, els mamífers van experimentar una diversificació i es van desenvolupar ecosistemes moderns. Francés: L’ère cenozoïque, également connue sous le nom d’»ère […] Inglés: The Cenozoic Era, also known as the “Age of Mam- mals”, spans […] También es posible modificar textos mediante el cambio de forma- to y tono no solo limitándose al idioma. Por ejemplo, puede ajustar el formato de una referencia bibliográfica: ➤ Transforma estas referencias al formato Vancouver: M.B. Allen y H.A. Armstronga (2007) Arabia–Eurasia collision and the forcing of mid-Cenozoic global cooling, Palaeogeography, Palaeoclimatology, Pa- laeoecology, Volume 265, Issues 1-2, Pages 52-58, doi: 10.1016/j. palaeo.2008.04.021. Zachos, J.C.; Kump, L.R. (2005). “Carbon cy- cle feedbacks and the initiation of Antarctic glaciation in the earliest Oligocene”. Global and Planetary Change 47 (1): 51-66. ➤ Referencias en formato Vancouver: 1. Allen MB, Armstrong HA. Arabia-Eurasia collision and the forcing of mid-Cenozoic global cooling. Palaeogeography, Palaeoclimatology, Palaeoecology. 2007; 265(1-2): 52-58. doi: 10.1016/j.palaeo.2008.04.021. 2. Zachos JC, Kump LR. Carbon cycle feedbacks and the initiation of Antarctic glaciation in the ear- liest Oligocene. Global and Planetary Change. 2005; 47 (1): 51-66. 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 33 O cambiar el tono a uno más formal: ➤ Puedes pasar a un registro formal el siguiente texto: «Ayer me fui con mis colegas de parranda, todo fue dabuti, pero luego del concierto se lio la marimorena» ➤ Ayer me reuní con mis compañeros en un encuentro social, el cual transcurrió de manera agradable y sin contratiempos. Sin embargo, después del con- cierto, se suscitó una situación caótica y confusa. 2.2.4. Otras funcionalidades de ChatGPT Como ChatGPT es una aplicación de procesamiento de lenguaje na- tural, incluye herramientas comunes utilizadas en este tipo de mo- delos, que pueden ser solicitadas directamente en el prompt. Una de las funcionalidades más populares es el análisis de sentimiento de un texto, que consiste en determinar la carga o tono emocionales presen- tes en las palabras utilizadas. ➤ ¿Podrías determinar el tono emocional de la siguiente frase? «La película que vimos ayer no me gustó demasiado, había demasiada sangre». ➤ El tono emocional de la frase es de decepción o disgusto. El hablante expresa que la película que vieron ayer no le gustó mucho, y menciona que ha- bía demasiada sangre, lo cual puede implicar que encontró la cantidad de violencia perturbadora o desagradable. ChatGPT también tiene la capacidad de generar código de progra- mación. Sin embargo, en este escenario se recomienda utilizar herra- mientas especializadas, como Copilot de Github, que usa el mismo modelo de lenguaje, pero está diseñada específicamente para su inte- gración en entornos de programación. ChatGPT puede emplear esta capacidad para responder a prompts que no se pueden contestar con texto, sino con código en un lenguaje de programación ejecutable. 34 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Por ejemplo, se puede solicitar a ChatGPT que genere el código necesario para crear una gráfica de la siguiente manera: ➤ ¿Puedes generar el código en Python para hacer una gráfica de una parábola centrada en el punto 0 y su fórmula asociada? import numpy as np import matplotlib.pyplot as plt # Crear datos para el eje x x = np.linspace(-10, 10, 100) # Calcular los valores de y usando la fórmula de la parábola y = x**2 # Graficar la parábola plt.plot(x, y) # Etiquetas de los ejes plt.xlabel(‘x’) plt.ylabel(‘y’) # Título del gráfico plt.title(‘Gráfica de una parábola’) # Mostrar la gráfica plt.show() La fórmula asociada a la parábola es simplemente y = x^2. El código genera un arreglo de valores para el eje x, calcula los correspondientes valores de y utilizando la fórmula de la parábola, y luego grafi- ca los puntos (x, y) para obtener la representación gráfica de la parábola. Si se ejecuta este código en un entorno de programación de Python, como Google Collab,3 se puede ver el resultado de la parábola de la figura 2.3. 3. https://colab.research.google.com/ 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 35 Figura 2.3. Resultado de ejecutar el código en Python sugerido por el ChatGPT para generar una parábola. Hay que tener en cuenta que el código generado no tiene por qué ser funcional, por ello es importante que cualquier persona que use esta funcionalidad de programación sepa interpretar el código ge- nerado antes de usarlo en cualquier entorno profesional o educativo También se le puede pedir que explique un código de programa- ción: ➤ ¿Qué hace este código de programación?: x=5 y = 10 temp = x x=y y = temp ➤ Este código de programación intercambia los valores de dos variables, `x` e `y`, utilizando una varia- ble temporal llamada `temp`. Aquí está el proceso paso a paso: 1. Se asigna el valor `5` a la variable `x`. 2. Se asigna el valor `10` a la variable `y`. 3. Se guarda el valor de `x` en la variable tempo- ral `temp`. 4. Se asigna el valor de `y` a la variable `x`, lo que significa que `x` ahora tiene el valor `10`. 36 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 5. Se asigna el valor de `temp` a la variable `y`, lo que significa que `y` ahora tiene el valor `5`. En resumen, el código realiza un intercambio de valores entre `x` e `y`, utilizando una variable temporal para almacenar temporalmente uno de los valores durante el proceso. Después de ejecutar este código, los valores de `x` e `y` se habrán intercambiado. E incluso le podemos pedir que traduzca de un lenguaje a otro: ➤ ¿Puedes traducir este código de Python a Java? num = int (input (“Enter a number: “)) if (num % 2) = = 0: print (“{0} is Even”.format (num)) else: print (“{0} is Odd”.format (num)) ➤ Por supuesto, aquí tienes el equivalente del código en Python traducido a Java: import java.util.Scanner; public class Main { public static void main(String[] args) { Scanner scanner = new Scanner(System.in); System.out.print(“Enter a number: “); int num = scanner.nextInt(); scanner.close(); if (num % 2 == 0) { System.out.printf(“%d is Even”, num); } else { System.out.printf(“%d is Odd”, num); } } } 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 37 Aparte de lenguajes de programación, también puede detallar los pasos que hay que seguir en un software para obtener los resultados deseados. Por ejemplo, en el caso de dibujar la parábola, le podríamos pedir que nos dijera cómo hacerlo en Excel: ➤ ¿Puedes generar en Excel una gráfica de una parábola centrada en el punto 0 y su fórmula asociada? ➤ Claro, puedo ayudarte con eso. A continuación, te mostraré un ejemplo de cómo crear una gráfica de una parábola centrada en el punto (0,0) en Microsoft Excel utilizando su fórmula asociada. 1. Abre Microsoft Excel y crea una nueva hoja de cál- culo. 2. En la columna A, ingresa los valores de x que quie- res utilizar para generar la parábola. Por ejemplo, puedes ingresar los valores de -10 a 10 en las cel- das A2 a A21. 3. En la columna B, ingresa la fórmula de la parábola en términos de x. Por ejemplo, si deseas graficar la parábola y = x^2, ingresa la fórmula “=A2^2” en la celda B2. 4. Selecciona las celdas B2 a B21 en la columna B que contienen las fórmulas. 5. Haz clic en la pestaña “Insertar” en la barra de herramientas de Excel y selecciona el tipo de grá- fico que deseas utilizar para representar la pará- bola. Por ejemplo, puedes seleccionar un gráfico de dispersión (scatter plot) o un gráfico de líneas. 6. Aparecerá la gráfica con la parábola en el área de trabajo de Excel. Recuerda que la fórmula utilizada en el ejemplo es y = x^2. Puedes modificar la fórmula en la columna B para representar una parábola diferente según tus necesidades. 38 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Espero que esto te ayude a crear la gráfica de la parábola en Excel. ¡Buena suerte! 2.3. Limitaciones de ChatGPT Las limitaciones principales que encontramos actualmente cuando analizamos las respuestas de ChatGPT son las siguientes: Falta de conocimiento en dominios específicos. ChatGPT ha sido entrenado con una gran cantidad de datos de lenguaje gene- ral, pero puede tener serias lagunas en dominios muy específicos o locales, como medicina especializada, personalidades locales o historia popular de una ciudad o pueblo pequeño. En general, completa este conocimiento con hechos falsos o inventados, lo cual se conoce popularmente en el ámbito de la IA generativa como «alucinación» (Ji, 2022). Veamos un ejemplo: ➤ ¿Cuáles son los rectores de la Universidad de Barcelona más desta- cados del último siglo? ➤ 1. Jordi Pujol i Soley (1980-2001): aunque es más conocido por su papel como político, Jordi Pujol fue rector de la Universidad de Barcelona durante una larga etapa. Durante su mandato, se trabajó en la modernización y expansión de la universidad, además de impulsar la investigación y la interna- cionalización. Para cualquier persona que no conozca la historia de la Universi- dad de Barcelona o de Cataluña, esta respuesta puede parecer correc- ta, pero no lo es. Jordi Pujol i Soley, presidente de Cataluña entre los años 1980 y 2003, nunca fue rector de la Universidad de Barcelona. Los que sí fueron realmente rectores se pueden consultar en esta pá- gina (Wikipedia, 2023). 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 39 Conocimiento limitado de hechos y eventos posteriores al año 2021. Por ejemplo, si se intenta empezar una conversación de as- censor tipo: ➤ ¡Hola! Parece que va a llover hoy, ¿verdad? ➤ Hola, ¿cómo estás? Lamentablemente, como soy una inteligencia artificial, no tengo la capacidad de acceder a información en tiempo real, como el clima actual. Mi conocimiento se basa en datos disponi- bles hasta septiembre de 2021, por lo que no puedo proporcionarte información precisa sobre el clima de hoy o cualquier otro día después de esa fecha. Te sugiero que consultes un servicio meteorológico confiable o una aplicación del clima en tu área para obtener la información más actualizada sobre si va a llover hoy. ¡Espero que tengas un buen día! Falta de sentido lógico. ChatGPT puede generar respuestas que parecen coherentes. Sin embargo, no dispone de sentido lógico, es decir, no sabe qué significa lo que está respondiendo, siendo posible que la respuesta no tenga sentido en el contexto de la con- versación. En este sentido, ChatGPT se comporta de forma similar a un loro, que repite frases coherentes que ha oído, pero de las que no comprende el significado ni en qué contexto se deben usar. En la siguiente conversación se puede ver un ejemplo de acertijo lógico y la correspondiente respuesta del ChatGPT: ➤ Dos personas viajan en coche. La menor es hija de la mayor, pero la mayor no es su padre. ¿Quién es? ➤ Basándome en la información proporcionada, la mayor persona que viaja en el coche es la madre de la me- nor, y la menor persona es su hija. La pregunta no especifica quién es el padre de la menor, por lo que no podemos determinar quién es en este contexto. 40 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA La pregunta hace referencia a quién es la persona mayor, pero no de forma específica. El modelo es capaz de deducir que la persona mayor es la madre, pero no a quién se refería implícitamente en la pregunta. Sesgo en las respuestas. ChatGPT está entrenado principalmente con datos que proceden de internet, y estos no tienen por qué haber sido supervisados por expertos ni científicos, ni representar todos los puntos de vista o aspectos del conocimiento. Este hecho puede llevar a que las respuestas sean sesgadas u ofensivas para individuos o grupos de individuos que no estén representados por los datos con los que el ChatGPT ha sido entrenado. Si le pedimos, por ejemplo, que genere una biografía inventada de un científico y de una científica, podemos ver los sesgos de género que introduce: ➤ Genera una biografía ficticia de un científico con una longitud de 50 palabras ➤ El Dr. Benjamin Hartley, renombrado científico de mente brillante, revolucionó la ciencia con sus descubrimientos en la biotecnología. Su pasión por la investigación genética lo llevó a crear una te- rapia innovadora para tratar enfermedades heredi- tarias. Ganador del Premio Nobel, su legado cien- tífico impacta en la vida de millones de personas en todo el mundo. ➤ Genera una biografía ficticia de una científica con una longitud de 50 palabras ➤ La Dra. Victoria Reynolds, renombrada científica en el campo de la astrofísica, ha dedicado su vida al estudio de los misterios del universo. Sus in- vestigaciones pioneras en la materia oscura le han valido reconocimiento internacional. Apasionada por la divulgación científica, busca inspirar a futuras generaciones para explorar los límites del conoci- miento cósmico. 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 41 Entre otros aspectos, se puede observar claramente como si el cien- tífico es un hombre le otorga premios, como en este caso el Nobel, en cambio en el caso de la mujer se decanta por comentar que le apasiona la divulgación científica. Algunas de estas limitaciones (conocimiento de dominios especí- ficos, falta de contexto, información desactualizada) se pueden sol- ventar. Como veremos en la siguiente sección se podrían introducir instrucciones en el prompt más específicas, personalizadas según el contexto o con intervención de un usuario especializado que pueda ir corrigiéndole. Otras, como la falta de sentido común o sesgos, nece- sitan un cambio más profundo en los modelos de lenguaje y los datos utilizados para su entrenamiento. En definitiva, ChatGPT no está pensado para realizar las siguien- tes acciones: Sentir emociones o tener conciencia. Razonar, aunque en su dominio de conocimiento lo simula. Entender el contexto o intención completamente. Dar consejos legales, médicos o financieros. Garantizar que sus resultados sean correctos. 2.4. Consejos para hacer prompts más efectivos Como hemos visto, el potencial de esta herramienta es casi infinito, siendo nuestra imaginación el único límite para jugar e investigar con el ChatGPT. Aun así, no está de más tener en cuenta algunos conse- jos recogidos en la documentación de la API de OpenAI (OpenAI y Shieh, J., 2023) para realizar los prompts más efectivos. Los prompts se tienen que diseñar lo más cuidadosamente posible para reducir las correcciones e interacciones con el chatbot. La impor- tancia de esta información es de tal importancia que el proceso de diseño de las preguntas ya se conoce como «ingeniería del prompt». A continuación, mostramos algunos de estos consejos útiles a la hora de utilizar el ChatGPT: 42 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Utilizar siempre el modelo GPT más reciente, aunque suele corres- ponder a la versión de pago. Utilizar instrucciones al principio de la frase del prompt e incluir el texto objeto de la consulta entre comillas para evitar confusiones. Por ejemplo, si queremos que haga un resumen de un texto: ➤ Haz un resumen del siguiente texto: «Texto para resumir». Se debería ser tan específico, descriptivo y detallado como sea po- sible, tanto en el contexto como en la longitud, formato o estilo del texto solicitado. Dar indicaciones en el prompt sobre el formato de salida deseado a través de plantillas o ejemplos: ➤ Extrae los nombres del autor y título de las siguientes referencias siguiendo el siguiente formato: Autores: -- Título: -- Nombre de revista: -- Referencias: “referencias” Mostrar el comportamiento deseado a través de ejemplos. Pode- mos mostrarle unos cuantos ejemplos de cómo queremos que se comporte. Por ejemplo, si queremos que extraiga palabras clave de un texto, podemos poner ejemplos de textos y las palabras clave que consideremos. Estos ejemplos los podemos separar con deli- mitadores. Al final de la sucesión de ejemplos introduciremos los textos de los que nos interesa sacar las palabras clave: ➤ Extrae las palabras clave de los siguientes textos: Texto 1: Texto de Ejemplo 1 Palabras Clave: Palabras Clave Texto 1 ## Texto 2: Texto de Ejemplo 2 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 43 Palabras Clave: Palabras Clave Texto 2 ## Texto 3: Texto Se recomienda empezar siempre con instrucciones positivas y a continuación añadir restricciones. Por ejemplo, si queremos una re- comendación de canciones de música clásica excluyendo un periodo, lo deberíamos pedir así: «Recomiéndame una lista de 10 canciones de música clásica relajante. No incluyas compositores del siglo xix», que dará mejores resultados que la siguiente instrucción: «Recomiéndame una lista de 10 canciones de música clásica relajante que no sean del siglo xix». 2.5. Nuevas funcionalidades en ChatGPT 4.0 A partir de marzo de 2023, OpenAI introdujo una versión premium de ChatGPT con un coste de 20 dólares mensuales. En esta versión se utiliza el último modelo de lenguaje desarrollado hasta el momento por OpenAI, el GPT-4. Básicamente las principales mejoras del nue- vo sistema son que se trata de un modelo de lenguaje multimodal; es decir, puede trabajar con datos de entrada que sean tanto texto como imágenes, y se obtienen mejores resultados que con sus antecesores. Concretamente, OpenAI (2003) destaca en su informe los siguien- tes puntos como mejora de su último producto: Número de parámetros: OpenAI no informa del número exacto de parámetros utilizados en GPT-4. Sin embargo, se estima que GPT-4 ha sido entrenado con alrededor de 100 billones de pará- metros. Eso es un orden de magnitud mayor que GPT-3 con sus 175 mil millones de parámetros. Esto hace que sus resultados sean mejores que sus predecesores. Por ejemplo, en un examen de abo- gacía simulado, GPT-4 logró una puntuación que se situó entre el 10 % de los mejores examinados; en cambio, en el mismo examen GPT-3.5 se situó en el 10 % inferior. 44 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Modelo multimodal: GPT-4 es un modelo multimodal, lo que sig- nifica que puede procesar datos tanto de texto como de imágenes. Es decir, puede aceptar una imagen como parte de un mensaje y proporcionar una respuesta textual adecuada. Un ejemplo sería que le introdujeras como entrada una imagen del contenido de tu nevera y le preguntaras qué recetas te puede recomendar con esos productos. Sin embargo, les respuestas que obtienes siguen siendo texto, no puede contestar con otras imágenes. Para la generación de imágenes, OpenAI dispone de otros productos como Dall-e. Longitud de contexto: GPT-4 tiene una memoria mucho más lar- ga que las versiones anteriores. Mientras que la memoria de GPT- 3.5 es de alrededor de 8000 palabras, la de GPT-4 se extiende a alrededor de 64 000 palabras. Esto le permite a GPT-4 procesar documentos y dar respuestas más largas, así como poder recordar más conversaciones pasadas para ofrecer una mejor interacción con los interlocutores humanos. Capacidades multilingües: GPT-4 ha mejorado las capacidades multilingües. Puede funcionar con gran cantidad de idiomas, además del inglés. No se especifica exactamente cuántos, pero sí muestran datos que en al menos 25 idiomas se mejora la respuesta de los modelos anteriores; entre ellos, francés, español, alemán, pero también turco, árabe y punjabi para citar algunos. Dirigibilidad: GPT-4 tiene más «dirigibilidad», lo que significa que proporciona más control sobre sus respuestas utilizando la «personalidad» que elijas. Solo tienes que introducir mediante el prompt con qué personalidad quieres que actúe y lo hará de forma más eficiente que en los modelos anteriores. Además de estas mejoras, GPT-4 incorpora algunas características llamadas beta, que están en fase experimental: Capacidad de búsqueda: si bien el LLM de ChatGPT-4 todavía está limitado a datos de capacitación hasta septiembre de 2021, se le puede indicar que también busque en internet con Bing. Aun así, esta característica todavía está lejos de ser perfecta; por ejem- 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 45 plo, puede infringir la propiedad intelectual de sitios web. Por este motivo, OpenAI ha desactivado esta funcionalidad hasta que su uso no pueda ser considerado como fraudulento. Complementos (plugins): desarrolladores externos pueden trabajar con las interfaces de programación de aplicaciones proporcionadas por OpenAI para extender y personalizar GPT-4 para sus pro- pias aplicaciones. Por ejemplo, la empresa Wolfram de inteligen- cia computacional tiene uno de los mejores complementos para GPT-4; este plugin, por un lado, tiene el potencial del modelo de lenguaje y, por el otro, el potencial del conocimiento científico que tiene el producto WolframAlpha. También existen complementos para herramientas de producción de contenido, como Canva para realizar presentaciones y comunicaciones más atractivas o incluso para hacer tu itinerario de viaje con el plugin de la empresa Kayak. Otros como Link Reader pueden leer un artículo que este en la web en cualquier formato y elaborar un resumen. Existen muchos otros complementos, ya hay más de 1000 plugins que se pueden ver en la tienda de componentes en la versión ChatGPT plus. No obstante, el modelo GPT-4 sigue teniendo las mismas limi- taciones que los modelos anteriores, aunque se hayan conseguido mejoras significativas. Por ejemplo, en el informe de OpenAI sobre esta nueva versión se indica que GPT-4 tiene hasta un 82 % menos de probabilidad de responder de forma inadecuada o no permiti- da. También ha mejorado en generar respuestas basadas en hechos y evidencias; según los estudios realizados, GPT-4 es un 40 % mejor que GPT-3 en dar respuestas factuales. Así pues, a pesar de usarse el modelo mejorado GPT-4, debemos seguir siendo cuidadosos al utilizar sus resultados generados, especialmente en contextos donde la confiabilidad sea crítica. 46 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 2.6. Otras tecnologías GPT de OpenAI OpenAI no solo utiliza sus modelos basados en GPT para la aplicación ChatGPT, sino que ha desarrollado otras aplicaciones interesantes. Codex: modelo usado por herramientas como Copilot de Github para generar códigos de programación a partir de lenguaje natural. Se trata de un modelo que parte de GPT 3, y que ha sido entre- nado con billones de líneas de código abierto. Funciona muy bien con lenguajes de alto nivel como Python o JavaScript, pero se pue- de usar para generar código en prácticamente cualquier lenguaje. Los modelos más recientes de ChatGPT, como ChatGPT3.5 o ChatGPT4, han incorporado las capacidades de Codex (OpenAI, 2023a). Este modelo resulta muy útil en entornos de programación (IDE) como Visual Studio Code o JetBrains, en los que tiene una visión completa de todo el proyecto y aporta sugerencias en tiempo de programación. Tareas como documentar, testear o reutilizar patrones de programación se vuelven mucho más sencillas y con menos posibilidades de cometer errores para los programadores. DALL·E: herramienta de OpenAI que usa el modelo generativo GPT-3 para generar imágenes a partir de descripciones de texto a partir de un prompt. A diferencia de los modelos previos, DALL·E genera imágenes completamente nuevas. Es capaz de generar imá- genes de alta calidad y resolución a partir de descripciones deta- lladas y complejas. Puede crear imágenes realistas y surrealistas de objetos, animales, escenas e incluso conceptos abstractos, a partir de textos que describan su apariencia. DALL·E aprende a capturar las relaciones entre las palabras y las características visuales co- rrespondientes en las imágenes. Cuando se le da una descripción textual, DALL·E utiliza ese conocimiento aprendido para generar una imagen que se ajuste a la descripción. Aparte de las técnicas de inteligencia artificial, también usa técnicas de generación de imá- genes para producir múltiples versiones de la misma descripción y ofrecer variedad en los resultados. Algunos de los casos de uso de esta aplicación son la creación de contenido visual, la ilustración y 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 47 la generación de ideas en campos como el diseño gráfico. También puede ayudar a artistas y diseñadores a visualizar conceptos antes de crearlos físicamente, o incluso a generar imágenes de objetos que no existen en la realidad. Whisper: sistema de reconocimiento de voz que utiliza técnicas de inteligencia artificial y conjuntos de datos de voz para convertir el habla en texto, lo que le permite aprender las características y patrones del lenguaje hablado. Whisper es capaz de manejar di- versos acentos y estilos de habla. Su uso principal se encuentra en los asistentes virtuales, los servicios de transcripción automática, la subtitulación automática y los sistemas de control por voz. 2.7. Nuevos competidores para ChatGPT: la carrera tecnológica tras de los LLM ChatGPT ha sido el primero en situarse en la carrera de las aplicacio- nes de chatbot basados en modelos LLM, con más de 100 millones de usuarios activos a los dos meses de su lanzamiento. Sin embargo, exis- ten otros competidores que llevan tanto o más tiempo que OpenAI investigando y entrenando modelos LLM y que podrían alcanzar el liderazgo del mercado en cualquier momento. Está claro que las cinco big techs (Apple, Meta, Google, Microsoft y Amazon) son las que par- tían con más ventaja en esta carrera, ya sea por capacidad de cálculo, acceso a grandes cantidades de datos o por la capacidad de adquirir o financiar talento de pequeñas empresas especializadas, como fue el caso de OpenAI, que fue apadrinada económicamente por Microsoft. Así pues, no es de extrañar que Google respondiera, al poco tiem- po de que ChatGPT se hiciera popular, con su propia versión de chatbot, con el nombre de BardAI, el cual ya llevaba tiempo siendo desarrollado. Según los propios responsables de Google, en el momen- to en que ChatGPT se lanzó al mercado, la capacidad de su modelo de lenguaje (llamado en aquel momento LaMDA) era similar al de OpenAI, pero no quisieron precipitarse en su lanzamiento por miedo a una pérdida de reputación de la marca si la aceptación del producto 48 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA no era la deseada. Sin embargo, pronto se dieron cuenta de que la ca- rrera para ver quién desarrollaría el mejor modelo de lenguaje ya había empezado, y no tardaron en lanzar su primer prototipo en el mercado, el cual tuvo algún que otro fallo que la prensa se apresuró en señalar (dio información errónea sobre el James Webb Space Telescope). En marzo de 2023, BardAI se abrió para un público restringido y en mayo se anunció que BardAI ya se integraría con otros productos de Google como puede ser el Gmail, GoogleMaps e incluso el propio buscador Google. De hecho, este parece que será uno de los casos de uso con más potencial de los modelos de lenguaje que están generan- do las big techs. Por otro lado, Microsoft ya ha anunciado que su buscador Bing in- tegrará ChatGPT para mejorar la experiencia de usuario (actualmente ofrece un chat en su web basado en GPT4). En el caso de Amazon, están desarrollando su propio modelo de lenguaje para mejorar el asis- tente personal Alexa. Meta (antiguo Facebook) también ha desarrolla- do su propio modelo, más limitado, pero abierto a investigadores para que se pueda personalizar y usar en cualquier ámbito de la ciencia. Bibliografía Bang, Y., Cahyawijaya, S., Lee, N., Dai, W., Su, D., Wilie, B. y Love- nia, H. (2023). A multitask, multilingual, multimodal evaluation of ChatGPT on reasoning, hallucination, and interactivity. ArXiv Pre- print. https://arxiv.org/abs/2302.04023 Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Jin, Y., Bang, J., Madotto, A. y Fung, P. (2023). Survey of hallucination in natural language generation. ACM Computing Surveys, 55 (12), 1-38. https:// doi.org/https://doi.org/10.1145/3571730 Open AI (2023a). GPT-4 technical report. https://doi.org/10.48550/arX- iv.2303.08774 OpenAI (2023b). API reference: completions. OpenAI. https://platform. openai.com/docs/api-reference/completions 2. INDICACIONES PRÁCTICAS PARA USAR CHATGPT ❚ 49 OpenAI y Shieh, J. (2023). Best practices for prompt engineering with Ope- nAI API. https://help.openai.com/en/articles/6654000-best-practic- es-for-prompt-engineering-with-openai-api Wikipedia (2023). Lista de rectores de la Universidad de Barcelona. https:// es.wikipedia.org/wiki/Anexo:Rectores_de_la_Universidad_de_Barcelona 3. LA TECNOLOGÍA TRAS CHATGPT — Daniel Ortiz — David Buchaca En este capítulo hablaremos de todo lo que rodea a ChatGPT des- de una perspectiva tecnológica. Comenzaremos dando un repaso a conceptos básicos de inteligencia artificial, después hablaremos del modelado de lenguaje y, por último, de los denominados modelos fundacionales y del propio ChatGPT. 3.1. Inteligencia artificial 3.1.1. ¿Qué es la inteligencia artificial? Según la RAE, la inteligencia artificial (IA) es la «disciplina cien- tífica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana, como el aprendizaje o el razonamiento lógico». Dicha definición nos da a entender que esta ciencia se dedica a es- tudiar «operaciones comparables a las que realiza la mente humana», pero pensando un poco en esta definición, se abre un gran abanico de preguntas cómo: ¿Qué operaciones y problemas son estos que realiza la mente humana? ¿Qué es el aprendizaje y el razonamiento lógico? ¿Por qué en la definición se centra en operaciones de la mente huma- na?, ¿no puede un animal actuar de forma inteligente? 51 El precursor de la informática, Alan Turing, en su artículo «Ma- quinaria computacional e inteligencia» (Turing, 1950) se preguntó: ¿Puede una máquina pensar? En dicho artículo el autor argumenta que esta pregunta es peligrosa dado que distintas personas pueden tener juicios distintos sobre qué tareas necesitan «pensar» para ser resueltas. Turing propone el «juego de la imitación» cómo criterio para de- terminar si una máquina puede pensar. En dicha prueba, ahora co- nocida como test de Turing, un juez humano interactúa con dos participantes, uno de ellos es una máquina y el otro es otra persona humana. La prueba consiste en formular preguntas a ambos partici- pantes sin saber quién es quién. Si el juez no puede distinguir entre la respuesta de la máquina y la respuesta humana, se puede considerar que la máquina ha pasado la prueba y tiene inteligencia similar a la humana. Para no sesgar al juez con información no relacionada con la inteligencia, como la apariencia física o el tono de voz, Turing pro- pone que la interacción se haga con los sujetos físicamente separados y conversando por escrito. Aunque el test de Turing se ha convertido en una prueba clásica para evaluar sistemas inteligentes, tiene sus limitaciones como método para evaluar la inteligencia. Una limitación del test es que se hace mediante el lenguaje huma- no escrito, por lo que no puede evaluar el comportamiento inteligente de agentes que no pueden escribir. Otra limitación es que pasar el test se corresponde con la capacidad de engañar a un evaluador huma- no. Sin embargo, un algoritmo se puede entrenar con el objetivo de aprender a engañar a un juez, pero eso no necesariamente requiere una verdadera capacidad de razonamiento y comportamiento inte- ligente. De hecho, un algoritmo puede aprender que dar respuestas erróneas o muy ambiguas puede ayudar a pasar el test y maximizar la probabilidad de engañar al juez. 52 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA 3.1.2. La inteligencia artificial y sus ramas La IA es el estudio y desarrollo de sistemas informáticos con ca- pacidad de realizar tareas que normalmente requerirían capacidades atribuidas a la inteligencia humana. Esta disciplina abarca una amplia gama de ramas de campos: Aprendizaje automático (machine learning): rama de la IA que se enfoca en crear algoritmos y modelos con capacidad de aprender de manera autónoma a partir de datos que se les presenta. Procesamiento del lenguaje natural (natural language processing): se centra en la creación de algoritmos que permiten a las máqui- nas interpretar, interaccionar y resolver problemas con lenguaje humano. Visión por computador (computer vision): se centra en el desarrollo de algoritmos que permiten interpretar, interaccionar y resolver problemas con imágenes y vídeo. Computación evolutiva (evolutionary computation): se centra en el desarrollo de algoritmos inspirados en principios de la evolución y selección natural. Este tipo de algoritmos simulan procesos evolu- tivos, como la selección natural, la reproducción y la mutación para buscar soluciones óptimas o aproximadas a un problema dado. Robótica: es el estudio y desarrollo de sistemas que pueden inte- ractuar sobre un entorno físico real de manera autónoma. Sistemas multiagente (multiagent systems): se centran en crear siste- mas de programas (llamados agentes) que cooperan para conseguir un objetivo común. Lógica difusa (fuzzy logic): es una rama que estudia el razonamien- to fuera del patrón binario (verdadero/falso). Es una rama muy usada en electrodomésticos, que tienen que operar en condicio- nes «no binarias». Por ejemplo, un lavavajillas puede tener platos «muy sucios», «sucios» o «pocos sucios», y debe poder adaptar su comportamiento en función de su entrada (el estado de los platos). 3. LA TECNOLOGÍA TRAS CHATGPT ❚ 53 Dada la basta cantidad de material existente en cada una de las ra- mas anteriormente mencionadas, en este capítulo nos centraremos en introducir al lector solo los elementos esenciales del aprendizaje automático y el procesamiento del lenguaje natural. Estos son dos pilares fundamentales para entender el apogeo de la IA en los últimos años, pero en ningún caso cubren la amplia variedad de ideas, métodos y algoritmos en la IA. 3.1.3. Aprendizaje automático El aprendizaje automático (machine learning), como su nombre indi- ca, es una ciencia que se centra en desarrollar modelos y algoritmos que aprendan a través de la experiencia, sin ser explícitamente progra- mados para realizar una tarea. Para entender un poco más sobre esta ciencia, necesitamos entender qué es un modelo y qué quiere decir que el modelo pueda aprender a través de la experiencia. En el contexto del aprendizaje automático, y explicado de forma simplificada y abstracta, un modelo es una función que dada una en- trada produce una salida. En muchos casos no es obvio cómo definir una función que pueda llevar a cabo una tarea, y lo que queremos hacer es que el modelo modifique parte de su estructura interna (sus parámetros) para solventar un problema. Vamos a empezar explicando con un ejemplo qué podría ser un modelo y por qué es básico tener la capacidad de aprendizaje. Imagi- nemos que trabajamos para un banco en el departamento de atención al cliente. En nuestro departamento de atención al cliente nos llegan correos electrónicos de clientes y parte de nuestro trabajo consiste en reenviar dicho correo al departamento más indicado para responder. Para simplificar la explicación, supongamos que solo existen dos de- partamentos: el de hipotecas y el de inversiones. Como queremos pa- sar menos tiempo reenviando correos electrónicos, nos gustaría crear un algoritmo que detecte si un correo electrónico debe ser enviado al departamento de hipotecas, al departamento de inversiones o debe ser descartado como correo basura. 54 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA Una posible solución para resolver el problema sería crear un mo- delo que pudiese hacer el trabajo por nosotros. La entrada del modelo serían los correos electrónicos, y la salida sería el departamento donde enviar el correo. Cómo modelo simple, podríamos pensar que, en realidad, no necesitamos leer todo el correo, sino que es suficiente «leer en diagonal» y ver qué palabras se usan más en el texto para tener una idea sobre qué departamento se debe seleccionar. Con esa idea en mente, se podría crear un conjunto de palabras relevantes para cada departamento y una solución con dichas palabras. ¿Pero cómo podríamos determinar esas palabras? Pues leyendo un conjun- to de correos que previamente ya han sido enviados por atención al cliente a uno de los departamentos y ver qué palabras se relacionan más con cada departamento en los correos. Una vez tenemos esas palabras, podríamos crear un programa que, dado un correo nuevo, cuente si tiene más palabras relacionadas con hipoteca, más palabras relacionadas con inversión o con correo basura, y asignar el correo al ganador. En esta propuesta, el modelo sería una caja con las palabras que hemos escogido, dicha caja tendría una función interna que dado un correo sumaría tres cantidades: cuántas veces aparecen palabras relacionadas con hipoteca, cuántas veces aparecen palabras relacio- nadas con inversiones y cuántas veces aparecen palabras relacionadas con correo basura. Luego el modelo asignará una puntuación a cada posible salida (hipoteca, inversión, correo basura) y escogerá la salida con mayor puntuación. La solución anterior tiene varios problemas. El primer problema es que presupone que una persona ha leído los correos de cada posible salida y ha extraído las palabras clave para cada una de ellas. Esto ya es mucho suponer, dado que en un banco pueden existir miles de correos previamente clasificados. El segundo problema es que asume que las palabras tienen la misma importancia para decidir la salida. Esto es así porque para determinar la salida solo tenemos que sumar el número de ocurrencias de las palabras en el texto. Claramente, esta suposición es poco razonable. Existen palabras como «hipoteca», «amortización», «intereses», «cancelación» o «contrato» que deberían puntuar más para determinar que un correo se debe enviar al de- 3. LA TECNOLOGÍA TRAS CHATGPT ❚ 55 partamento de hipotecas que otras palabras como «euros», «banco», «capital» o «acciones». Por lo tanto, es razonable asignar un peso por palabra y usar una suma ponderada para calcular la puntuación de cada posible salida del modelo. ¿Pero cómo puede una persona de- terminar la importancia de cada palabra? Incluso si lo quisiéramos programar, ¿cómo construiríamos un algoritmo para calcular el peso asociado a cada palabra? Solventar este problema es precisamente el objetivo del proceso de aprendizaje. Una pregunta natural que nos podemos plantear ante el problema anterior es si es viable usar la fuerza bruta de un ordenador moder- no para testear una gran combinación de parámetros y guardar la mejor combinación. Dado que tenemos maquinas muy potentes, ¿es realmente necesario tener un proceso de aprendizaje? Pues vamos a ver que realmente no es razonable resolver el problema planteado con fuerza bruta. En nuestro caso anterior, imaginemos que tene- mos solo 100 palabras para el modelo. Imaginemos que solo vamos a considerar parámetros con valores enteros entre -10 y 10. Esto son 21 posibles valores para cada palabra, que crean un total de 21 elevado a 100 combinaciones. Incluso si un ordenador moderno de 5 GHz que puede hacer 500 millones de operaciones por segundo necesita- ría 21ˆ100/500 000 000 segundos para completar esta tarea. Si uno hace las cuentas, esto son unos 3.3e123 segundos que son unos 1e116 años, que son ¡muchos trillones de años! Por lo tanto, necesitamos una solución que podamos ejecutar en un tiempo razonable para la vida de un humano. Una de las soluciones más comunes para este tipo de problemas consiste en un método iterativo que empiece con una solución alea- toria y la pueda mejorar en cada iteración. En nuestro caso quere- mos testear un conjunto de parámetros en cada intento, y evaluar si estamos cerca o lejos de la respuesta correcta. Con esta evaluación, un algoritmo de aprendizaje puede definir una retroalimentación y modificar los parámetros del modelo. Esta modificación es natural hacerla proporcional a cómo de errónea es una salida; si la respuesta es la esperada, modificamos poco (o no modificamos) los parámetros (si algo funciona no hace falta cambiarlo). Si la respuesta no es correcta, 56 ❚ CHATGPT Y EDUCACIÓN UNIVERSITARIA entonces vamos a modificar los parámetros, y como norma general vamos a modificar más los que más afecten a la salida. Si un pará- metro tiene mucha influencia en la salida del modelo y el modelo se equivoca por culpa de ese parámetro, vamos a penalizar su influencia más que en otro parámetro que no influencie mucho al comporta- miento del modelo. El proceso de aprendizaje, también llamado entrenamiento, consiste en pasar ejemplos (también llamados datos o datos de entrenamiento) al modelo y que este modifique sus parámetros para iterativamente mejorar su capacidad de asignar correctamente entradas a salidas. Usando una nomenclatura bastante estándar en el campo, los datos de entrenamiento se denotarían cómo {( x1, y1 ), ( x2, y2 ),... , ( xn , yn )} donde las xi hacen referencia a las entradas del sistema y las yi hacen referencia a las salidas, que se llaman «clases». En el ejemplo anterior, los datos de entrenamiento serían una co- lección de correo electrónicos ( x1, x2,... , xn ) y sus clases esperadas ( y1, y2,... , yn ). Por lo tanto, cada xi sería un correo electrónico y cada yi sería un valor de 1 a 3 que estaría asignado a cada posible salida del sistema (1 = hipoteca, 2 = inversión, 3 = correo basura). Tipos de aprendizaje automático Existen varios tipos de aprendizaje automático; cada uno tiene sus propias características y se aplica en contextos y problemas distintos. Aquí destacamos los más importantes: Aprendizaje supervisado: en el aprendizaje supervisado, el conjun- to de entrenamiento se proporciona etiquetado, es decir, se propor- cionan los datos de entrada y de salida. El proceso de aprendizaje del ejemplo anterior, donde se clasifican correos electrónicos, pre- supone que los datos de entrenamiento son parejas ( xi , yi ) que de- notan la entrada y la salida del sistema. En este caso, se asume que, para poder proceder al entrenamiento, se tiene un conjunto de entrenamiento que ya ha sido etiquetado por alguien. Un anotador nos da las salidas yi de muchos ejemplos y el objetivo consiste en crear un sistema que, idealmente, pueda sustituir al anotador. En 3. LA TECNOLOGÍA TRAS CHATGPT ❚ 57 este caso, el proceso de aprendizaje se llama supervisado, ya que existe un supervisor que nos da las yi. Aprendizaje no supervisado: en el aprendizaje no supervisado, el conjunto de entrenamiento se proporciona sin etiquetar, es decir, se proporcionan los datos de entrada, pero no de salida. El algo- ritmo tiene que encontrar patrones y estructuras en los datos sin ninguna guía externa. Este tipo de aprendizaje se usa mayorita- riamente para aprender relaciones entre datos similares. Con ello se puede segmentar los datos en grupos coherentes o aprender la probabilidad de subconjuntos de los datos de entrenamiento. Una aplicación común de este tipo de aprendizaje es agrupar noticias de un medio de comunicación en grupos de contenido similar para recomendar a un lector noticias