Cuenta la leyenda que el sabio Anand (nombre sugerido por ChatGPT, a quien yo llamo Skippy ^2) ayudó al rey Devendra (nombre también propuesto por Skippy) a resolver un problema difícil. En agradecimiento Devendra ofreció a Anand el pago que deseara. Anand pidió que el rey le diera un grano de arroz por la primera casilla de un tablero de ajedrez y que duplicara la cantidad en cada casilla sucesiva. El rey aceptó, pero después de un buen rato los matemáticos del rey le informaron que no había suficiente trigo en todo el reino para pagar lo que Anand pedía.
Gordon Moore, uno de los fundadores de Intel, observó en 1965 que la capacidad de integrar transistores en un chip se duplica cada 18 meses. Es decir, siguiendo una progresión exponencial. Esta observación se convirtió en un predictor del comportamiento de la industria que se ha ido cumpliendo hasta la muerte de Moore a principios de 2023.
Parece imposible que algo se duplique 64 veces, pero desde la observación de Moore la potencia de los procesadores se ha duplicado 43 veces. Pero aún hay más: hace 20 años el inventor y futurista Ray Kurzweil, calculó la capacidad de computación que uno ha podido adquirir por 1000 dólares ajustados por inflación durante todo el siglo XX. El resultado indicaba un crecimiento exponencial comenzando quizás antes de principios de siglo XX, si tenemos en cuenta los trabajos de Blaise Pascal, Charles Babbage y Ada de Lovelace a principios de siglo XIX. Lo que sí podemos decir es que durante el S.XX la capacidad de computación que podemos comprar a un precio determinado se ha duplicado, independientemente de la tecnología empleada, 66 veces durante el siglo XX. Más que casillas en un tablero de ajedrez. Y este comportamiento no se ha detenido en los 23 años que llevamos de siglo XXI.
Tanto el sabio Anand como el rey Devendra estarían boquiabiertos. Pero la pregunta que se haría el sabio Anand es: ¿qué pasa cuando algo se duplica tantas veces y qué pasa cuando esto afecta a tantas cosas?
Una posible respuesta la da Peter Diamandis, emprendedor y futurista greco-estadounidense, quien propone en su libro “Abundance: The Future Is Better Than You Think” (^1) que cuando algo se digitaliza se convierte en conectado con esta mejora exponencial. Esto al principio no es gran cosa (es engañoso) porque al principio las curvas exponenciales son bastante planas, pero de repente hacen un codo hacia arriba y crecen súbitamente. Es entonces cuando la digitalización se vuelve disruptiva. Y esta disrupción implica cambios en la manera que se hacen las cosas, en los artefactos que usamos (que se hacen más pequeños o desaparecen), en los trabajos que tenemos que hacer las personas - la desaparición de algunos y la creación de otros -, y en el valor de las cosas: algunas cosas dejan de tener valor porque se vuelven abundantes y otras cosas se vuelven muy valiosas.
Le podéis preguntar a Skippy por las 6 D’s de Diamandis y os lo explicará muy bien.
Otra posible respuesta la dio Alvin Toffler, en un ensayo en la prestigiosa revista Playboy - que no es Open Access ni JCR, pero seguro que habéis oído hablar de ella - en 1970 y posteriormente en el libro del mismo título: “Future shock” ^3 . El shock del futuro. Toffler hace la observación de que las transformaciones causadas por la innovación tecnológica - ya en 1970 - cada vez son más profundas y cada vez se suceden más de prisa, se aceleran. De manera que el mundo cambia de manera radical varias veces durante el tiempo de vida de una persona. Y esto nos puede dejar perplejos, en el shock del futuro.
Si Toffler ya observaba el shock del futuro hace 53 años, ahora es algo evidente en nuestro día a día. Pensemos que hace 25 años no había web - estaba, pero solo éramos 4 friquis -, hace 15 años no había teléfonos móviles conectados a internet - estaban, pero solo teníamos 4 friquis -, hace 6 meses no había modelos generativos que parecen Inteligencias artificiales. Bueno, estaban, pero solo jugábamos 4 friquis.
El 30 de noviembre de 2022 se puso en marcha ChatGPT, otro Chatbot en internet como habíamos visto muchos otros, que permitía hablar con el modelo generativo GPT-3 (Generative Pretrained Transformer) desarrollado por la organización sin ánimo de lucro OpenAI (que se lo han repensado y ahora sí que quieren hacer beneficios). En 5 días ChatGPT llegó a los 5 millones de usuarios, en dos meses había llegado a los 100 millones de usuarios. ChatGPT ya puede entrar en el libro Guinness de los récords como el producto de expansión más rápida hasta el momento. El mes de enero de 2023 ChatGPT era tan popular en las búsquedas de Google como la Shakira, ahora - en mayo de 2023 - es difícil encontrar un término más popular por todas partes.
Por algún motivo ChatGPT es lo suficientemente bueno para que todos los que lo usamos veamos que esto es algo diferente. Un Chatbot al que vale la pena prestar atención. Igual que en su día los usuarios de internet que probaban el nuevo buscador Google se daban cuenta de que se trataba de algo diferente; diez veces mejor que cualquier otra cosa, les gusta decir a los creadores de Google.
ChatGPT marca el inicio del codo en la progresión de una nueva herramienta: los modelos generativos basados en redes neuronales, una tecnología del campo de investigación de la inteligencia artificial (IA) que lleva casi 70 años corriendo. No olvidemos que, tal como decía John McCarthy - uno de los padres de la disciplina - cuando una tecnología funciona ya no la llamamos IA, sino otra cosa. Los objetivos de la IA se mueven más allá, quizás ahora ya apunten hacia el objetivo no alcanzado de las Inteligencias artificiales generales (IAG) equivalentes a la inteligencia humana. Pero tranquilos que aún no estamos ahí, ni estaremos pronto.
No obstante los modelos generativos ahora se han convertido en una tecnología lo suficientemente buena para convertirse en la base de servicios para el público general. Los sistemas informáticos ahora entienden el lenguaje con el que nos comunicamos los humanos - cualquier idioma o casi cualquier - comienzan a entender contexto y sutilezas culturales, y son capaces de responder dando información a menudo acertada. Cada vez más acertada.
Últimamente, he visto fotografías de hemeroteca que muestran profesores de matemáticas manifestándose en la calle protestando por el uso de las calculadoras en los años 70. La negación o la prohibición es una de las primeras respuestas que podemos esperar, aunque sirvan de poco.
Las calculadoras eran y son fantásticas, permiten hacer cálculos aritméticos, acceder a tablas de logaritmos y trigonométricas, e incluso ejecutar algoritmos. Con una calculadora somos capaces de resolver problemas muy complejos, rápido y con precisión. Seguramente problemas que no podríamos abordar sin ellas. Pero la disponibilidad de las calculadoras puede causar que no aprendamos a hacer estas operaciones sin ellas. O que olvidemos cómo hacerlas. “Use it or lose it” dicen.
ChatGPT y la gran familia de modelos generativos que viene - id a huggingface.co donde encontraréis la principal comunidad de aprendizaje sobre modelos generativos y transformadores y veréis qué se cuece allí - puede hacer muchas cosas por nosotros: Ayudarnos a traducir textos, resumir documentos, preparar presentaciones, revisar gramática y estilo, responder preguntas que antes hubiéramos hecho a una enciclopedia, un experto o al buscador de internet… Y aún más, si tenemos suerte y tenemos habilidad para dar las indicaciones (lo que llaman “prompt”, pero son “indicaciones”) pueden ayudar a resolver problemas y conectarse con otros programas para conseguir aún más cosas. Pueden generar código para nuestros programas, ayudarnos a mejorar el estilo, encontrar errores y documentarlos. Y muchas otras cosas. Que como las calculadoras aumentarán nuestras capacidades, pero tendremos que vigilar porque usando estas herramientas podemos perder la habilidad de hacer las cosas sin ellas.
Los modelos IA Generativos tienen una propiedad muy interesante: a veces alucinan. En el contexto de IA las alucinaciones son resultados extraños - erróneos, seguro - que dan a veces, de manera imprevista e impredecible, estos sistemas. De manera que siempre que usamos uno de estos modelos tenemos que pensar que quizás el resultado es preciso o quizás es una alucinación.
Cuando una calculadora da un resultado, ¿tenemos la capacidad de comprobar si el resultado es correcto? Ciertamente, asumimos el riesgo y la responsabilidad de aceptar el resultado de una calculadora - o una hoja de cálculo o el SAP - cada vez que los usamos para nuestro día a día. Pero las calculadoras son fiables, están construidas con sistemas deterministas que siempre dan el mismo resultado. Y si fallan, podemos buscar dónde está el error y corregir el sistema.
Con los modelos de redes neuronales esto no es así. Sabemos que funcionan de forma fenomenológica: funcionan porque funcionan y observamos un comportamiento. Nada nos garantiza que continuarán funcionando así o que alucinarán o nos explicará por qué funcionan como lo hacen. Pensad en esto cuando, muy pronto, más y más sistemas estén controlados por estos modelos.
Como docentes y educadores nos surge el dilema. ¿Debemos usar estas herramientas o no debemos usarlas en nuestras asignaturas? Y si las debemos usar: ¿cómo las debemos usar? Independientemente de lo que decidamos nuestros estudiantes ya disponen de estas herramientas, saben quién es la Shakira y también qué es ChatGPT.
Los jugadores expertos del videojuego de estrategia en tiempo real Starcraft explican que para ganar se ha de jugar en Macro y en Micro. Hay que tener una estrategia Macro: dominar todo el mapa, tener una estrategia para ganar la partida a largo plazo. Pero hay que aplicar táctica y operaciones en Micro, estar atento y mover tus unidades allí donde hay enfrentamientos. Y saber cuándo has de prestar atención a Macro o a Micro. Sin dominar el Macro-Micro no se puede ganar al Starcraft.
De la misma manera cada asignatura tiene un contexto Macro: ¿Cuáles son los objetivos de la asignatura? ¿Los profesionales que formamos, usarán herramientas IA generativas en su día a día? ¿Cómo afecta esto a nuestros objetivos? Y cómo afectará en los meses y años venideros, dado el ritmo de avance chocante de la tecnología?
Pero también hay un contexto Micro: ¿Cómo enseñamos? ¿Prohibimos la IA en el aula o asumimos que en cualquier momento nuestros estudiantes pueden tener abierta la ventana de ChatGPT o alguna otra herramienta? Y los proyectos? Y los ejercicios que deben hacer en casa? ¿Cómo los evaluamos sabiendo que disponen de herramientas IA que son imposibles o muy difíciles de detectar?
Cada docente, cada equipo de docentes en cada asignatura tenemos la oportunidad y el reto de repensar nuestra estrategia y práctica docente. Y no lo podemos ignorar.
^1 (Diamandis, P. H., & Kotler, S. (2012). Abundance: The Future Is Better Than You Think. Free Press.” ^2 Skippy es el nombre de la IA alienígena que co-protagoniza la serie de novelas de ciencia ficción Expeditionary Force del escritor Craig Alanson. ^3 Toffler, Alvin. (1970). Future Shock. New York: Random House.
