Marc Alier (Ludo) - Home Page

Pàgina personal i Calaix Desastre

I la IA va venir a l'aula

Posted at — Apr 26, 2023

Diu la llegenda que el savi Anand (nom suggerit per ChatGPT, a qui jo anomeno Skippy ^2) va ajudar al rei Devendra (nom també proposat per Skippy) a resoldre un problema difícil. En agraïment Devendra va oferir a Anand el pagament que desitgés. Anand va demanar que el rei li donés un gra d’arròs pel primer quadre d’un tauler d’escacs i que dupliqués la quantitat en cada quadre successiu. El rei va acceptar, però després d’una bona estona els matemàtics del rei el van informar que no hi havia prou blat a tot el regne per pagar el que Anand demanava.

Gordon Moore, un dels fundadors d’Intel, va observar el 1965 que la capacitat d’integrar transistors en un xip es dobla cada 18 mesos. És a dir, seguint una progressió exponencial. Aquesta observació va esdevenir un predictor del comportament de la indústria que s’ha anat complint fins a la mort de Moore a principis de 2023.

Sembla impossible que quelcom es dobli 64 vegades, però des de l’observació de Moore la potència dels processadors s’ha doblat 43 vegades. Però encara n’hi ha més: fa 20 anys l’inventor i futurista Ray Kurzweil, va calcular la capacitat de computació que hom ha pogut adquirir per 1000 dollars ajustats per inflació durant tot el segle XX. El resultat indicava un creixement exponencial començant potser abans de principis de segle XX, si tenim en compte els treballs de Blaise Pascal, Charles Babbage i Ada de Lovelace a principis de segle XIX. El que sí podem dir és que durant el S.XX la capacitat de computació que podem comprar a un preu determinat s’ha doblat, independentment de la tecnologia emprada, 66 vegades durant el segle XX. Més que quadres en un taulell l’escacs. I aquest comportament no s’ha aturat els 23 anys que portem de segle XXI.

Tant el savi Anand com el rei Devendra estarien bocabadats. Però la pregunta que es faria el savi Anand és: què passa quan alguna cosa es duplica tantes vegades i que passa quan això afecta tantes coses?

Una possible resposta la dona Peter Diamandis, emprenedor i futurista grec-americà, qui proposa al seu llibre “Abundace de future is better than you think “(^1) que quan quelcom es digitalitza esdevé connectat amb aquesta millora exponencial. Això al principi no és gran cosa (és deceptiu) perquè al principi les corbes exponencials són prou planes, però de sobte fan un colze cap amunt i creixen sobtadament. És llavors quan la digitalització es torna disruptiva. I aquesta disrupció implica canvis en la manera que es fan les coses, en els artefactes que fem servir (que es fan més petits o desapareixen), en les feines que hem de fer les persones - la desaparició d’algunes i la creació de les altres -, i en el valor de les coses: algunes coses deixen de tenir valor perquè es tornen abundants i altres coses es tornen molt valuoses.

Li podeu preguntar a Skippy per les 6 D’s de Diamandis i us ho explicarà molt bé.

Un altre possible resposta la va donar Alvin Toffler, en un assaig a la prestigiosa revista Playboy - que no és Open Access ni JCR, però segur que n’heu sentit a parlar - el 1970 i posteriorment en el llibre del mateix títol: “Future shock” ^3 . El xoc del futur. Toffler fa l’observació que les transformacions causades per la innovació tecnològica - ja el 1970 - cada cop son més profundes i cada es succeeixen més de pressa, s’acceleren. De manera que el món canvia de manera radical diverses vegades durant el temps de vida d’una persona. I això ens pot deixar perplexos, en el xoc del futur.

Si Toffler ja observava el xoc del futur fa 53 anys, ara és quelcom evident en el nostre dia a dia. Pensem que fa 25 anys no hi havia web - hi era, però només hi érem 4 friquis -, fa 15 anys no hi havia telèfons mòbils connectats a internet - hi eren, però només en teníem 4 friquis -, fa 6 mesos no hi havia models generatius que semblen Intel·ligències artificials. Bé, hi eren, però només hi jugàvem 4 friquis.

El 30 de novembre de 2022 es va posar en marxa ChatGPT, un altre Xatbot a internet com n’havíem vist molts altres, que permetia parlar amb el model generatiu GPT-3 (Generative Pretrained Transformer) desenvolupat per l’organització sense ànim de benefici OpenAi (que s’ho han repensat i ara sí que volen fer beneficis). En 5 dies ChatGPT va arribar als 5 milions d’usuaris, en dos mesos havia arribat als 100 milions d’usuaris. ChatGPT ja pot entrar al llibre Guiness dels records com el producte d’expansió més ràpida fins al moment. El mes de gener de 2023 ChatGPT era tan popular a les cerques de Google com la Shakira, ara - a maig de 2023 - és difícil trobar un terme més popular arreu.

Per algun motiu ChatGPT és prou bo perquè tots els que el fem servir veiem que això és quelcom diferent. Un Xatbot al qual val la pena parar atenció. Igual que en el seu dia els usuaris d’internet que provaven el nou cercador Google s’adonaven que es tractava de quelcom diferent; deu vegades millor que cap altra cosa, els agrada dir als creadors de Google.

ChatGPT marca l’inici del colze a la progressió d’una nova eina: els models generatius basats en xarxes neuronals, una tecnologia del camp de recerca de la intel·ligència artificial (IA) que fa gairebé 70 anys que corre. No oblidem que, tal com deia John Mc Carty - un dels pares de la disciplina - quan una tecnologia funciona ja no l’anomenem IA, sinó una altra cosa. Els objectius de la IA es mouen més enllà, potser ara ja apuntaran cap a l’objectiu no assolit de les Intel·ligències artificials generals (IAG) equivalents a la intel·ligència humana. Però tranquils que encara no hi som, ni hi serem aviat.

No obstant els models generatius ara han esdevingut una tecnologia prou bona per a esdevenir la base de serveis per al públic general. Els sistemes informàtics ara entenen el llenguatge amb què ens comuniquem els humans- qualsevol idioma o gairebé qualsevol - comencen a entendre context i subtileses culturals, i són capaços de respondre donant informació sovint encertada. Cada cop més encertada.

Darrerament, he vist fotografies d’hemeroteca que mostren professors de matemàtiques manifestant-se pel carrer protestant per l’ús de les calculadores els anys 70. La negació o la prohibició és una de les primeres respostes que podem esperar, malgrat que serveixin de poc. 

Les calculadores eren i són fantàstiques, permeten fer càlculs aritmètics, accedir a taules de logaritmes i trigonomètriques, i fins i tot executar algorismes. Amb una calculadora som capaços de resoldre problemes molt complexos, de pressa i amb precisió. Segurament problemes que no podríem abordar sense. Però la disponibilitat de les calculadores pot causar que no aprenem a fer aquestes operacions sense elles. O que oblidem com fer-les. “Use it or lose it” diuen.

ChatGPT i la gran família de models generatius que ve - aneu a huggingface.co on trobareu la principal comunitat d’aprenentatge sobre models generatius i transformadors i veureu què s’hi cou - pot fer moltes coses per nosaltres: Ajudar-nos a traduir textos, resumir documents, preparar presentacions, revisar gramàtica i estil, respondre preguntes que abans haguéssim fet a una enciclopèdia, un expert o al cercador d’internet… I encara més, si tenim sort i tenim traça en donar les indicacions (allò que en diuen “prompt”, però són “indicacions”) poden ajudar a resoldre problemes i connectar-se amb altres programes per aconseguir encara més coses. Poden generar codi pels nostres programes, ajudar-nos a millorar l’estil, trobar errors i documentar-los. I moltes altres coses. Que com les calculadores augmentaran les nostres capacitats, però haurem de vigilar perquè fent servir aquestes eines podem perdre l’habilitat de fer les coses sense elles.

Els models IA Generatius tenen una propietat molt interessant: de vegades al·lucinen. En el context d’IA les al·lucinacions són resultats estranys - erronis, ben segur - que donen de vegades, de manera imprevista i imprevisible, aquests sistemes. De manera que sempre que fem servir un d’aquests models hem de pensar que potser el resultat és acurat o potser és una al·lucinació.

Quan una calculadora dona un resultat, tenim la capacitat de comprovar si el resultat és correcte? Certament, assolim el risc i la responsabilitat d’acceptar el resultat d’una calculadora - o un full de càlcul o el SAP - cada cop que els fem servir per al nostre dia a dia. Però les calculadores són fiables, estan construïdes amb sistemes deterministes que sempre donen el mateix resultat. I si fallen, podem buscar on és l’error i corregir el sistema.

Amb els models de xarxes neuronals això no és així. Sabem que funcionen de forma fenomenològica: funcionen perquè funcionen i n’observem un comportament. Res no ens garanteix que continuaran funcionant així o que al·lucinaran o ens explicarà per què funcionen com ho fan. Penseu en això quan, ben aviat, més i més sistemes estiguin controlats per aquests models.

Com a docents i educadors ens sorgeix el dilema. Hem de fer servir aquestes eines o no les hem de fer servir a les nostres assignatures? I si les hem de fer servir: com les hem de fer servir? Independentment del que decidim els nostres estudiants ja disposen d’aquestes eines, saben qui és la Shakira i també què és ChatGPT.

Els jugadors experts del videojoc d’estratègia en temps real Starcraft expliquen que per guanyar s’ha de jugar en Macro i en Micro. Cal tenir una estratègia Macro: dominar tot el mapa, tenir una estratègia per guanyar la partida a llarg termini. Però cal aplicar tàctica i operacions en Micro, estar atent i moure les teves unitats allà on hi ha enfrontaments. I saber quan has de parar atenció a Macro o a Micro. Sense dominar el Macro-Micro no es pot guanyar a l’Starcraft.

De la mateixa manera cada assignatura té un context Macro: Quins són els objectius de l’assignatura? Els professionals que formem, faran servir eines IA generatives en el seu dia a dia? Com afecta això als nostres objectius? I com afectarà en els mesos i anys vinents, donat el ritme d’avançament xocant de la tecnologia?

Però també i hi ha un context Micro: Com ensenyem? Prohibim la IA a l’aula o assumim que en qualsevol moment els nostres estudiants poden tenir oberta la finestra de ChatGTP o alguna altra eina? I els projectes? I els exercicis que han de fer a casa? Com els avaluem sabent que disposen d’eines IA que són impossibles o molt difícils de detectar?

Cada docent, cada equip de docents a cada assignatura tenim l’oportunitat i el repte de repensar la nostra estratègia i pràctica docent. I no ho podem ignorar.

^1 (Diamandis, P. H., & Kotler, S. (2012). Abundance: The Future Is Better Than You Think. Free Press.” ^2 Skippy és el nom de la IA alienigena que co-protagonitza la sèrie de noveles de ciència ficció Expeditionary Force de l’escriptor Craig Alanson. ^3 Toffler, Alvin. (1970). Future Shock. New York: Random House.