Taula de continguts#
- Contingut generat per IA
- Contingut de cercadors o bases de dades
- Gestionar les al·lucinacions
- Estratègies pràctiques i casos d’ús de xatbots com ChatGTP
- Posant el context en context.
Els models de llenguatge grans (LLM) com ChatGPT són una nova família de tecnologies amb molt potencial, però també amb reptes propis. Cada cop fem servir més aquestes eines d’IA per a tot: des de preguntes senzilles fins a generar codi complex. Així que val la pena preguntar-se: realment entenem com treure’n el màxim rendiment?
En aquesta entrada repassarem algunes bones pràctiques clau per fer servir LLM. Mirarem la diferència entre contingut generat per IA i informació procedent de bases de dades o cercadors. També parlarem del problema de les “al·lucinacions”, quan el model et dona informació incorrecta o enganyosa. I explicarem per què la llengua amb què formules les preguntes influeix en la qualitat de les respostes.
Tant si només tens curiositat com si penses integrar LLM als teus projectes, aquesta guia pretén ajudar-te a usar aquestes eines de manera més efectiva.
D’on treu les respostes el ChatGTP#
Contingut generat per IA#
Quan fas una pregunta a un model de llenguatge gran com ChatGPT, genera una resposta basada en un conjunt de dades immens amb què s’ha entrenat. Aquest conjunt inclou una gran varietat de fonts, com llocs web, llibres i articles. Però és important saber que aquests models no poden accedir a informació en temps real o actualitzada. El que obtens es basa en el que el model ha après fins a un moment determinat.
A més, cal tenir present que la informació, tot i que sovint és acurada, es genera de manera estocàstica o aleatòria. Això vol dir que la possibilitat de fallada o error sempre hi és. És com una salsa secreta que a vegades dona sabor i d’altres et pot espatllar el plat.
Contingut de cercadors o bases de dades#
En contrast amb el contingut generat per IA, la informació de cercadors, bases de dades o sistemes especialitzats com Wolfram Alpha prové de fonts factuals i sovint a temps real. Aquests plataformes solen oferir informació revisada per parells o verificada. A diferència dels models de llenguatge grans, et poden proporcionar les dades més recents disponibles, sigui l’última actualitat, recerca científica o dades estadístiques.
Implicacions
Entendre la diferència entre aquests dos tipus de contingut és crucial. Si busques informació actualitzada o altament factual, confiar només en un model de llenguatge gran potser no és la millor opció. Tot i que aquests models són increïblement versàtils i et donen respostes ràpides, no poden substituir la profunditat i la fiabilitat de la informació d’una base de dades o un cercador especialitzat. Ara bé, cal tenir en compte que accedir a aquestes fonts especialitzades sovint requereix habilitats tècniques, com entendre interfícies d’usuari específiques o llenguatges de programació. En canvi, els models de llenguatge grans ofereixen la comoditat d’obtenir informació a través de consultes senzilles en llenguatge natural. Saber quan fer servir cada opció t’ajudarà a aconseguir informació més acurada i fiable, sense perdre de vista la facilitat d’accés.
Gestionar les al·lucinacions#
Què són les al·lucinacions?#
En el context dels models de llenguatge grans (LLM) com ChatGPT, les al·lucinacions fan referència a la generació d’informació inexacta, exagerada o directament falsa. Per exemple, se sap que ChatGPT ha inventat respostes versemblants amb cites falses, fent que els usuaris es preguntessin si no havien topat amb un fenomen real. En alguns casos, fins i tot ha fabricat xifres financeres en notícies o ha generat jurisprudència inexistent en escrits legals.
Les al·lucinacions sovint es produeixen per limitacions del conjunt d’entrenament o de la comprensió del context per part del model. El model no pot verificar la informació que genera; simplement produeix respostes basades en patrons de les dades amb què s’ha entrenat. Aquesta naturalesa estocàstica dels LLM implica que l’atzar i la possibilitat de fallada absoluta sempre hi són.
Estratègies per mitigar les al·lucinacions#
- Ser conscient de la possible invenció: El primer pas és assumir que els LLM poden inventar contingut. Aquesta consciència et farà més crític amb les respostes que reps.
- Avalua la teva pròpia expertesa: La teva capacitat per jutjar la qualitat de la informació depèn del teu nivell de coneixement sobre el tema. Si hi tens experiència, detectaràs millor les inexactituds.
- Avaluació crítica i estratègia de validació: Avalua sempre la informació de manera crítica. Tingues una estratègia de validació: contrastar amb fonts fiables o consultar experts. Si alguna cosa sembla massa complexa o massa bona per ser veritat, probablement requereix més verificació.
- Comprova amb fonts fiables: Si tens dubtes, contrasta la informació amb plataformes de confiança com cercadors o la Viquipèdia. En el cas de codi generat, executa’l i prova’l sempre per assegurar que fa el que toca.
- Revisió humana: En àmbits crítics com els escrits legals, la revisió humana és cada cop més necessària. En algunes jurisdiccions fins i tot és obligatòria per garantir la fiabilitat del contingut generat per IA.
Verificació ajustada al risc
Els passos per verificar la informació han de ser proporcionals als riscos i a les implicacions d’usar-la. Per a aplicacions crítiques com el codi generat, són essencials proves exhaustives i revisió experta. Per a preguntes de coneixement general, pot ser suficient un contrast ràpid amb una font fiable.
Si tens present què hi ha en joc, pots adaptar el teu procés de verificació i prendre les precaucions adequades. Aquest enfocament equilibrat et permet treure profit del que ofereixen els models de llenguatge grans, tot minimitzant-ne les limitacions i els riscos.
Estratègies pràctiques i casos d’ús de xatbots com ChatGTP#
Consideracions de llengua: per obtenir millors resultats, usa l’anglès#
Els models de llenguatge grans com ChatGPT entenen i generen text en múltiples llengües. Tanmateix, per obtenir els millors resultats, fes servir l’anglès. Una part significativa de les dades d’entrenament és en anglès, i això fa que les respostes en aquesta llengua siguin més matisades i acurades. Això és especialment important per a qui no el té com a llengua materna.
Si necessites contingut en una altra llengua, una estratègia útil és primer fer el prompt en anglès per obtenir la resposta més acurada. Un cop la tinguis, pots demanar a ChatGPT que la tradueixi a la llengua desitjada. Aquest procés en dos passos sovint dona resultats més fiables que demanar directament en una llengua no anglesa.
Posant el context en context.#
Quan xateges amb ChatGPT, el context inclou tota la conversa prèvia que has tingut —tant els teus prompts com les respostes del xatbot. El context és la informació que ajuda el model a entendre què li demanes. En models de llenguatge grans com ChatGPT, aquest context no es limita a la consulta actual. També inclou l’historial sencer de la conversa, la manera específica com formules les preguntes i fins i tot les respostes prèvies del model. Com que el model para atenció a aquest context ampliat, juntament amb el teu prompt actual i les dades del seu entrenament, pot proporcionar respostes més matisades i precises. Això vol dir que el model no només entén la teva pregunta immediata, sinó que també té en compte la conversa més àmplia per generar una resposta més conscient del context.
Exemple 1: Recepta i llista de la compra
- El teu prompt: “Em pots donar una recepta de galetes de xocolata?”
- Resposta de ChatGPT: “I tant, aquí tens una recepta senzilla de galetes de xocolata…”
- El teu prompt de seguiment: “Genial, pots crear ara una llista de la compra basada en aquesta recepta?”
- Resposta de seguiment de ChatGPT: “És clar, basant-me en la recepta de galetes de xocolata, necessitaràs…”
En aquest exemple, ChatGPT fa servir la seva pròpia recepta generada com a context per crear una llista de la compra rellevant. Això mostra com la sortida anterior del model informa l’acció següent, fent la interacció més fluida i personalitzada.
Exemple 2: Avaluació educativa
- El teu prompt: Farem l’avaluació dels exercicis de l’alumnat. El problema a resoldre és: x + 4 = 7 La resposta correcta és x = 7 - 4 x = 3 Ara et proporcionaré diverses respostes d’estudiants. Compara la solució de l’estudiant amb la solució proposada i digues: A) si la resposta és correcta o no, B) si no és correcta, explica on s’ha equivocat l’estudiant i com ho pot arreglar. No donis la resposta correcta, només orientació per a l’estudiant. Ara digues només OK.
- Resposta de ChatGPT: “OK”
En aquest exemple, has definit un context perquè ChatGPT avali respostes d’estudiants en relació amb una solució donada. El model farà servir aquest context per proporcionar feedback específic, ajudant l’alumnat a entendre on pot haver fallat sense desvetllar la resposta correcta. És una aplicació pràctica de com entendre el context pot conduir a interaccions educatives més efectives.
- El teu prompt de seguiment 1: La resposta de l’estudiant 1 és: x = 7 + 4 x = 11
- Resposta de seguiment de ChatGPT 1: A) La resposta és incorrecta. B) L’estudiant ha sumat 4 en lloc de restar-lo. Per corregir-ho, hauria de començar aïllant x_x_ en un costat de l’equació fent l’operació inversa a tots dos costats.
- El teu prompt de seguiment 2: La resposta de l’estudiant 2 és: x = 7 / 4 x = 1.75
- Resposta de seguiment de ChatGPT 2: A) La resposta és incorrecta. B) L’estudiant ha dividit per 4 en lloc de restar-lo. Hauria de centrar-se aïllant x_x_ amb l’operació inversa correcta.
- El teu prompt de seguiment 3: La resposta de l’estudiant 3 és: x = 7 - 4 x = 3
- Resposta de seguiment de ChatGPT 3: A) La resposta és correcta. B) L’estudiant ha aïllat correctament x_x_ restant 4 a tots dos costats de l’equació.
En aquest exemple ampliat, ChatGPT fa servir el context proporcionat —la solució correcta de l’equació x+4=7_x_+4=7— per avaluar les respostes de l’alumnat. Després ofereix feedback específic segons com es compara cada resposta amb la solució correcta. Això demostra l’habilitat del model per usar el context i donar interaccions més matisades i útils.
Perdre el context és perdre el sentit
Entendre el context en les teves converses amb models de llenguatge grans com ChatGPT és crucial. Fa que els intercanvis siguin més precisos i matisats. El context ajuda el model a entendre millor el tema, el to i les teves necessitats concretes. Això és clau per evitar errors, especialment en entorns professionals o educatius. També permet interaccions més complexes, com debats detallats o fer servir el model per ensenyar, com hem vist als exemples.

Curiosament, la recerca mostra (vegeu la figura) que gairebé la meitat de les sessions de ChatGPT consten d’un sol prompt (34,5%) o de dos (14,5%). Això suggereix que un gran nombre d’usuaris no estan aprofitant les capacitats de consciència de context d’aquests models. Només aproximadament un 35% de les sessions tenen cinc prompts o més. En no mantenir converses més llargues, els usuaris perden els avantatges del context, com respostes més acurades i matisades, especialment en consultes o debats complexos.
Quan interactues amb ChatGPT, la manera com dones format al text no és només una qüestió d’estètica o llegibilitat; també afecta la semàntica, el significat del que dius. Un bon format del text actua com una guia per al model, l’ajuda a entendre millor l’estructura i la intenció de la teva consulta. Això, al seu torn, permet que el model generi respostes més precises, organitzades i ajustades al que realment estàs demanant.
Format del text: un truc útil en converses amb LLM#
Quan interactues amb ChatGPT, la manera com dones format al text no és només una qüestió d’estètica o llegibilitat; també afecta la semàntica, el significat darrere de les paraules. Un bon format del text actua com una guia per al model, l’ajuda a entendre millor l’estructura i la intenció de la teva consulta. Això, al seu torn, permet que el model generi respostes més precises, organitzades i ajustades al que realment estàs demanant.
Exemple 3: Fer servir vinyetes per a múltiples preguntes
El teu prompt:
"Tell me about the benefits of: - Solar energy - Wind energy"Resposta de ChatGPT:
"Certainly! - Solar energy is renewable, reduces electricity bills, and has low operating costs. - Wind energy is also renewable, cost-effective, and can be built on existing farms."
En aquest exemple, l’ús de vinyetes al prompt ajuda a separar clarament múltiples preguntes, fent més fàcil que ChatGPT les abordi una per una.
Fes servir formats de text com un ninja#
Més enllà de les vinyetes i les llistes numerades, pots aprofitar formats de text més especialitzats, habituals en informàtica, per millorar les teves interaccions amb ChatGPT. Formats com CSV (Comma-Separated Values), JSON (JavaScript Object Notation) i XML (eXtensible Markup Language) es poden fer servir als teus prompts. Són especialment útils quan treballes amb consultes amb moltes dades o quan necessites que el model generi respostes fàcilment integrables en altres programes o bases de dades.
Per exemple, si tens dades en un fitxer d’Excel que vols analitzar, pots exportar-les a CSV i fer servir aquestes dades en format CSV al teu prompt a ChatGPT. Això facilita que el model entengui la consulta i millora l’exactitud de les respostes. Fins i tot pots preguntar a ChatGTP: “Com puc exportar dades d’EXCEL a un fitxer CSV?”
Exemple 4:
El teu prompt:
"Sort the following table by Age in ascending order. The table is in CSV format:
Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist
""
Resposta de ChatGPT:
´´´
Name,Age,Occupation Ella,28,Artist Bob,29,Doctor Alice,34,Engineer David,39,Lawyer Charlie,45,Teacher
´´´
Una nota sobre el Markdown
ChatGPT entén el format de text Markdown, que li permet mostrar blocs de codi, taules, encapçalaments, enllaços i fins i tot imatges incrustades a la sortida. Però si fas servir un editor compatible amb Markdown per als teus documents —com Obsidian o Notion— vés amb compte amb certs codis Markdown que et podrien espatllar la presentació:
Cometes triples invertides ("`"): s’usen per a blocs de codi en Markdown. Si no vas amb compte, poden fer malbé el format a l’editor. Guions triples ("-"): sovint s’usen per a línies horitzontals, que podrien dividir el text sense voler. Coixinets ("#", “##”, “###”): s’usen per a encapçalaments. Assegura’t d’usar-los intencionadament per estructurar el document. Asteriscs ("*"): s’usen per a vinyetes. Assegura’t que estiguin alineats correctament per mantenir l’estructura de la llista. Taules: les taules en Markdown poden ser útils però també traïdores. Assegura’t que les columnes s’alineïn correctament per facilitar la lectura.
Fer servir Markdown a la sortida de ChatGPT
Tornem a l’últim exemple: podem demanar a ChatGPT que doni la sortida en una taula Markdown:
El teu prompt:
Sort the following table by Age in ascending order. Format the result **in Markdown**. The table is in CSV format:
Name,Age,Occupation
Alice,34,Engineer
Bob,29,Doctor
Charlie,45,Teacher
David,39,Lawyer
Ella,28,Artist
Resposta de ChatGPT:
[TABLE]
D’aquesta manera obtens les dades ordenades en una taula Markdown, que pots incloure directament als teus documents Markdown. A la pàgina de ChatGPT veuràs la taula renderitzada, però si la copies i l’enganxes en un editor de text pla obtindràs una cosa així:
|Name|Age|Occupation|
|---|---|---|
|Ella|28|Artist|
|Bob|29|Doctor|
|Alice|34|Engineer|
|David|39|Lawyer|
|Charlie|45|Teacher|
Que és una representació en Markdown d’una taula.
Altres usos dels formats de text i els xatbots.#
Exemple: fer que ChatGPT treballi amb gràfics
El teu prompt:
“Hi ha algun llenguatge basat en text que es pugui fer servir per representar gràfics?”
Resposta de ChatGPT:
“Sí, hi ha diversos llenguatges i formats basats en text que es poden utilitzar per representar gràfics. Sovint es fan servir conjuntament amb programari de visualització o d’anàlisi de gràfics. Aquí en tens alguns:
- Llenguatge DOT: El llenguatge DOT és un llenguatge de descripció de gràfics en text pla àmpliament utilitzat com a part del projecte Graphviz. És senzill i permet descriure gràfics, digràfics i els seus atributs.
Exemple:
dotCopy code digraph G { A -> B; B -> C; C -> A; }
(… la resposta continua amb diversos formats: YAML, GML, JSON GRAPH… )
“
La teva resposta de seguiment:
“Genera un fitxer .dot que representi un gràfic de les 10 ciutats més poblades d’Europa, les seves connexions d’alta velocitat i el nombre de quilòmetres de cada connexió directa.”
Resposta de ChatGPT:
“Aquí tens un fitxer .dot d’exemple que representa un gràfic de les 10 ciutats més poblades d’Europa, amb les seves connexions d’alta velocitat i les distàncies entre elles.”
digraph EuropeCities { "London" -> "Paris" [label="450 km"]; "Paris" -> "Madrid" [label="1,050 km"]; "Madrid" -> "Rome" [label="1,400 km"]; "Rome" -> "Berlin" [label="1,100 km"]; "Berlin" -> "Moscow" [label="1,800 km"]; "Moscow" -> "Saint Petersburg" [label="700 km"]; "Saint Petersburg" -> "Kiev" [label="1,100 km"]; "Kiev" -> "Istanbul" [label="1,300 km"]; "Istanbul" -> "Bucharest" [label="600 km"]; "Bucharest" -> "Berlin" [label="1,400 km"]; "London" -> "Berlin" [label="1,100 km"]; "Paris" -> "Berlin" [label="1,050 km"]; "Paris" -> "Rome" [label="1,100 km"]; "Madrid" -> "Berlin" [label="1,900 km"]; "Berlin" -> "Kiev" [label="1,300 km"]; "Moscow" -> "Kiev" [label="870 km"]; "Kiev" -> "Bucharest" [label="800 km"]; "Istanbul" -> "Moscow" [label="2,200 km"]; "Rome" -> "Madrid" [label="1,400 km"]; "Rome" -> "Paris" [label="1,100 km"]; }
Ara pots demanar coses com que ChatGPT trobi el camí òptim de Madrid a Sant Petersburg i que el ressalti al codi .dot. Amb dos prompts addicionals vaig aconseguir que GPT-4 creés el codi per a aquest gràfic. Curiosament, GPT-4 va fer servir l’algorisme de Dijstra per resoldre el problema. Et deixo la imatge resultant i t’ho poso com a repte.

Últims prompts#
Segons la recerca, més del 23% de l’ús de ChatGPT està relacionat amb l’educació. Tant docents com estudiants fan servir ChatGPT, i els nous xatbots avançats d’IA que estan arribant (com el Bard de Google, Open Assistant, Llama 2 de Meta, etc.) estan trobant bons casos d’ús per ajudar en les tasques diàries d’ensenyament i aprenentatge. Una bona comprensió d’aquestes eines, de les seves capacitats i limitacions, és crucial per a un ús responsable i ètic, especialment en entorns educatius.
A més de tot el que hem tractat fins ara en aquest article, hi ha uns quants punts finals que val la pena considerar:
- Eines com ChatGPT han vingut per quedar-se; no són una moda passatgera. Representen una nova era de tecnologia d’internet i programari, i el seu impacte serà monumental. Si ho comparem amb les tecnologies web, ara estem en l’equivalent de finals dels noranta, trastejant amb pàgines estàtiques. La tecnologia millorarà exponencialment en els propers cinc anys, i l’impacte en les nostres vides serà tan transformador com la combinació de PC, internet i telèfons intel·ligents.
- L’ús sofisticat de ChatGPT i altres models de llenguatge grans (LLM) és cada cop més difícil de detectar. La recerca actual suggereix que és poc probable que desenvolupem aviat un detector fiable de “contingut generat per IA”. Qui assegura oferir eines així, bàsicament ven oli de serp.
- Al juny de 2023, ChatGPT va introduir una funció útil: la possibilitat de compartir un enllaç permanent d’una conversa. Això és molt valuós perquè ens permet mostrar la feina feta amb el xatbot per produir contingut específic. Per exemple, aquest mateix document es va desenvolupar amb ChatGPT en una conversa que va durar diverses hores. Proporciono l’enllaç com a mostra de com d’efectivament es pot fer servir un xatbot per produir feina de qualitat. O com a mínim tan bona com aquest article.
Gràcies per llegir fins al final.
