[{"content":"","date":"11 de maig 2026","externalUrl":null,"permalink":"/ludo/en/tags/ai/","section":"Tags","summary":"","title":"Ai","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/categories/","section":"Categories","summary":"","title":"Categories","type":"categories"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/tags/gesti%C3%B3-coneixement/","section":"Tags","summary":"","title":"Gestió-Coneixement","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/es/tags/gesti%C3%B3n-conocimiento/","section":"Tags","summary":"","title":"Gestión-Conocimiento","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/tags/ia/","section":"Tags","summary":"","title":"Ia","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/tags/infraestructura/","section":"Tags","summary":"","title":"Infraestructura","type":"tags"},{"content":"","date":"11 de maig 2026","externalUrl":null,"permalink":"/ludo/en/tags/infrastructure/","section":"Tags","summary":"","title":"Infrastructure","type":"tags"},{"content":"","date":"11 de maig 2026","externalUrl":null,"permalink":"/ludo/en/tags/knowledge-management/","section":"Tags","summary":"","title":"Knowledge-Management","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/es/tags/llms-locales/","section":"Tags","summary":"","title":"Llms-Locales","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/tags/llms-locals/","section":"Tags","summary":"","title":"Llms-Locals","type":"tags"},{"content":"","date":"11 de maig 2026","externalUrl":null,"permalink":"/ludo/en/tags/local-llms/","section":"Tags","summary":"","title":"Local-Llms","type":"tags"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/","section":"Marc Alier (Ludo)","summary":"","title":"Marc Alier (Ludo)","type":"page"},{"content":"En una execució recent vaig tenir LLMs locals treballant més de 28 hores, mastegant quatre-cents trenta-set fitxers markdown. El model era qwen3.5:122b, servit via Ollama en dos Mac Studio sobre una xarxa local privada. La tasca, gens glamurosa: llegir un fitxer, retornar un JSON amb un resum de dues frases, les persones esmentades, les etiquetes de temes, les idees clau que el fitxer argumenta. Repetir. Agregar entre fitxers. Escriure els bastiments per entrada.\nSi ho intento fer amb claude code em quedo sense tokens en un sospir, i fins i tot pagant proveïdors xinesos de núvol barats acabaré no fent aquesta mena d\u0026rsquo;optimitzacions del repositori de continguts perquè es pot encarir aviat.\nDes de llavors he començat a substituir aquell pipeline per DS4 executant DeepSeek V4 Flash Q4 sobre el mateix maquinari. La latència per crida ha caigut de cent cinquanta segons a uns dotze. Mateixa tasca. Mateixa forma de prompt. Motor diferent, el doble de mida en RAM. Una millora rotunda en rendiment, i fins i tot noto que la màquina Studio funciona més fresca.\nAquest post és la nota d\u0026rsquo;optimització. El que vull de la flota local és un LLM de qualitat amb cost variable proper a zero, per a tasques per lots — indexació de wikis, auditoria de referències, neteja de transcripcions, classificació en massa. La mena de feina on el coll d\u0026rsquo;ampolla és la latència i la fiabilitat, no la intel·ligència. Dos motors, dues postures, una compensació que cal anomenar.\nEl cas d\u0026rsquo;ús # Un índex wiki sobre un repositori personal d\u0026rsquo;escriptura i recerca. Uns quatre-cents fitxers markdown: capítols, esborranys, material de fonts, notes de memòria — fins i tot la meva tesi doctoral sencera hi és dins! Per a cada fitxer vull un petit artefacte estructurat: un resum que l\u0026rsquo;índex pugui mostrar, entitats anomenades per poblar les facetes de persones/temes/idees-clau, referències creuades entre elles.\nAixò és extracció massiva. Prompt de sistema reutilitzable; contingut d\u0026rsquo;usuari variable; sortida JSON estructurada. El model no cal que sigui llest — cal que sigui fiable, predictible i prou disponible per tirar endavant centenars de crides sense trencar-se.\nCridar un LLM en aquest registre és un esport diferent de conversar-hi. La sortida és l\u0026rsquo;entrada del següent pas del pipeline. Si el vint per cent de les crides tornen buides, és el vint per cent de la wiki que falta. Si dupliques la longitud del context i la qualitat es degrada silenciosament, el corpus que cal trossejar és el teu fitxer més gran. La superfície d\u0026rsquo;enginyeria que importa és la latència, la previsibilitat i la fallada elegant.\nEl patró wiki de Karpathy # A principis d\u0026rsquo;abril de 2026 Andrej Karpathy va publicar un tuit que es va fer viral: \u0026ldquo;a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating [knowledge].\u0026rdquo; Hi esbossava un sistema on les fonts en brut — articles, papers, repositoris, datasets, fins i tot imatges — cauen en un directori raw/, i un agent LLM les compila incrementalment en una wiki estructurada: fitxers markdown interconnectats amb resums, backlinks, pàgines de conceptes. Dos dies després ho va completar amb un idea file — un gist de GitHub que descriu el patró conceptualment, sense codi adjunt, sota la teoria que en l\u0026rsquo;era dels agents la idea és més útil de compartir que la implementació.\nAquell tuit descriu el projecte que estic construint gairebé paraula per paraula. El repositori que estic indexant són anys d\u0026rsquo;escriptura — capítols, esborranys, transcripcions de fonts, notes de memòria, tot plegat. El bootstrap que vaig executar és el pas de compilació incremental que Karpathy anomena. Les operacions que esbossa més avall — ingesta, consulta, lint — són el que ve a continuació per a mi. No va inventar el patró, però el va fer llegible: el va anomenar, li va donar forma, el va fer públic en el moment en què les eines per a maquinari local hi havien arribat. Aquest estiu serà a tot arreu.\nVersatilitat contra especialització # Dues postures s\u0026rsquo;asseuen als extrems de l\u0026rsquo;espectre dels LLM locals.\nOllama és l\u0026rsquo;extrem versàtil. Serveix qualsevol model de la seva biblioteca — Qwen, Llama, Mistral, Gemma, Phi, qualsevol que puguis trobar com a GGUF. Una instal·lació, GUI i CLI, una API HTTP, i pots canviar de model per tasca. Si canvies de model cada setmana, Ollama és l\u0026rsquo;eina correcta: la fricció de provar-ne un de nou és una sola ordre ollama pull.\nDS4 és l\u0026rsquo;extrem especialitzat, el nouvingut. Serveix un model — DeepSeek V4 Flash quantitzat en q2 o q4 — i està dedicat a fer que aquell únic model funcioni tan bé com un Mac Studio permeti. Cache KV resident a disc, kernels conscients de MoE, descodificació especulativa MTP, una API HTTP compatible amb OpenAI a sobre. No pot servir cap altre model. Això no és un bug; és el disseny i la intenció.\nLa compensació és directa. Si et compromets amb un model i el fas servir intensament — mateix prefix de prompt, centenars de crides al dia, cost de prefill amortitzat sobre milers d\u0026rsquo;inferències — l\u0026rsquo;especialització es paga sola de pressa. Si saltes entre models, el motor especialitzat és cost enfonsat. La resposta correcta depèn de quant l\u0026rsquo;uses de debò.\nOllama + qwen3.5:122b — l\u0026rsquo;incumbent versàtil # qwen3.5:122b és un model Mixture-of-Experts potent, 125 mil milions de paràmetres totals, capacitat de sobra. Servit via Ollama és una instal·lació d\u0026rsquo;una línia i una presència permanent a la LAN. Ha estat el \u0026ldquo;Tier 1\u0026rdquo; del meu taller durant mesos: tot el que és mecànic i voluminós i pel qual no vull pagar una API hi va a parar.\nPer al bootstrap de la wiki, dues observacions val la pena registrar.\nEl precipici de context. Vaig limitar cada crida a 12k tokens d\u0026rsquo;entrada amb un sostre fort de 16k via --num-ctx 16000. Passat el 16k, la qualitat es degrada de manera visible — cues truncades, entitats anomenades perdudes, qualificadors numèrics que cauen. El capítol de 30k, la transcripció de 70k, el fitxer de visió del món de 50k, tots s\u0026rsquo;havien de trossejar, resumir per tros, i reagregar. Cada tros és una altra crida d\u0026rsquo;Ollama.\nEl mode de fallada de sortida buida. Al llarg de l\u0026rsquo;execució, entre el divuit i el vint per cent de les crides retornaven len=0 — una compleció buida. Ni JSON malformat, ni contingut rebutjat, només res. A través de fitxers de totes les mides; no predit per mida, tipus, ni contingut. Reintentar la mateixa crida sol produir el mateix resultat. La meva mitigació va ser una passada de reintents amb gpt-5-mini via OpenAI — uns vint cèntims per cada cent fitxers. Barat, però no gratis, i no és la qüestió.\nDS4 + DeepSeek V4 Flash — la pila especialitzada # DS4 és un motor d\u0026rsquo;inferència alpha construït per antirez, dedicat a DeepSeek V4 Flash — un model MoE de 284B totals / 13B actius. L\u0026rsquo;especificació del model afirma fins a un milió de tokens de context; jo executo el servidor amb --ctx 200000 i he provat fitxers fins a 70k tokens. Exposa una API HTTP compatible amb OpenAI al port 8000 i manté una cache KV SHA1 a disc que persisteix entre reinicis del servidor.\nTres d\u0026rsquo;aquestes propietats importen per a l\u0026rsquo;extracció per lots:\nLa cache KV reutilitza prefixos de prompt. Quan el prompt de sistema és idèntic a cada crida — i en un pipeline d\u0026rsquo;extracció estructurada sempre ho és — el cost de prefill es paga una vegada, i després queda en cache a disc. De la segona crida endavant veus un cost per crida dràsticament més petit. Al llarg d\u0026rsquo;una execució llarga això es compon en l\u0026rsquo;estalvi més gran.\n200k de context (el model en reclama més, jo he provat fins aquí). Prou de trossejar els fitxers de 70k. Tot sencer entra, tot sencer surt resumit. Menys lògica d\u0026rsquo;agregació, menys risc de perdre una secció.\nSensiblement millor en sortida JSON estructurada segons les meves proves inicials. Zero fallades de sortida buida en les primeres execucions.\nRendiment de maquinari sobre l\u0026rsquo;M3 Ultra: ~38 tokens per segon de prefill, 32 de generació — coherent amb els números documentats per antirez. La latència per crida en el pipeline d\u0026rsquo;enriquiment en viu és de 6,3 a 25,9 s, mitjana 11,6 s per a una crida de 2k d\u0026rsquo;entrada i 500 tokens de sortida (últimes 200 crides d\u0026rsquo;una execució de 1.241). La mateixa forma de crida amb qwen3.5:122b corria a 90–290 s, mitjana 150–200 s. Un ordre de magnitud al temps de rellotge que més importava.\nLatència mitjana per crida, en segons Gràfic de barres verticals. Ollama + Qwen3.5:122b: ~175s de mitjana. DS4 + DeepSeek V4 Flash: 11,6s de mitjana. Mesurat sobre Mac Studio M3 Ultra amb la mateixa forma de crida (2k d'entrada, 500 tokens de sortida). Latència mitjana per crida segons (com més baix, millor)\n0 50 100 150 200 ~175s Ollama + Qwen3.5:122b 11,6s DS4 + DeepSeek V4 Flash Q4 Mac Studio M3 Ultra · crida de 2k d\u0026rsquo;entrada, 500 tokens de sortida · diferència ≈15× La imatge de fiabilitat és més nítida que la de la latència, i la que decideix si el pipeline és usable en absolut. Zero fallades silencioses en 1.241 crides, contra una de cada cinc amb Qwen. El prompt de sistema li diu al model \u0026ldquo;si el context és massa prim, mostra INSUFFICIENT_CONTEXT i res més\u0026rdquo; — DeepSeek V4 Flash obeeix el 15,6 % de les vegades. El bastiment es manté en lloc; res no s\u0026rsquo;inventa. Qwen, quan fallava, fallava silenciosament.\nMètrica DS4 + DeepSeek V4 Flash Ollama + Qwen3.5:122b Latència per crida, mitjana 11,6 s 150–200 s Latència per crida, rang 6,3 – 25,9 s ~90 – 290 s Fallades silencioses de sortida buida 0 / 1.241 ~18–20 % Refusos honestos (bastiment mantingut) 194 / 1.241 (15,6 %) n/d Pressupost de context que aguanta qualitat 200k tokens (provats) ~16k efectius Reutilització de cache entre crides SHA1 a disc, persistent cap Una observació poc científica però que val la pena registrar: el Mac Studio funciona més fresc amb DS4 a quasi tota la GPU que amb Ollama+Qwen3.5:122b a càrrega comparable. Sense benchmark, només la temperatura de la carcassa.\nNo lligat a DS4. El truc de la cache KV a disc no és propietari. llama.cpp pot guardar cache de prefixos en memòria avui mateix i té cache persistent a disc al seu roadmap; Ollama s\u0026rsquo;hi recolza i ho heretarà. El patró — motor especialitzat, reutilització de prefix de prompt — és portable, i l\u0026rsquo;optimització s\u0026rsquo;estendrà a qualsevol model que estiguis servint en cada moment.\nGeneració en català # No estic comparant la qualitat de generació d\u0026rsquo;aquests dos motors en aquest post. Aquesta és una pregunta diferent, i en textos prou llargs i de pes no confiaria que cap dels dos m\u0026rsquo;escrigui la feina. Per al català en particular, la meva norma vigent és que qualsevol cosa generada per un model local per sota del llindar aproximat de ~250B paràmetres efectius perd l\u0026rsquo;idioma — el ritme, el vocabulari que no es tradueix. Qwen3.5:122b no passa la prova. DeepSeek V4 Flash, amb tretze mil milions de paràmetres actius en inferència, queda en la mateixa classe efectiva de mida i espero que falli la mateixa prova fins que una tanda real de traducció em digui el contrari.\nLa traducció amb català com a llengua objectiu, al meu taller, va a Claude o a un model frontera d\u0026rsquo;OpenAI. La flota local cobreix només granel ES/EN. L\u0026rsquo;estalvi de cost viu al costat mecànic en granel; la veu i l\u0026rsquo;idioma no són per estalviar-hi.\nDesmonetització, en el sentit de Diamandis # A Bold (2015), Peter Diamandis i Steven Kotler descriuen sis efectes que segueixen quan una tecnologia es digitalitza: es torna enganyosa, disruptiva, desmonetitzada, desmaterialitzada, democratitzada. La desmonetització és la que importa aquí. Fa un any, indexar quatre-cents fitxers markdown personals amb un LLM no era econòmicament obvi — a preus d\u0026rsquo;API frontera la factura hauria estat real, els límits de taxa l\u0026rsquo;haurien estirat al llarg de setmanes. Avui, sobre maquinari que ja posseeixo, la mateixa feina és una sola execució per lots a zero cost variable. La crida marginal és gratuïta.\nQuan el cost marginal s\u0026rsquo;acosta a zero, els casos d\u0026rsquo;ús que emergeixen són els que no compensaven la factura abans. La indexació wiki d\u0026rsquo;un corpus personal és un. Neteja de transcripcions a escala, esborranys multilingües per a coses que igualment reescriuràs, cerca semàntica sobre centenars de papers, auditoria de referències, extracció d\u0026rsquo;ontologies — cadascun era \u0026ldquo;interessant però no prou interessant\u0026rdquo; als preus d\u0026rsquo;API frontera, i cadascun és un projecte secundari ara.\nAquesta és l\u0026rsquo;optimització que importa. No \u0026ldquo;Ollama contra DS4\u0026rdquo; — aquesta decisió és petita, i la resposta canvia a mesura que llama.cpp es posa al dia. L\u0026rsquo;optimització és trobar els fluxos de treball que només tenen sentit un cop el cost per crida ha desaparegut.\nReferència tècnica ràpida # Si vols provar el camí DS4 en una màquina Apple Silicon amb prou memòria (256–512 GB per al build Q4, 96–192 GB per al Q2):\n# 1. Clona + compila (~30 segons) mkdir -p ~/Code \u0026amp;\u0026amp; cd ~/Code git clone https://github.com/antirez/ds4.git cd ds4 \u0026amp;\u0026amp; make # 2. Descarrega el model (Q4: 153 GB, Q2: 81 GB) — GGUFs publicats per antirez ./download_model.sh q4 # o `q2` per al build petit # 3. Engega el servidor mkdir -p ~/.ds4-kv ./ds4-server \\ --ctx 200000 \\ --kv-disk-dir ~/.ds4-kv \\ --kv-disk-space-mb 32768 # 4. Crida\u0026#39;l com qualsevol endpoint OpenAI curl -s http://192.168.1.35:8000/v1/chat/completions \\ -H \u0026#34;Content-Type: application/json\u0026#34; \\ -d \u0026#39;{\u0026#34;model\u0026#34;: \u0026#34;deepseek-v4-flash\u0026#34;, \u0026#34;messages\u0026#34;: [{\u0026#34;role\u0026#34;:\u0026#34;user\u0026#34;,\u0026#34;content\u0026#34;:\u0026#34;Hola\u0026#34;}]}\u0026#39; Per defecte el servidor s\u0026rsquo;hauria d\u0026rsquo;escoltar a 0.0.0.0:8000, tot i que la versió que vaig compilar s\u0026rsquo;escoltava a 127.0.0.1:8000 i va caldre reconfigurar-la explícitament per arribar-hi des de la LAN. El --kv-disk-dir és on viu la cache KV SHA1 — manteniu-lo en NVMe intern, no en emmagatzematge extern. La primera crida a un servidor en fred triga deu a seixanta segons a carregar els pesos; les crides següents els reutilitzen.\n","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/posts/local-llms-as-bulk-tools/","section":"Posts","summary":"En una execució recent vaig tenir LLMs locals treballant més de 28 hores, mastegant quatre-cents trenta-set fitxers markdown. El model era qwen3.5:122b, servit via Ollama en dos Mac Studio sobre una xarxa local privada. La tasca, gens glamurosa: llegir un fitxer, retornar un JSON amb un resum de dues frases, les persones esmentades, les etiquetes de temes, les idees clau que el fitxer argumenta. Repetir. Agregar entre fitxers. Escriure els bastiments per entrada.\n","title":"Optimitzar la configuració de LLMs locals per a tasques per lots","type":"posts"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/categories/posts/","section":"Categories","summary":"","title":"Posts","type":"categories"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/posts/","section":"Posts","summary":"","title":"Posts","type":"posts"},{"content":"","date":"11 de de maig de 2026","externalUrl":null,"permalink":"/ludo/tags/","section":"Tags","summary":"","title":"Tags","type":"tags"},{"content":"L’escola de doctorat de l’Universitat de Lleida m’ha convidat a donar una conferencia (keynote) a la seva jornada de doctorat el 6/3/2024. Aqui trobareu l’audio i el video de la conferencia:\nhttps://mossegalapoma.cat/el-moment-sputnik-conferencia-den-ludo-marc-alier-a-la-jornada-de-lescola-de-doctorat-de-lleida/\n","date":"1 de de març de 2024","externalUrl":null,"permalink":"/ludo/posts/conferencia-a-la-udl/","section":"Posts","summary":"L’escola de doctorat de l’Universitat de Lleida m’ha convidat a donar una conferencia (keynote) a la seva jornada de doctorat el 6/3/2024. Aqui trobareu l’audio i el video de la conferencia:\n","title":"'El Moment Sputnik' conferencia Marc Alier a la Jornada de Doctorat de la Universitat de lleida","type":"posts"},{"content":"","date":"1 de de març de 2024","externalUrl":null,"permalink":"/ludo/tags/educaci%C3%B3/","section":"Tags","summary":"","title":"Educació","type":"tags"},{"content":"","date":"12 de de febrer de 2024","externalUrl":null,"permalink":"/ludo/tags/chatgpt/","section":"Tags","summary":"","title":"Chatgpt","type":"tags"},{"content":"ChatGPT em resumeix sobre l’article a The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, professor a la Birkbeck, University of London, explora el dilema que afronten els professors amb l’ús d’IA per part dels estudiants en la redacció d’assajos. Després de detectar un assaig marcat com a “100% generat per IA”, Topinka es troba en una situació difícil quan un estudiant excepcionalment brillant impugna aquesta acusació. El cas subratlla els desafiaments dels detectors d’IA, com Turnitin, que poden confondre l’ús legítim de suport tecnològic per part dels estudiants amb trampa. Topinka argumenta la necessitat d’adaptar l’avaluació acadèmica a l’era de l’IA, proposant alternatives com presentacions i podcasts per demostrar el pensament crític i original dels estudiants, tot evitant acusacions injustes i promoure la igualtat d’oportunitats educatives.\nEl darrer any he fet cursos a professores i professors de més de 7 universitats ( Podeu veure part del contingut a https://wasabi.essi.upc.edu/ludo/cursos ) i sempre he rebut preguntes al respecte de com detectar que un treball l’ha fet una IA en comptes d’una persona.\nEls treballs copiats no son una novetat. Quan encara era estudiant donava classes de repàs de l’assignatura programació metòdica a una acadèmia, i un dia em van demanar resoldre un exercici que va resultar ser el mateix que va sortir a l’examen. No em pregunteu d’on va sortir aquell enunciat, perquè no ho sé. Tampoc vaig continuar treballant a aquella acadèmia per esbrinar-ho.\nDes de que existeix la web tenim coses com “El rincón del vago” on estudiants comparteixen apunts, exercicis i pràctiques resolts. I a Instagram els estudiants reben publicitat d’empreses que ofereixen fer-los el treball de fi de grau o de màster… perquè els quedi temps per dedicar al seu crush. Jo mateix rebo anuncis X (abans twitter) d’empreses que s’ofereixen a escriure articles de recerca en el meu camp i publicarlos en el meu nom a prestigioses revistes.\nPerò el problema és la IA. Es clar. Perquè permet fer les coses a escala i a costos irrisoris. I ara correm hi tots.\nI el que volem son solucions fàcils, com prendre anti inflamatoris, però aplicats a la qualitat docent i a la pau mental que et dona un quadre de control. Sistemes com Urkund i Turnitin, s’integren als nostres Moodle’s i Sakais i ens diuen en quin percentatge els lliuraments dels nostres estudiants son originals o son afusellades de coses online o dels treballs dels seus companys.\nCom deia Bruce Willis a “The kid”: “sandwiches give security”. I el color verd al costat de un lliurament dona pau d’esperit.\nPerò ja fà anys que els alumnes insereixen caràcters en cirílic que semblen lletres en l’alfabet llatí (veure taula de caracters confundibles a https://github.com/mindcrypt/uriDeep/blob/master/data/deepDiccConfusables.txt ) i que burlen els sistemes anti copia sense problema.\nI els sistemes de detecció de contingut genetat per IA?\nEl Febrer de 2023 ja vaig dir, i és a youtube gravat en silici, per a textos de menys d’una pàgina és impossible dir amb certesa si un text ha estat generat per IA o ha estat una persona. Més endavant investigadors de la Universitat de Maryland van publicar “Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W., \u0026amp; Feizi, S. (2023). Can AI-Generated Text be Reliably Detected? arXiv:2303.11156 [cs.CL]. https://doi.org/10.48550/arXiv.2303.11156”\nVeiem a l’abstract :\nA continuació, proporcionem un resultat teòric d’impossibilitat que indica que a mesura que els models de llenguatge esdevenen més sofisticats i millors en emular el text humà, el rendiment del millor detector possible disminueix. Per a un model de llenguatge prou avançat que busca imitar el text humà, fins i tot el millor detector possible podria actuar només marginalment millor que un classificador aleatori. El nostre resultat és prou general per capturar escenaris específics com estils d’escriptura particulars, disseny intel·ligent de prompts o parafraseig de text.```\nO sia, que NO, que no es pot detectar amb fiabilitat si un text ha estat generat per IA. El sistema no serà fiable i generarà errors: falsos negatius i falsos positius.\nAra, parlem d’ètica. Ètica de la IA de veritat, no de pa sucat amb oli. La Ètica d’un professor que decideix delegar el seu judici a una màquina que diu que un alumne ha “copiat amb IA”. L’ètica d’una empresa que ven el servei s’aquesta màquina que….** NO FUNCIONA.**\nEls falsos positius poden tenir impacte sobre la carrera d’un estudiant, o un investigador que entra a la llita negra d’una editorial a partir d’un discriminador IA.\n“La IA m’ha dit que has copiat amb IA.” Es una exhibició de cinisme i de mandra, de no voler fer les coses bé. De no pensar que si una IA fa l’exercici que demanes, potser hauries de demanar una altre cosa.\nAlguna professora m’ha explicat, per al meu horror, que el seu detector de contingut fet amb IA es ChatGPT. I que se’l creu. Des de fa uns mesos ChatGTP ha deixat de mullarse quan li pregunten si un text ha estat generat per IA.\n","date":"12 de de febrer de 2024","externalUrl":null,"permalink":"/ludo/posts/la-ia-diu-que-aquests-deures-els-ha-fet-la-ia/","section":"Posts","summary":"ChatGPT em resumeix sobre l’article a The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, professor a la Birkbeck, University of London, explora el dilema que afronten els professors amb l’ús d’IA per part dels estudiants en la redacció d’assajos. Després de detectar un assaig marcat com a “100% generat per IA”, Topinka es troba en una situació difícil quan un estudiant excepcionalment brillant impugna aquesta acusació. El cas subratlla els desafiaments dels detectors d’IA, com Turnitin, que poden confondre l’ús legítim de suport tecnològic per part dels estudiants amb trampa. Topinka argumenta la necessitat d’adaptar l’avaluació acadèmica a l’era de l’IA, proposant alternatives com presentacions i podcasts per demostrar el pensament crític i original dels estudiants, tot evitant acusacions injustes i promoure la igualtat d’oportunitats educatives.\n","title":"La IA diu que els deures els ha fet la IA","type":"posts"},{"content":"ChatGPT em fa un resum de l\u0026rsquo;article a The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, professor a la Birkbeck, University of London, explora el dilema que afronten els professors amb l\u0026rsquo;ús d\u0026rsquo;IA per part dels estudiants en la redacció d\u0026rsquo;assajos. Després de detectar un assaig marcat com a “100% generat per IA”, Topinka es troba en una situació difícil quan un estudiant excepcionalment brillant impugna aquesta acusació. El cas subratlla els desafiaments dels detectors d\u0026rsquo;IA, com Turnitin, que poden confondre l\u0026rsquo;ús legítim de suport tecnològic per part dels estudiants amb fer trampa. Topinka argumenta la necessitat d\u0026rsquo;adaptar l\u0026rsquo;avaluació acadèmica a l\u0026rsquo;era de la IA, proposant alternatives com presentacions i podcasts per demostrar el pensament crític i original dels estudiants, evitant acusacions injustes i promovent la igualtat d\u0026rsquo;oportunitats educatives.\nL\u0026rsquo;últim any he fet cursos a professors i professores de més de 7 universitats (Podeu veure part del contingut a https://wasabi.essi.upc.edu/ludo/cursos) i sempre he rebut preguntes sobre com detectar que un treball l\u0026rsquo;ha fet una IA en lloc d\u0026rsquo;una persona.\nEls treballs copiats no són cap novetat. Quan encara era estudiant feia classes de repàs de l\u0026rsquo;assignatura de programació metòdica en una acadèmia, i un dia em van demanar resoldre un exercici que va resultar ser el mateix que va sortir a l\u0026rsquo;examen. No em pregunteu d\u0026rsquo;on havia sortit aquell enunciat, perquè no ho sé. Tampoc vaig continuar treballant en aquella acadèmia per esbrinar-ho.\nDes que existeix la web tenim coses com “El Rincón del Vago”, on estudiants comparteixen apunts, exercicis i pràctiques resoltes. I a Instagram els estudiants reben publicitat d\u0026rsquo;empreses que els ofereixen fer-los el treball de fi de grau o de màster… perquè tinguin temps per dedicar al seu crush. Jo mateix rebo anuncis a X (abans Twitter) d\u0026rsquo;empreses que s\u0026rsquo;ofereixen a escriure articles de recerca en el meu camp i publicar-los en nom meu en revistes prestigioses.\nPerò el problema és la IA. És clar. Perquè permet fer les coses a escala i a costos irrisoris. I ara hi correm tots.\nI el que volem són solucions fàcils, com prendre antiinflamatoris, però aplicats a la qualitat docent i a la pau mental que et dona un quadre de comandament. Sistemes com Urkund i Turnitin s\u0026rsquo;integren als nostres Moodle i Sakai i ens diuen en quin percentatge els lliurables dels nostres estudiants són originals o són còpies de coses en línia o dels treballs dels seus companys.\nCom deia Bruce Willis a “The Kid”: “els entrepans donen seguretat”. I el color verd al costat d\u0026rsquo;un lliurament dona pau d\u0026rsquo;esperit.\nPerò ja fa anys que els alumnes insereixen caràcters en ciríl·lic que semblen lletres de l\u0026rsquo;alfabet llatí (vegeu la taula de caràcters confusables a https://github.com/mindcrypt/uriDeep/blob/master/data/deepDiccConfusables.txt) i que burlen els sistemes anticòpia sense problema.\nI els sistemes de detecció de contingut generat per IA?\nEl febrer de 2023 ja vaig dir, i és a YouTube gravat en silici, que per a textos de menys d\u0026rsquo;una pàgina és impossible dir amb certesa si un text ha estat generat per IA o l\u0026rsquo;ha escrit una persona. Més endavant, investigadors de la Universitat de Maryland van publicar “Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W., \u0026amp; Feizi, S. (2023). Es pot detectar de manera fiable el text generat per IA? arXiv:2303.11156 [cs.CL]. https://doi.org/10.48550/arXiv.2303.11156”\nVeiem al resum:\nA continuació, proporcionem un resultat teòric d\u0026rsquo;impossibilitat que indica que, a mesura que els models de llenguatge esdevenen més sofisticats i millors a l\u0026rsquo;hora d\u0026rsquo;emular el text humà, el rendiment del millor detector possible disminueix. Per a un model de llenguatge prou avançat que busqui imitar el text humà, fins i tot el millor detector possible podria actuar només marginalment millor que un classificador aleatori. El nostre resultat és prou general per captar escenaris específics com estils d\u0026rsquo;escriptura particulars, disseny intel·ligent de prompts o parafraseig de text.\nÉs a dir, que NO, que no es pot detectar amb fiabilitat si un text ha estat generat per IA. El sistema no serà fiable i generarà errors: falsos negatius i falsos positius.\nAra, parlem d\u0026rsquo;ètica. Ètica de la IA de veritat, no de xerinola. L\u0026rsquo;ètica d\u0026rsquo;un professor que decideix delegar el seu criteri a una màquina que diu que un alumne ha “copiat amb IA”. L\u0026rsquo;ètica d\u0026rsquo;una empresa que ven el servei d\u0026rsquo;aquesta màquina que… NO FUNCIONA.\nEls falsos positius poden tenir impacte sobre la carrera d\u0026rsquo;un estudiant, o d\u0026rsquo;un investigador que entra a la llista negra d\u0026rsquo;una editorial a partir d\u0026rsquo;un discriminador d\u0026rsquo;IA.\n“La IA m\u0026rsquo;ha dit que has copiat amb IA.” És una exhibició de cinisme i de peresa, de no voler fer les coses bé. De no pensar que, si una IA fa l\u0026rsquo;exercici que demanes, potser hauries de demanar una altra cosa.\nAlguna professora m\u0026rsquo;ha explicat, per al meu horror, que el seu detector de contingut fet amb IA és ChatGPT. I que s\u0026rsquo;ho creu. Des de fa uns mesos ChatGPT ha deixat de mullar-se quan li pregunten si un text ha estat generat per IA.\n","date":"12 de de febrer de 2024","externalUrl":null,"permalink":"/ludo/posts/la-ia-dice-que-has-hecho-los-deberes-con-ia./","section":"Posts","summary":"ChatGPT em fa un resum de l’article a The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, professor a la Birkbeck, University of London, explora el dilema que afronten els professors amb l’ús d’IA per part dels estudiants en la redacció d’assajos. Després de detectar un assaig marcat com a “100% generat per IA”, Topinka es troba en una situació difícil quan un estudiant excepcionalment brillant impugna aquesta acusació. El cas subratlla els desafiaments dels detectors d’IA, com Turnitin, que poden confondre l’ús legítim de suport tecnològic per part dels estudiants amb fer trampa. Topinka argumenta la necessitat d’adaptar l’avaluació acadèmica a l’era de la IA, proposant alternatives com presentacions i podcasts per demostrar el pensament crític i original dels estudiants, evitant acusacions injustes i promovent la igualtat d’oportunitats educatives.\n","title":"La IA diu que has fet els deures amb IA.","type":"posts"},{"content":"","date":"5 de de febrer de 2024","externalUrl":null,"permalink":"/ludo/tags/code/","section":"Tags","summary":"","title":"Code","type":"tags"},{"content":"En aquesta entrada us presento RepoSearch, un cercador semàntic de TFGs d\u0026rsquo;Enginyeria Informàtica, desenvolupat per Juanan Pereira d\u0026rsquo;UPV/EHU https://github.com/juananpe . Fent servir màgia arcana (embeddings, bases de dades vectorials, cerca de similitud per vectors) aquesta eina permet cercar TFGs de manera semàntica (digues què busques i et donarà resultats a partir del contingut de les memòries, no només del títol i metadades més o menys ben etiquetades). És una iniciativa impressionant. Kudos, Juanan! L\u0026rsquo;eina a: https://semantic.ikasten.io/\n","date":"5 de de febrer de 2024","externalUrl":null,"permalink":"/ludo/posts/buscador-de-tfgs-de-ingenier%C3%ADa-inform%C3%A1tica/","section":"Posts","summary":"En aquesta entrada us presento RepoSearch, un cercador semàntic de TFGs d’Enginyeria Informàtica, desenvolupat per Juanan Pereira d’UPV/EHU https://github.com/juananpe . Fent servir màgia arcana (embeddings, bases de dades vectorials, cerca de similitud per vectors) aquesta eina permet cercar TFGs de manera semàntica (digues què busques i et donarà resultats a partir del contingut de les memòries, no només del títol i metadades més o menys ben etiquetades). És una iniciativa impressionant. Kudos, Juanan! L’eina a: https://semantic.ikasten.io/\n","title":"RepoSearch Cercador Semàntic de TFGs d'Enginyeria Informàtica","type":"posts"},{"content":"En aquesta entrada, presento un document important elaborat per l’Escola de Doctorat de la UPC. Es tracta de l’estudi “Dades i aplicacions: anàlisi d’hàbits en gestió de dades i ús d’aplicacions entre els estudiants de doctorat del Campus Nord UPC”, basat en una enquesta i un focus group realitzats durant els mesos de juny i juliol.\nDades i aplicacions : anàlisi d’hàbits en gestió de dades i ús d’aplicacions entre els estudiants de doctorat del Campus Nord UPC # L’objectiu de l’estudi és doble:\nExplorar com els doctorands del Campus Nord de la UPC gestionen i utilitzen les dades de recerca. Identificar les aplicacions més utilitzades en l’elaboració de tesis doctorals. D’acord amb les conclusions de l’estudi, destacades a les pàgines 29-31 del document, es destaquen els següents punts:\nUn 21% dels enquestats indica estar informat sobre procediments específics per a la gestió de dades dins del seu àmbit de recerca. Les aplicacions més utilitzades pels doctorands són els gestors de referències bibliogràfiques, Overleaf i Grammarly. Al voltant d’un 35% dels participants en l’enquesta utilitza ChatGPT o altres aplicacions basades en intel·ligència artificial generativa. Aquest estudi proporciona informació valuosa sobre els patrons d’ús i les necessitats dels estudiants de doctorat en relació amb la gestió de dades i l’ús de tecnologies. La seva importància rau en la comprensió de com aquests elements s’integren en la pràctica acadèmica actual.\n","date":"29 de de gener de 2024","externalUrl":null,"permalink":"/ludo/posts/survey-estudiants-doctorat/","section":"Posts","summary":"En aquesta entrada, presento un document important elaborat per l’Escola de Doctorat de la UPC. Es tracta de l’estudi “Dades i aplicacions: anàlisi d’hàbits en gestió de dades i ús d’aplicacions entre els estudiants de doctorat del Campus Nord UPC”, basat en una enquesta i un focus group realitzats durant els mesos de juny i juliol.\n","title":"Estudi Sobre Hàbits dels Doctorands de la UPC en Gestió de Dades i Ús d'Aplicacions","type":"posts"},{"content":"","date":"1 de de gener de 2024","externalUrl":null,"permalink":"/ludo/tags/education/","section":"Tags","summary":"","title":"Education","type":"tags"},{"content":"%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Modern Education Timeline section XIX Century 1800s : Compulsory Education Laws : Schools and Classrooms reflect a factory-like structure : Goal to alphabetize the whole society : Numerical Grading introduced by William Farish : Standardized Testing emerges : Courses by mail section Early section XX Century Early 1900a : Modern School Movement begins : Dewey emphasizes experiential learning : Montessori promotes child individuality : Pressey Teaching Machine (1926) 1940s and 50s : Piaget introduces developmental stage theory : B.F. Skinner develops behaviorism : B.F. Skinner Bulilds GLIDER teaching machine : Radio Broadcasting of Lectures : IBM teaching software section Late XX Century 1960s : First applications of computers in education : Seymour Papert, LOGO Programming Language : Computer-Aided Instruction (CAI) : IBM 1500 Instructional System 1970s : PLATO Instructional System : Distance Universities (OU , UNED, \u0026hellip; ) : VCRs : Microcomputers , BASIC : Using computers become a subject of study\n%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Educational Technology Timeline section The Personal Computer Days 1982 : Computer-Aided Education : LOGO : Optical Mark Recognition in Paper Questionnaires 1991 : Multimedia Contents : CD-ROM : Content authoring tools 1996 : Early Web first online courses and campus section The Web goes Mainstream 2003 : Web 2.0 - Dynamic webpages : Modern Learning Management Systems (Moodle, Sakai, Blackboard) : Wikipedia, Blogs : Geographical Information Systems : Online Learning Tools (Forums, Quizzes, Tasks, workshop, Wikis, \u0026hellip;) : Smart whiteboards and Projectors : Clickers : Online Educational Content Standards (Scorm, IMS Cartridge, QTI) : First experiments Virtual Worlds in education (Seccond Life) 2007 : Social Networks : Educational Robotics (Lego Mindstorms, Arduino\u0026hellip;) : Online video contents and lessons (Youtube, Kahn Academy \u0026hellip;) : Personal Learning Environments (PLE\u0026rsquo;s) : LMS provided as a Cloud Computing Service : LMS Interoperability Webservices and IMS-LTI section EdTech is mainstream 2010 : Mobile Learning : Very Affordable Laptops: Netbooks /Chromebooks/ iPads : Startups investing in EdTech (Kahoot, Duolingo, Classdojo, Quizlet) : MOOCS 2015 : Learning Analytics : Gamification : Serious Games : Adaptive Learning\n%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Educational Technology new horizons Timeline Section The undiscovered country 2020 : Covid Pandemic : All studies go sudenly online : Massive adoption of Videconferencing : LMS markets shifting to Big tech 2022 : Generative AI : First encounters with LLMs (GPT-3, Early RAG Systems) : Image Generation Models (Stable Diffusion, Dall-E, Midjourney) 2023 : AI Goes Mainstream : ChatGPT enters by storm in education : Kahn Academy Launches Kahn amigo Section Things get interesting 2024 : You are here\n","date":"1 de de gener de 2024","externalUrl":null,"permalink":"/ludo/posts/edtech-timeline/","section":"Posts","summary":"%%{init: { ’logLevel’: ‘debug’, ’theme’: ‘default’ , ’themeVariables’: { ‘cScale0’: ‘#FFD700’, ‘cScaleLabel0’: ‘#000000’, ‘cScale1’: ‘#228B22’, ‘cScaleLabel1’: ‘#FFFFFF’, ‘cScale2’: ‘#00008B’, ‘cScaleLabel2’: ‘#FFFFFF’, } } }%% timeline title Modern Education Timeline section XIX Century 1800s : Compulsory Education Laws : Schools and Classrooms reflect a factory-like structure : Goal to alphabetize the whole society : Numerical Grading introduced by William Farish : Standardized Testing emerges : Courses by mail section Early section XX Century Early 1900a : Modern School Movement begins : Dewey emphasizes experiential learning : Montessori promotes child individuality : Pressey Teaching Machine (1926) 1940s and 50s : Piaget introduces developmental stage theory : B.F. Skinner develops behaviorism : B.F. Skinner Bulilds GLIDER teaching machine : Radio Broadcasting of Lectures : IBM teaching software section Late XX Century 1960s : First applications of computers in education : Seymour Papert, LOGO Programming Language : Computer-Aided Instruction (CAI) : IBM 1500 Instructional System 1970s : PLATO Instructional System : Distance Universities (OU , UNED, … ) : VCRs : Microcomputers , BASIC : Using computers become a subject of study\n","title":"Línies de temps d'EdTech","type":"posts"},{"content":" Taula de continguts # Contingut generat per IA Contingut de cercadors o bases de dades Gestionar les al·lucinacions Què són les al·lucinacions? Estratègies per mitigar les al·lucinacions Estratègies pràctiques i casos d\u0026rsquo;ús de xatbots com ChatGTP Consideracions de llengua: per obtenir millors resultats, usa l\u0026rsquo;anglès Posant el context en context. Format del text: un truc útil en converses amb LLM Fes servir formats de text com un ninja Altres usos dels formats de text i els xatbots. Els models de llenguatge grans (LLM) com ChatGPT són una nova família de tecnologies amb molt potencial, però també amb reptes propis. Cada cop fem servir més aquestes eines d’IA per a tot: des de preguntes senzilles fins a generar codi complex. Així que val la pena preguntar-se: realment entenem com treure’n el màxim rendiment?\nEn aquesta entrada repassarem algunes bones pràctiques clau per fer servir LLM. Mirarem la diferència entre contingut generat per IA i informació procedent de bases de dades o cercadors. També parlarem del problema de les “al·lucinacions”, quan el model et dona informació incorrecta o enganyosa. I explicarem per què la llengua amb què formules les preguntes influeix en la qualitat de les respostes.\nTant si només tens curiositat com si penses integrar LLM als teus projectes, aquesta guia pretén ajudar-te a usar aquestes eines de manera més efectiva.\nD\u0026rsquo;on treu les respostes el ChatGTP # Contingut generat per IA # Quan fas una pregunta a un model de llenguatge gran com ChatGPT, genera una resposta basada en un conjunt de dades immens amb què s’ha entrenat. Aquest conjunt inclou una gran varietat de fonts, com llocs web, llibres i articles. Però és important saber que aquests models no poden accedir a informació en temps real o actualitzada. El que obtens es basa en el que el model ha après fins a un moment determinat.\nA més, cal tenir present que la informació, tot i que sovint és acurada, es genera de manera estocàstica o aleatòria. Això vol dir que la possibilitat de fallada o error sempre hi és. És com una salsa secreta que a vegades dona sabor i d’altres et pot espatllar el plat.\nContingut de cercadors o bases de dades # En contrast amb el contingut generat per IA, la informació de cercadors, bases de dades o sistemes especialitzats com Wolfram Alpha prové de fonts factuals i sovint a temps real. Aquests plataformes solen oferir informació revisada per parells o verificada. A diferència dels models de llenguatge grans, et poden proporcionar les dades més recents disponibles, sigui l’última actualitat, recerca científica o dades estadístiques.\nImplicacions\nEntendre la diferència entre aquests dos tipus de contingut és crucial. Si busques informació actualitzada o altament factual, confiar només en un model de llenguatge gran potser no és la millor opció. Tot i que aquests models són increïblement versàtils i et donen respostes ràpides, no poden substituir la profunditat i la fiabilitat de la informació d’una base de dades o un cercador especialitzat. Ara bé, cal tenir en compte que accedir a aquestes fonts especialitzades sovint requereix habilitats tècniques, com entendre interfícies d’usuari específiques o llenguatges de programació. En canvi, els models de llenguatge grans ofereixen la comoditat d’obtenir informació a través de consultes senzilles en llenguatge natural. Saber quan fer servir cada opció t’ajudarà a aconseguir informació més acurada i fiable, sense perdre de vista la facilitat d’accés.\nGestionar les al·lucinacions # Què són les al·lucinacions? # En el context dels models de llenguatge grans (LLM) com ChatGPT, les al·lucinacions fan referència a la generació d’informació inexacta, exagerada o directament falsa. Per exemple, se sap que ChatGPT ha inventat respostes versemblants amb cites falses, fent que els usuaris es preguntessin si no havien topat amb un fenomen real. En alguns casos, fins i tot ha fabricat xifres financeres en notícies o ha generat jurisprudència inexistent en escrits legals.\nLes al·lucinacions sovint es produeixen per limitacions del conjunt d’entrenament o de la comprensió del context per part del model. El model no pot verificar la informació que genera; simplement produeix respostes basades en patrons de les dades amb què s’ha entrenat. Aquesta naturalesa estocàstica dels LLM implica que l’atzar i la possibilitat de fallada absoluta sempre hi són.\nEstratègies per mitigar les al·lucinacions # Ser conscient de la possible invenció: El primer pas és assumir que els LLM poden inventar contingut. Aquesta consciència et farà més crític amb les respostes que reps. Avalua la teva pròpia expertesa: La teva capacitat per jutjar la qualitat de la informació depèn del teu nivell de coneixement sobre el tema. Si hi tens experiència, detectaràs millor les inexactituds. Avaluació crítica i estratègia de validació: Avalua sempre la informació de manera crítica. Tingues una estratègia de validació: contrastar amb fonts fiables o consultar experts. Si alguna cosa sembla massa complexa o massa bona per ser veritat, probablement requereix més verificació. Comprova amb fonts fiables: Si tens dubtes, contrasta la informació amb plataformes de confiança com cercadors o la Viquipèdia. En el cas de codi generat, executa’l i prova’l sempre per assegurar que fa el que toca. Revisió humana: En àmbits crítics com els escrits legals, la revisió humana és cada cop més necessària. En algunes jurisdiccions fins i tot és obligatòria per garantir la fiabilitat del contingut generat per IA. Verificació ajustada al risc\nEls passos per verificar la informació han de ser proporcionals als riscos i a les implicacions d’usar-la. Per a aplicacions crítiques com el codi generat, són essencials proves exhaustives i revisió experta. Per a preguntes de coneixement general, pot ser suficient un contrast ràpid amb una font fiable.\nSi tens present què hi ha en joc, pots adaptar el teu procés de verificació i prendre les precaucions adequades. Aquest enfocament equilibrat et permet treure profit del que ofereixen els models de llenguatge grans, tot minimitzant-ne les limitacions i els riscos.\nEstratègies pràctiques i casos d\u0026rsquo;ús de xatbots com ChatGTP # Consideracions de llengua: per obtenir millors resultats, usa l\u0026rsquo;anglès # Els models de llenguatge grans com ChatGPT entenen i generen text en múltiples llengües. Tanmateix, per obtenir els millors resultats, fes servir l’anglès. Una part significativa de les dades d’entrenament és en anglès, i això fa que les respostes en aquesta llengua siguin més matisades i acurades. Això és especialment important per a qui no el té com a llengua materna.\nSi necessites contingut en una altra llengua, una estratègia útil és primer fer el prompt en anglès per obtenir la resposta més acurada. Un cop la tinguis, pots demanar a ChatGPT que la tradueixi a la llengua desitjada. Aquest procés en dos passos sovint dona resultats més fiables que demanar directament en una llengua no anglesa.\nPosant el context en context. # Quan xateges amb ChatGPT, el context inclou tota la conversa prèvia que has tingut —tant els teus prompts com les respostes del xatbot. El context és la informació que ajuda el model a entendre què li demanes. En models de llenguatge grans com ChatGPT, aquest context no es limita a la consulta actual. També inclou l’historial sencer de la conversa, la manera específica com formules les preguntes i fins i tot les respostes prèvies del model. Com que el model para atenció a aquest context ampliat, juntament amb el teu prompt actual i les dades del seu entrenament, pot proporcionar respostes més matisades i precises. Això vol dir que el model no només entén la teva pregunta immediata, sinó que també té en compte la conversa més àmplia per generar una resposta més conscient del context.\nExemple 1: Recepta i llista de la compra\nEl teu prompt: “Em pots donar una recepta de galetes de xocolata?” Resposta de ChatGPT: “I tant, aquí tens una recepta senzilla de galetes de xocolata…” El teu prompt de seguiment: “Genial, pots crear ara una llista de la compra basada en aquesta recepta?” Resposta de seguiment de ChatGPT: “És clar, basant-me en la recepta de galetes de xocolata, necessitaràs…” En aquest exemple, ChatGPT fa servir la seva pròpia recepta generada com a context per crear una llista de la compra rellevant. Això mostra com la sortida anterior del model informa l’acció següent, fent la interacció més fluida i personalitzada.\nExemple 2: Avaluació educativa\nEl teu prompt: Farem l’avaluació dels exercicis de l’alumnat. El problema a resoldre és: x + 4 = 7 La resposta correcta és x = 7 - 4 x = 3 Ara et proporcionaré diverses respostes d’estudiants. Compara la solució de l’estudiant amb la solució proposada i digues: A) si la resposta és correcta o no, B) si no és correcta, explica on s’ha equivocat l’estudiant i com ho pot arreglar. No donis la resposta correcta, només orientació per a l’estudiant. Ara digues només OK. Resposta de ChatGPT: “OK” En aquest exemple, has definit un context perquè ChatGPT avali respostes d’estudiants en relació amb una solució donada. El model farà servir aquest context per proporcionar feedback específic, ajudant l’alumnat a entendre on pot haver fallat sense desvetllar la resposta correcta. És una aplicació pràctica de com entendre el context pot conduir a interaccions educatives més efectives.\nEl teu prompt de seguiment 1: La resposta de l’estudiant 1 és: x = 7 + 4 x = 11 Resposta de seguiment de ChatGPT 1: A) La resposta és incorrecta. B) L’estudiant ha sumat 4 en lloc de restar-lo. Per corregir-ho, hauria de començar aïllant x_x_ en un costat de l’equació fent l’operació inversa a tots dos costats. El teu prompt de seguiment 2: La resposta de l’estudiant 2 és: x = 7 / 4 x = 1.75 Resposta de seguiment de ChatGPT 2: A) La resposta és incorrecta. B) L’estudiant ha dividit per 4 en lloc de restar-lo. Hauria de centrar-se aïllant x_x_ amb l’operació inversa correcta. El teu prompt de seguiment 3: La resposta de l’estudiant 3 és: x = 7 - 4 x = 3 Resposta de seguiment de ChatGPT 3: A) La resposta és correcta. B) L’estudiant ha aïllat correctament x_x_ restant 4 a tots dos costats de l’equació. En aquest exemple ampliat, ChatGPT fa servir el context proporcionat —la solució correcta de l’equació x+4=7_x_+4=7— per avaluar les respostes de l’alumnat. Després ofereix feedback específic segons com es compara cada resposta amb la solució correcta. Això demostra l’habilitat del model per usar el context i donar interaccions més matisades i útils.\nPerdre el context és perdre el sentit\nEntendre el context en les teves converses amb models de llenguatge grans com ChatGPT és crucial. Fa que els intercanvis siguin més precisos i matisats. El context ajuda el model a entendre millor el tema, el to i les teves necessitats concretes. Això és clau per evitar errors, especialment en entorns professionals o educatius. També permet interaccions més complexes, com debats detallats o fer servir el model per ensenyar, com hem vist als exemples.\nFont: Fishkin, Rand. “Vam analitzar milions de sessions d’usuari de ChatGPT: les visites han caigut un 29% des del maig, l’assistència en programació és el 30% de l’ús.” SparkToro. Consultat el 3 de setembre de 2023.\nCuriosament, la recerca mostra (vegeu la figura) que gairebé la meitat de les sessions de ChatGPT consten d’un sol prompt (34,5%) o de dos (14,5%). Això suggereix que un gran nombre d’usuaris no estan aprofitant les capacitats de consciència de context d’aquests models. Només aproximadament un 35% de les sessions tenen cinc prompts o més. En no mantenir converses més llargues, els usuaris perden els avantatges del context, com respostes més acurades i matisades, especialment en consultes o debats complexos.\nQuan interactues amb ChatGPT, la manera com dones format al text no és només una qüestió d’estètica o llegibilitat; també afecta la semàntica, el significat del que dius. Un bon format del text actua com una guia per al model, l’ajuda a entendre millor l’estructura i la intenció de la teva consulta. Això, al seu torn, permet que el model generi respostes més precises, organitzades i ajustades al que realment estàs demanant.\nFormat del text: un truc útil en converses amb LLM # Quan interactues amb ChatGPT, la manera com dones format al text no és només una qüestió d’estètica o llegibilitat; també afecta la semàntica, el significat darrere de les paraules. Un bon format del text actua com una guia per al model, l’ajuda a entendre millor l’estructura i la intenció de la teva consulta. Això, al seu torn, permet que el model generi respostes més precises, organitzades i ajustades al que realment estàs demanant.\nExemple 3: Fer servir vinyetes per a múltiples preguntes\nEl teu prompt:\n\u0026quot;Tell me about the benefits of: - Solar energy - Wind energy\u0026quot; Resposta de ChatGPT:\n\u0026quot;Certainly! - Solar energy is renewable, reduces electricity bills, and has low operating costs. - Wind energy is also renewable, cost-effective, and can be built on existing farms.\u0026quot; En aquest exemple, l’ús de vinyetes al prompt ajuda a separar clarament múltiples preguntes, fent més fàcil que ChatGPT les abordi una per una.\nFes servir formats de text com un ninja # Més enllà de les vinyetes i les llistes numerades, pots aprofitar formats de text més especialitzats, habituals en informàtica, per millorar les teves interaccions amb ChatGPT. Formats com CSV (Comma-Separated Values), JSON (JavaScript Object Notation) i XML (eXtensible Markup Language) es poden fer servir als teus prompts. Són especialment útils quan treballes amb consultes amb moltes dades o quan necessites que el model generi respostes fàcilment integrables en altres programes o bases de dades.\nPer exemple, si tens dades en un fitxer d’Excel que vols analitzar, pots exportar-les a CSV i fer servir aquestes dades en format CSV al teu prompt a ChatGPT. Això facilita que el model entengui la consulta i millora l’exactitud de les respostes. Fins i tot pots preguntar a ChatGTP: “Com puc exportar dades d’EXCEL a un fitxer CSV?”\nExemple 4:\nEl teu prompt:\n\u0026quot;Sort the following table by Age in ascending order. The table is in CSV format: Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist \u0026quot;\u0026quot; Resposta de ChatGPT:\n´´´ Name,Age,Occupation Ella,28,Artist Bob,29,Doctor Alice,34,Engineer David,39,Lawyer Charlie,45,Teacher ´´´ Una nota sobre el Markdown\nChatGPT entén el format de text Markdown, que li permet mostrar blocs de codi, taules, encapçalaments, enllaços i fins i tot imatges incrustades a la sortida. Però si fas servir un editor compatible amb Markdown per als teus documents —com Obsidian o Notion— vés amb compte amb certs codis Markdown que et podrien espatllar la presentació:\nCometes triples invertides (\u0026quot;`\u0026quot;): s’usen per a blocs de codi en Markdown. Si no vas amb compte, poden fer malbé el format a l’editor. Guions triples (\u0026quot;-\u0026quot;): sovint s’usen per a línies horitzontals, que podrien dividir el text sense voler. Coixinets (\u0026quot;#\u0026quot;, “##”, “###”): s’usen per a encapçalaments. Assegura’t d’usar-los intencionadament per estructurar el document. Asteriscs (\u0026quot;*\u0026quot;): s’usen per a vinyetes. Assegura’t que estiguin alineats correctament per mantenir l’estructura de la llista. Taules: les taules en Markdown poden ser útils però també traïdores. Assegura’t que les columnes s’alineïn correctament per facilitar la lectura.\nFer servir Markdown a la sortida de ChatGPT\nTornem a l’últim exemple: podem demanar a ChatGPT que doni la sortida en una taula Markdown:\nEl teu prompt:\nSort the following table by Age in ascending order. Format the result **in Markdown**. The table is in CSV format: Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist Resposta de ChatGPT:\n[TABLE]\nD’aquesta manera obtens les dades ordenades en una taula Markdown, que pots incloure directament als teus documents Markdown. A la pàgina de ChatGPT veuràs la taula renderitzada, però si la copies i l’enganxes en un editor de text pla obtindràs una cosa així:\n|Name|Age|Occupation| |---|---|---| |Ella|28|Artist| |Bob|29|Doctor| |Alice|34|Engineer| |David|39|Lawyer| |Charlie|45|Teacher| Que és una representació en Markdown d’una taula.\nAltres usos dels formats de text i els xatbots. # Exemple: fer que ChatGPT treballi amb gràfics\nEl teu prompt:\n“Hi ha algun llenguatge basat en text que es pugui fer servir per representar gràfics?”\nResposta de ChatGPT:\n“Sí, hi ha diversos llenguatges i formats basats en text que es poden utilitzar per representar gràfics. Sovint es fan servir conjuntament amb programari de visualització o d’anàlisi de gràfics. Aquí en tens alguns:\nLlenguatge DOT: El llenguatge DOT és un llenguatge de descripció de gràfics en text pla àmpliament utilitzat com a part del projecte Graphviz. És senzill i permet descriure gràfics, digràfics i els seus atributs. Exemple:\ndotCopy code digraph G { A -\u0026gt; B; B -\u0026gt; C; C -\u0026gt; A; } (… la resposta continua amb diversos formats: YAML, GML, JSON GRAPH… )\n“\nLa teva resposta de seguiment:\n“Genera un fitxer .dot que representi un gràfic de les 10 ciutats més poblades d’Europa, les seves connexions d’alta velocitat i el nombre de quilòmetres de cada connexió directa.”\nResposta de ChatGPT:\n“Aquí tens un fitxer .dot d’exemple que representa un gràfic de les 10 ciutats més poblades d’Europa, amb les seves connexions d’alta velocitat i les distàncies entre elles.”\ndigraph EuropeCities { \u0026quot;London\u0026quot; -\u0026gt; \u0026quot;Paris\u0026quot; [label=\u0026quot;450 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Madrid\u0026quot; [label=\u0026quot;1,050 km\u0026quot;]; \u0026quot;Madrid\u0026quot; -\u0026gt; \u0026quot;Rome\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Berlin\u0026quot; -\u0026gt; \u0026quot;Moscow\u0026quot; [label=\u0026quot;1,800 km\u0026quot;]; \u0026quot;Moscow\u0026quot; -\u0026gt; \u0026quot;Saint Petersburg\u0026quot; [label=\u0026quot;700 km\u0026quot;]; \u0026quot;Saint Petersburg\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Kiev\u0026quot; -\u0026gt; \u0026quot;Istanbul\u0026quot; [label=\u0026quot;1,300 km\u0026quot;]; \u0026quot;Istanbul\u0026quot; -\u0026gt; \u0026quot;Bucharest\u0026quot; [label=\u0026quot;600 km\u0026quot;]; \u0026quot;Bucharest\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;London\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,050 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Rome\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Madrid\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,900 km\u0026quot;]; \u0026quot;Berlin\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;1,300 km\u0026quot;]; \u0026quot;Moscow\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;870 km\u0026quot;]; \u0026quot;Kiev\u0026quot; -\u0026gt; \u0026quot;Bucharest\u0026quot; [label=\u0026quot;800 km\u0026quot;]; \u0026quot;Istanbul\u0026quot; -\u0026gt; \u0026quot;Moscow\u0026quot; [label=\u0026quot;2,200 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Madrid\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Paris\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; } Ara pots demanar coses com que ChatGPT trobi el camí òptim de Madrid a Sant Petersburg i que el ressalti al codi .dot. Amb dos prompts addicionals vaig aconseguir que GPT-4 creés el codi per a aquest gràfic. Curiosament, GPT-4 va fer servir l’algorisme de Dijstra per resoldre el problema. Et deixo la imatge resultant i t’ho poso com a repte.\nSi necessites saber com generar la imatge a partir del codi .dot… demana-ho a ChatGPT.\nÚltims prompts # Segons la recerca, més del 23% de l’ús de ChatGPT està relacionat amb l’educació. Tant docents com estudiants fan servir ChatGPT, i els nous xatbots avançats d’IA que estan arribant (com el Bard de Google, Open Assistant, Llama 2 de Meta, etc.) estan trobant bons casos d’ús per ajudar en les tasques diàries d’ensenyament i aprenentatge. Una bona comprensió d’aquestes eines, de les seves capacitats i limitacions, és crucial per a un ús responsable i ètic, especialment en entorns educatius.\nA més de tot el que hem tractat fins ara en aquest article, hi ha uns quants punts finals que val la pena considerar:\nEines com ChatGPT han vingut per quedar-se; no són una moda passatgera. Representen una nova era de tecnologia d’internet i programari, i el seu impacte serà monumental. Si ho comparem amb les tecnologies web, ara estem en l’equivalent de finals dels noranta, trastejant amb pàgines estàtiques. La tecnologia millorarà exponencialment en els propers cinc anys, i l’impacte en les nostres vides serà tan transformador com la combinació de PC, internet i telèfons intel·ligents. L’ús sofisticat de ChatGPT i altres models de llenguatge grans (LLM) és cada cop més difícil de detectar. La recerca actual suggereix que és poc probable que desenvolupem aviat un detector fiable de “contingut generat per IA”. Qui assegura oferir eines així, bàsicament ven oli de serp. Al juny de 2023, ChatGPT va introduir una funció útil: la possibilitat de compartir un enllaç permanent d’una conversa. Això és molt valuós perquè ens permet mostrar la feina feta amb el xatbot per produir contingut específic. Per exemple, aquest mateix document es va desenvolupar amb ChatGPT en una conversa que va durar diverses hores. Proporciono l’enllaç com a mostra de com d’efectivament es pot fer servir un xatbot per produir feina de qualitat. O com a mínim tan bona com aquest article. Gràcies per llegir fins al final.\n","date":"1 de de setembre de 2023","externalUrl":null,"permalink":"/ludo/posts/good_bad_alucinated/","section":"Posts","summary":"Taula de continguts # Contingut generat per IA Contingut de cercadors o bases de dades Gestionar les al·lucinacions Què són les al·lucinacions? Estratègies per mitigar les al·lucinacions Estratègies pràctiques i casos d’ús de xatbots com ChatGTP Consideracions de llengua: per obtenir millors resultats, usa l’anglès Posant el context en context. Format del text: un truc útil en converses amb LLM Fes servir formats de text com un ninja Altres usos dels formats de text i els xatbots. Els models de llenguatge grans (LLM) com ChatGPT són una nova família de tecnologies amb molt potencial, però també amb reptes propis. Cada cop fem servir més aquestes eines d’IA per a tot: des de preguntes senzilles fins a generar codi complex. Així que val la pena preguntar-se: realment entenem com treure’n el màxim rendiment?\n","title":"ChatGPT en la pràctica: estratègies per a interaccions òptimes","type":"posts"},{"content":"","date":"1 de de setembre de 2023","externalUrl":null,"permalink":"/ludo/tags/chatgtp/","section":"Tags","summary":"","title":"Chatgtp","type":"tags"},{"content":"","date":"1 de de setembre de 2023","externalUrl":null,"permalink":"/ludo/tags/course/","section":"Tags","summary":"","title":"Course","type":"tags"},{"content":"","date":"1 de de setembre de 2023","externalUrl":null,"permalink":"/ludo/tags/llm/","section":"Tags","summary":"","title":"Llm","type":"tags"},{"content":" Table Of Contents # 1 Embeddings 1.2 Practical Applications of Embeddings 2 The context in LLMs based on transformers** 2.1 Context as Ad Hoc Training 3 Self-Referential Context and Programmability in LLMs**_ References Generative AI models, especially Large Language Models (LLMs) like GPT and its successors, have become a pivotal force in the advancement of artificial intelligence. While these models have gained prominence for their capabilities in natural language processing (NLP)—including tasks such as sentiment analysis, machine translation, and content generation—their applications extend beyond the realm of NLP [11].\nOne of the key objectives of this paper is to explore the specific features and architecture of generative AI models that make them a foundational technology for the development of Smart Learning Applications. This exploration serves as a part of a broader inquiry into the capabilities, limitations, and potential applications of these models. While the growing field of AI offers options for training and fine-tuning models, thanks to open-source initiatives like Lama 2 and platforms like OpenAssistant, this paper takes a different angle. We seek to understand how the existing functionalities of readily available models can be effectively utilized to develop Smart Learning Applications without requiring extensive modifications.\nBy examining critical components such as embeddings and the model’s ability to understand context, this paper aims to provide a nuanced understanding that can guide the development of educational technology and open up new avenues for innovation.\n1 Embeddings # At the heart of LLMs is the concept of “embedding.” In NLP, embeddings serve the purpose of transforming linguistic entities—whether they are words, phrases, or entire documents—into numerical vectors of fixed dimensions. Mikolov et al. introduced the Word2Vec model, a popular method for generating word embeddings, which has been foundational in the development of embeddings in LLMs [12]. This transformation is pivotal as it allows textual data to be represented in a manner that is both computationally efficient and semantically rich. Through the process of embedding, LLMs are equipped to discern intricate patterns and relationships in language.\n1.2 Practical Applications of Embeddings # LLMs utilize embeddings for a myriad of tasks. From sentiment analysis and machine translation to the generation of content, the capabilities of LLMs are vast. The inherent numerical nature of embeddings facilitates operations that can deduce relationships, draw analogies, and discern nuances in language. In the realm of machine translation, embeddings have been instrumental in identifying equivalent terms across languages, ensuring that translations maintain their intended meaning and accuracy [13].\nA notable example of the practical application of embeddings is provided by ChatPDF.com, a turnkey system that allows for the embedding of entire PDFs, spanning hundreds of pages. This system enables a chat interface with the document, offering an innovative approach to document interaction. ChatPDF.com also provides an API for developers, making it easier to integrate this embedding-friendly model into various applications [14].\nFig 2. ChatPDF enables a chat conversation with the contents of a document. In the example a conversation with the paper “Attention is all you need”\n2 The context in LLMs based on transformers** # In the realm of LLMs, particularly models like GPT-4 and BERT based on the transformer architecture, the term “context” denotes the immediate surrounding information that the model leverages to generate a response [15, 16]. For GPT-4, this context is derived from the preceding text in a conversation or document. Such context is indispensable as it provides the model with insights into the ongoing topic, the tone and style of the conversation, and any specific instructions or constraints.\nAn essential mechanism that enables this contextual understanding is the “attention” mechanism. In transformer architectures, attention allows the model to weigh different parts of the input text differently. This means that when generating a response, the model doesn’t treat all words or tokens in the context equally. Instead, it “attends” more to certain parts that are more relevant to the query or prompt at hand. For example, if the conversation is about climate change, words like “emissions,” “carbon,” and “temperature” might receive higher attention weights. This attention mechanism works in tandem with the context to produce more accurate and contextually appropriate responses.\nHowever, the understanding of context in LLMs extends beyond just the immediate preceding text. Given the vast datasets these models are trained on, they possess a comprehensive understanding of a multitude of topics. When presented with a specific context, the model delves into this extensive knowledge base, honing in on the relevant segments to craft an appropriate response.\n2.1 Context as Ad Hoc Training # The proposition of utilizing context as a form of ad hoc training presents a novel approach to interacting with LLMs. Howard and Ruder introduced the idea of fine-tuning pre-trained models for specific tasks, which is somewhat related to the idea of ad hoc training [17].\nBy furnishing an LLM with a distinct context or a set of instructions, users have the capability to “guide” the model’s responses in real-time. This method of providing contextual guidance effectively acts as instantaneous training, molding the model’s behavior without necessitating alterations to its foundational architecture or weights.\nIn our exploration of the role of context in language models, we present two contrasting figures to highlight the difference that context can make in the responses generated by a chatbot.\nFig. 3 depicts a scenario where a chatbot, trained on data up to 2021, is asked to write a two-paragraph essay about the 2023 FIFA Women’s World Cup from the perspective of a 10-year-old girl. In this case, the chatbot lacks the specific context of the event and therefore produces a response based on its pre-2021 training, lacking in specific details about the event.\nFig. 3: A screenshot of a chatbot interaction where the chatbot, trained on data up to 2021, is asked to write a two-paragraph essay about the 2023 FIFA Women’s World Cup from the perspective of a 10-year-old girl. The chatbot’s response lacks specific details about the event.\nOn the other hand, Fig. 4 shows the same chatbot, but this time it is provided with context in the form of a text snippet from the Wikipedia page about the 2023 FIFA Women’s World Cup. When asked the same question, the chatbot is able to generate a detailed response, discussing the sports event, the results, participating countries, and individuals involved, as if it had been specifically trained on that information.\nFig. 4: A screenshot of the same chatbot interaction, but this time the chatbot is provided with a text snippet from the Wikipedia page about the 2023 FIFA Women’s World Cup. When asked the same question, the chatbot generates a detailed response, discussing the sports event, the results, participating countries, and individuals involved, showcasing the power of contextual information.\n3 Self-Referential Context and Programmability in LLMs**_ # An often-overlooked aspect of context in LLMs is the self-referential nature of their responses. As an LLM generates a response, that output becomes part of the ongoing context for subsequent interactions. This dynamic feature enables a unique form of programmability and direction-following in LLMs.\nOne aspect of context in advanced Language Learning Models (LLMs) like GPT-4 and GPT-3.5 that warrants closer attention is the self-referential nature of their generated responses. While earlier models in the GPT series have some ability to use context within a single interaction, this capability has been significantly enhanced in more recent versions. Advanced LLMs can incorporate their own generated text into the context for future interactions as represented in Fig 5., meaning that as the model generates a response, that newly generated content doesn’t just serve as an answer to a query; it also becomes part of the evolving context that informs subsequent responses.\nFig. 5: The generated response is incorporated into the ongoing context, influencing the LLM’s attention mechanism as the answer continues to be generated in a recursive manner.\nThis feature introduces a level of dynamic context updating, allowing the model to follow directions or carry out tasks in a more nuanced manner. For example, if an advanced LLM like GPT-4 or GPT-3.5 is asked to generate a recipe and then create a shopping list based on that recipe, the model can use the ingredients listed in its own generated recipe as context for compiling the shopping list. This not only shows the model’s ability to understand and maintain context but also highlights its capability to be “programmable” within the scope of a single interaction. This self-referential context updating makes advanced LLMs versatile tools for more complex, multi-step tasks and interactions.\nTo illustrate this in fee Fig 6 we asked GPT-4 to generate a recipe for spaghetti bolognese and then create a shopping list based on that recipe. The model first listed the ingredients and steps for the dish and then used this information to compile a shopping list. This shows that the model can use its own generated text as context for a subsequent task within the same interaction.\nThis example highlights a straightforward but important feature: the model’s ability to update its context dynamically. The shopping list isn’t just a separate output; it’s directly related to the recipe the model itself provided. This demonstrates that language models can follow directions from their own generated text, allowing for more nuanced and context-aware interactions.\nFig. 6: A screenshot of a chatbot interaction where the user asks GPT4 for a spaghetti bolognese recipe followed by a shopping list. The chatbot first generates the recipe and then uses it as context to create a shopping list, demonstrating the concept of Dynamic Context Updating.\nIn an educational setting, the self-referential context can be leveraged to enable a chatbot to review, grade, or provide feedback on student exercises. Typically, when presented with the text of an exercise and a student’s solution, both GPT-3.5 and GPT-4 tend to perform poorly in grading and offering feedback. However, the performance improves significantly when the chatbot is instructed to first solve the problem itself, then compare the student’s solution with its own generated solution, and finally provide a grade and feedback. The results using this approach are markedly better.\nprompt = f\u0026quot;\u0026quot;\u0026quot; Determine if the student's solution is correct or not. Question: I'm building a solar power installation and I need \\\\ help working out the financials. - Land costs $100 / square foot - I can buy solar panels for $250 / square foot - I negotiated a contract for maintenance that will cost \\\\ me a flat $100k per year, and an additional $10 / square \\\\ foot What is the total cost for the first year of operations as a function of the number of square feet. Student's Solution: Let x be the size of the installation in square feet. Costs: 1. Land cost: 100x 2. Solar panel cost: 250x 3. Maintenance cost: 100,000 + 100x Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000 \u0026quot;\u0026quot;\u0026quot; response = get_completion(prompt) print(response) The code we shown above presents an example of prompt asking the chatbot to determine if a student’s solution is correct or not. The results will be poor, using this approach. But in the next fragment of code we can see how instructing carefully in the prompt to first solve de problem and then consider the students solution the results will be much improved (Source OpenAI Cookbook[18]).\nprompt = f\u0026quot;\u0026quot;\u0026quot; Your task is to determine if the student's solution \\\\ is correct or not. To solve the problem do the following: - First, work out your own solution to the problem. - Then compare your solution to the student's solution \\\\ and evaluate if the student's solution is correct or not. Don't decide if the student's solution is correct until you have done the problem yourself. Use the following format: Question: --- question here --- Student's solution: --- student's solution here --- Actual solution: --- steps to work out the solution and your solution here --- Is the student's solution the same as actual solution \\\\ just calculated: --- yes or no --- Student grade: --- correct or incorrect --- Question: --- I'm building a solar power installation and I need help \\ working out the financials. - Land costs $100 / square foot - I can buy solar panels for $250 / square foot - I negotiated a contract for maintenance that will cost \\ me a flat $100k per year, and an additional $10 / square \\ foot What is the total cost for the first year of operations \\ as a function of the number of square feet. --- Student's solution: --- Let x be the size of the installation in square feet. Costs: 1. Land cost: 100x 2. Solar panel cost: 250x 3. Maintenance cost: 100,000 + 100x Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000 --- Actual solution: \u0026quot;\u0026quot;\u0026quot; response = get_completion(prompt) print(response) 4 The Evolution of Contextual Understanding: The System Message.\nIn March 2023, OpenAI introduced a groundbreaking feature in the API of their GPT 3.5 and GPT 4 models: the “system message” [18]. Prior to this update, the API allowed for the model to receive prompts and context through an array of messages categorized as either “user” (messages prompted by the user) or “agent” (previous responses generated by the model). The system message, however, is designed to be the first message in this array.\nThe system message serves a critical function: it outlines the role and behavioral parameters expected of the LLM. This allows for a more nuanced and directed interaction with the model, as it provides the LLM with guidelines on how to respond to subsequent prompts.\nThe introduction of the system message significantly enhances the user’s ability to guide the model’s behavior in real-time, effectively serving as an extension of the ad hoc training concept discussed earlier. It offers users a more refined tool for customizing the model’s responses, thereby elevating the level of interaction to a more dynamic and tailored experience.\nThe following fragment shows Python code which demonstrates how to use the system message feature to set the behavior of the model as a Socratic mentor.\nimport openai ... # Define the system message to set the behavior of the model as a Socratic mentor system_message = { 'role': 'system', 'content': 'You are a Socratic mentor. Engage in thoughtful dialogue,ask probing questions, and guide the user to deeper understanding.' } # Define a user message user_message1 = { 'role': 'user', 'content': 'What is the meaning of life?' } # Define an agent message (a previous response from the model, if any) agent_message1 = { 'role': 'agent', 'content': 'The meaning of life is a deeply philosophical question. What do you think it is?' } # Define another user message user_message2 = { 'role': 'user', 'content': 'I think it is to find happiness.' } # Combine all messages into a list messages = [system_message, user_message1, agent_message1, user_message2] # Make an API call to GPT-4 response = openai.Completion.create( model=\u0026quot;gpt-4\u0026quot;, messages=messages ) This code snippet illustrates how the system message can be used to guide the model’s behavior, making the interaction more dynamic and tailored to individual needs.\nReferences # [12] Mikolov, T., et al. “Efficient estimation of word representations in vector space.” arXiv preprint arXiv:1301.3781 (2013).\n[13] Vaswani, A., et al. “Attention is all you need.” Advances in neural information processing systems. 2017.\n[14] API Backend Documentation.\u0026quot; ChatPDF.com. Accessed August 25, 2023. **https://www.chatpdf.com/docs/api/backend**.\n[15] Devlin, J., et al. “BERT: Pre-training of deep bidirectional transformers for language understanding.” arXiv preprint arXiv:1810.04805 (2018).\n[16] Howard, J., and Ruder, S. “Universal language model fine-tuning for text classification.” arXiv preprint arXiv:1801.06146 (2018).\n[17] Suárez, Diego. “How to write ‘System’ Instructions for OpenAI’s GPT-4 Chat API.” Rootstrap Blog, April 25, 2023. Rootstrap Blog.\n[18] OpenAI. “OpenAI Cookbook: Examples and guides for using the OpenAI API.” GitHub repository. Last modified August 22, 2023. https://github.com/openai/openai-cookbook. Accessed August 23, 2023\n","date":"31 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/posts/embeddings/","section":"Posts","summary":"Table Of Contents # 1 Embeddings 1.2 Practical Applications of Embeddings 2 The context in LLMs based on transformers** 2.1 Context as Ad Hoc Training 3 Self-Referential Context and Programmability in LLMs**_ References Generative AI models, especially Large Language Models (LLMs) like GPT and its successors, have become a pivotal force in the advancement of artificial intelligence. While these models have gained prominence for their capabilities in natural language processing (NLP)—including tasks such as sentiment analysis, machine translation, and content generation—their applications extend beyond the realm of NLP [11].\n","title":"Embeddings, Context uses and Self Referencing in LLMS","type":"posts"},{"content":"Els oceans com a eines per capturar carboni\nEls oceans són una esponja de carboni massiva, absorbint un quart de les emissions globals de CO2. Això els converteix en una eina potent per combatre el canvi climàtic. Una empresa anomenada Equatic està provant una idea audaç per eliminar el diòxid de carboni de l’atmosfera: extreure’l directament de l’oceà. L’empresa està provant aquesta idea amb una barcada a Los Angeles, que elimina 100 kg de CO2 de l’aigua de mar cada dia.\nEl procés de captura directa d’oceà\nEl procés de Captura funciona com una gran planta de dessalinització. Continuament atrau aigua de mar, separant l'1% d’aquesta per convertir-la en salmorra concentrada, que l’empresa posa a través d’una màquina d’electròlisi patentada. L’electròlisi, un procés utilitzat en diverses indústries, inclòs la dessalinització, envia aigua a través d’una sèrie de membranes electrificades. Cada membrana separa diferents molècules de l’aigua, que formen solucions àcides i alcalines. L’àcid es posa a l’aigua de l’oceà restant, on desencadena una reacció amb ions bicarbonat, fent que el CO2 surti en forma de bombolles. Després, l’empresa afegeix l’alcalí a l’aigua per neutralitzar-la abans de deixar-la anar.\nEls premis X-Prize i la seva influència en la captura de carboni\nLes empreses com Equatic i Captura sorgeixen en part gràcies als premis X-Prize, que són competicions internacionals que premien solucions innovadores a problemes globals. Aquests premis són efectius perquè incentiven la investigació i el desenvolupament en àrees clau, com ara la captura de carboni, i atreuen l’atenció dels inversors i del públic en general. Els premis X-Prize han estat una força impulsora darrere de molts avenços tecnològics i han ajudat a accelerar el progrés en àrees com la captura de carboni, la salut global i l’exploració espacial.\nAvantatges i desavantatges de la captura directa d’oceà\nComparat amb la captura d’aire, la captura directa d’oceà (DOC) és un territori menys explorat. Però Equatic, Captura i altres estan intentant demostrar la viabilitat del concepte amb el suport de la Iniciativa Chan Zuckerberg, la Fundació Gates, empreses de petroli i gas, i l’Agència de Projectes de Recerca Avançada d’Energia (ARPA-E). Extreure carboni de l’aigua de l’oceà, on està present a una concentració 150 vegades més alta que a l’atmosfera, és més eficient que la captura d’aire.\nTecnologies alternatives de captura directa d’oceà\nMentrestant, al MIT, el professor d’enginyeria química T. Alan Hatton, el professor d’enginyeria mecànica Kripa Varanasi i els seus col·legues han ideat una tecnologia DOC que minimitza l’ús de membranes, fent-la encara més senzilla i barata que l’electròlisi. El sistema de “flux reactiu” envia aigua a través de dues cel·les electroquímiques en tàndem. En la primera cel·la, un elèctrode de bismut allibera protons que separen el CO2 dels carbonats i bicarbonats de l’aigua, mentre que un elèctrode de clorur d’argent allibera ions de clorur per equilibrar la càrrega.\nConsideracions ambientals\nA mesura que les empreses i els inversors avancen amb els projectes de DOC, les organitzacions ambientals demanen precaució. Serà important que les tecnologies de retirada de carboni oceànic avancin de manera responsable i “no posin en perill la salut dels ecosistemes oceànics ni dels qui en depenen”. La crisi climàtica és tan clara i greu que necessitem la retirada de carboni basada en l’oceà. Però hi ha formes naturals i provades de fer-ho, com la conservació i restauració de les praderies marines o el creixement de les algues. Les tecnologies de DOC electroquímiques simplement tenen massa incògnites per gastar pressupostos de recerca limitats, donat el temps limitat que tenim.\nAquesta entrada de blog ha estat inspirada per l’article “Using The Oceans To Help Capture Carbon” de Prachi Patel, publicat a IEEE Spectrum. https://spectrum.ieee.org/direct-ocean-carbon-capture\nChatGTP m’ha ajudat en la redacció i a fer bona part del resum. Aquí teniu la conversa de la creació. GPT-4 + Plugin Webpilot https://chat.openai.com/share/5931adec-3d6b-4c91-add2-bdb045696cb2\n","date":"16 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/posts/post-1-1/","section":"Posts","summary":"Els oceans com a eines per capturar carboni\nEls oceans són una esponja de carboni massiva, absorbint un quart de les emissions globals de CO2. Això els converteix en una eina potent per combatre el canvi climàtic. Una empresa anomenada Equatic està provant una idea audaç per eliminar el diòxid de carboni de l’atmosfera: extreure’l directament de l’oceà. L’empresa està provant aquesta idea amb una barcada a Los Angeles, que elimina 100 kg de CO2 de l’aigua de mar cada dia.\n","title":"Captura Directa de CO2 a l'Oceà: Una Nova Eina per Combatre el Canvi Climàtic","type":"posts"},{"content":"","date":"16 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/tags/sostenibilitat/","section":"Tags","summary":"","title":"Sostenibilitat","type":"tags"},{"content":"","date":"2 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/tags/ethics/","section":"Tags","summary":"","title":"Ethics","type":"tags"},{"content":"Organitzacions vinculades al programari lliure com Creative Commons, Github, Huggingface han fet public un document en el que fan suggeriments sobre com millorar el AI Act per protegir i fomentar el desenvolupament de programari lliure.\nEl document és a https://huggingface.co/blog/assets/eu_ai_act_oss/supporting_OS_in_the_AIAct.pdf%5D i aquí teniu un resum executiu*:\nSuport per al Open Source i la Open Science al EU AI Act # L’open source, la recerca i desenvolupament sense ànim de lucre i acadèmics juguen un paper essencial en l’ecosistema d’intel·ligència artificial (IA). Continuar donant suport i fomentant aquest ecosistema obert serà clau per garantir que la tecnologia serveixi a tots els ciutadans de la UE en dos comptes principals: ● Primer, els valors de la recerca sòlida, la reproductibilitat i la transparència fomentats per la ciència oberta són fonamentals per al desenvolupament de sistemes d’IA segurs i responsables. ● Segon, el desenvolupament d’open source pot permetre la competència i la innovació per part de nous entrants i actors més petits, inclosos a la UE. L’AI Act té la promesa de marcar un precedent global en la regulació de la IA per abordar els seus riscos mentre s’encoratja la innovació. Donant suport a l’aproximació creixent de l’ecosistema obert cap a la IA, la regulació té una oportunitat important per aprofundir en aquest objectiu a través d’una major transparència i col·laboració entre les parts interessades. Desafortunadament, les propostes actuals amenacen de crear barreres impracticables i desavantatges per als contribuïdors d’aquest ecosistema obert. Les organitzacions signants representen tant les parts interessades comercials com sense ànim de lucre en l’ecosistema d’IA de codi obert. A continuació, fem 5 suggeriments concrets per a garantir que l’AI Act funcioni per al codi obert:\nDefinir clarament els components de la IA Aclarir que el desenvolupament col·laboratiu de components d’IA de codi obert i posar-los a disposició en repositoris públics no sotmet els desenvolupadors als requeriments de l’AI Act, millorant i ampliant els Recitals 12a-c del text del Parlament i l’Article 2(5e). Donar suport a la coordinació de l’Oficina d’IA i a la governança inclusiva amb l’ecosistema de codi obert, basant-se en el text del Parlament. Assegurar que l’excepció de R\u0026amp;D és pràctica i efectiva, permetent assajos limitats en condicions reals, combinant aspectes de l’aproximació del Consell i una versió modificada de l’Article 2(5d) del Parlament. Establir requisits proporcionals per als “model base”, reconeixent i tractant de manera distinta diferents usos i modalitats de desenvolupament, incloent els enfocaments de codi obert, adaptant l’Article 28b del Parlament. (* traduït amb IA) ","date":"2 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/posts/open-source-normativa-eu-document/","section":"Posts","summary":"Organitzacions vinculades al programari lliure com Creative Commons, Github, Huggingface han fet public un document en el que fan suggeriments sobre com millorar el AI Act per protegir i fomentar el desenvolupament de programari lliure.\n","title":"Organitzacions vinculades al programari lliure demanen a la UE que revisin el AI Act per protegir el programari lliure","type":"posts"},{"content":"","date":"1 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/tags/enigma/","section":"Tags","summary":"","title":"Enigma","type":"tags"},{"content":"","date":"1 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/tags/hist%C3%B2ria-de-linform%C3%A0tica/","section":"Tags","summary":"","title":"Història-De-Linformàtica","type":"tags"},{"content":"La màquina Enigma, l’enginy de criptografia que va jugar un paper clau durant la Segona Guerra Mundial, és un símbol potent del nostre passat tecnològic. Aquesta màquina, desenvolupada per la Alemanya nazi per xifrar els seus missatges, era considerada inescrutable fins a l’arribada del matemàtic britànic Alan Turing, qui va ser capaç de desxifrar el seu codi el 1943.\nUn model original d’Enigma, concretament la K723, és la joia de la corona del Batalló de Transmissions IV/22, conservada en perfecte estat de funcionament des del 2007. Aquesta peça única està exposada al costat d’altres relíquies històriques de les telecomunicacions militars a la caserna del Bruc, a Pedralbes.\nL’origen d’Enigma remunta al 1923, quan va ser fabricada per una companyia de Berlín. La màquina va ser originalment desenvolupada per a un ús comercial, però aviat l’exèrcit alemany la va adoptar per transmetre missatges amb màxima seguretat. El 1936, Adolf Hitler va enviar un lot de màquines Enigma a Franco com a contribució al bàndol colpista, convertint la Guerra Civil Espanyola en el primer camp de proves bèl·lic de les màquines Enigma.\nDesprés de la guerra, aquestes màquines van ser relegades a magatzems, oblidades fins a fa uns anys quan van ser redescobertes i convertides en peces de museu. La K723 del Bruc és una de les últimes Enigmas que van arribar a Espanya, probablement durant les etapes finals de la Guerra Civil.\nTot i que les màquines Enigma enviades a Franco no eren tan avançades com les que es van utilitzar durant la Segona Guerra Mundial, encara eren prou potents com per oferir més de 1,8 milions de combinacions de lletres possibles. Les màquines Enigma utilitzades pels nazis en la Segona Guerra Mundial eren encara més sofisticades, amb fins a cinc rotors intercanviables que ampliaven enormement les opcions de xifrat.\nLa història de la màquina Enigma i la seva desxifració per Alan Turing no és només una part fascinant de la història de la informàtica, sinó també un recordatori de com la criptografia ha evolucionat al llarg del temps. Avui en dia, en un món dominat per Google, Microsoft i altres gegants tecnològics, la importància de la seguretat de la informació i la criptografia continua sent tan pertinent com ho era durant els dies d’Enigma.\nEn la era de la intel·ligència artificial, la criptografia és una eina vital per garantir la privacitat i la seguretat de les nostres dades. I com a historiadors de la informàtica, és vital que recordem les lliçons del passat per tal de comprendre millor el present i preparar-nos per al futur. Com va dir l’escriptor i filòsof George Santayana, “Aquellos que no pueden recordar el pasado están condenados a repetirlo”. Això és especialment cert en la informàtica i en la seguretat de la informació, on les lliçons del passat poden ajudar-nos a navegar per un futur incert.\nUna forma divertida de saber-ne més és la Novel·la Criptonomicon de Neal Stepehenson (Stephenson, N. (2003). Criptonomicón. (M. Barceló, Proleg). Ediciones B - Nova. )\n","date":"1 de d’agost de 2023","externalUrl":null,"permalink":"/ludo/posts/enigma-a-l-costat-del-campus-nord/","section":"Posts","summary":"La màquina Enigma, l’enginy de criptografia que va jugar un paper clau durant la Segona Guerra Mundial, és un símbol potent del nostre passat tecnològic. Aquesta màquina, desenvolupada per la Alemanya nazi per xifrar els seus missatges, era considerada inescrutable fins a l’arribada del matemàtic britànic Alan Turing, qui va ser capaç de desxifrar el seu codi el 1943.\n","title":"Una Enigma de la Guerra Civil, es conserva al costat del Campus Nord de la UPC","type":"posts"},{"content":"Ho vaig trobar a l\u0026rsquo;antic Twitter i em va semblar molt encertat.\n","date":"17 de de juliol de 2023","externalUrl":null,"permalink":"/ludo/posts/ai-panic/","section":"Posts","summary":"Ho vaig trobar a l’antic Twitter i em va semblar molt encertat.\n","title":"Pànic per la IA","type":"posts"},{"content":"L’article “The Tech Revolution: 10 Predictions about AI, Internet, and Possibly Our World in 3 Years” de David Poblador i Garcia presenta una sèrie de prediccions sobre com l’IA i internet podrien transformar el nostre món en els propers tres anys. Aquí teniu un resum de les seves prediccions, que val a dir comparteixo:\nEls Models de Llenguatge Grans (LLMs) es convertiran en l’interfície definitiva per a la interacció amb el coneixement, fent que els motors de cerca convencionals siguin gairebé obsolets.\nLa majoria dels LLMs funcionaran sense connexió, alliberant-nos de la necessitat de connectivitat constant a internet.\nEls models d’IA generativa es convertiran en especialistes, proporcionant coneixements profunds en dominis específics.\nEl model de càlcul client-servidor tradicional es retirarà a favor de dispositius més potents i LLMs més avançats.\nL’indústria multimilionària de la publicitat en línia haurà de trobar una manera de passar a l’offline o arriscar-se a quedar obsoleta.\nLes tasques complexes com les reserves d’hotels, les reserves de restaurants o l’organització d’enviaments es realitzaran interactuant amb APIs millorades que col·laboren amb els models d’IA que s’executen localment.\nEmergirà un mercat extens per a les integracions d’IA.\nAmb la disminució de la importància dels llocs web corporatius, internet es transformarà en un espai més personal per a l’expressió.\nEls fabricants de dispositius i els constructors de sistemes operatius es trobaran en la primera línia d’aquesta nova batalla.\nEls creadors de continguts trobaran noves vies en l’era de l’IA, enriquint els LLMs amb els seus coneixements especialitzats.\nL’autor conclou que aquesta transformació podria ocórrer més ràpidament del que inicialment es pensava, possiblement en menys de tres anys.\nTinc més enllaços a articles i fonts sobre IA aquí\n","date":"10 de de juny de 2023","externalUrl":null,"permalink":"/ludo/posts/10-prediccions-de-david-poblador/","section":"Posts","summary":"L’article “The Tech Revolution: 10 Predictions about AI, Internet, and Possibly Our World in 3 Years” de David Poblador i Garcia presenta una sèrie de prediccions sobre com l’IA i internet podrien transformar el nostre món en els propers tres anys. Aquí teniu un resum de les seves prediccions, que val a dir comparteixo:\n","title":"10 prediccions sobre IA i Internet que comparteixo","type":"posts"},{"content":"","date":"10 de de juny de 2023","externalUrl":null,"permalink":"/ludo/tags/pon%C3%A9ncias/","section":"Tags","summary":"","title":"Ponéncias","type":"tags"},{"content":"","date":"10 de de juny de 2023","externalUrl":null,"permalink":"/ludo/tags/videos/","section":"Tags","summary":"","title":"Videos","type":"tags"},{"content":"Revistes d\u0026rsquo;educació en enginyeria\n","date":"1 de de juny de 2023","externalUrl":null,"permalink":"/ludo/posts/donde-publicar-investigaci%C3%B3n-en-engineering-education/","section":"Posts","summary":"Revistes d’educació en enginyeria\n","title":"On publicar recerca en educació en enginyeria","type":"posts"},{"content":"","date":"1 de de juny de 2023","externalUrl":null,"permalink":"/ludo/tags/research/","section":"Tags","summary":"","title":"Research","type":"tags"},{"content":"","date":"19 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/opini%C3%B3n/","section":"Tags","summary":"","title":"Opinión","type":"tags"},{"content":"Després de dècades fent servir serveis gratuïts en línia, i veure els resultats de ser el producte i no el client (Vegeu Soshana Zuboff “The Age of Survailance Capitalism” , o el documental de Netflix “The social dilemma”.), cada cop sóc menys garrepa i procuro pagar pels serveis que em són d’utilitat real, especialment per la meva feina.\nDit això.\nChatGPT dona resultats completament diferents si fem servir el model gratuït (GPT-3.5-turbo) o si fem servir el model de pagament (GPT-4 i GPT-4 més plug-ins). Des que tinc accés a GPT-4 l’uso cada dia per a moltes tasques i sovint els meus documents són fruit d’un diàleg amb la màquina. Si considero que GPT-4 és com un becari, a preu de becari justifica el seu preu en un sol dia, o en un sol matí.\nD’altra banda, segurament els nostres alumnes faran servir la versió gratuïta total, com hauríem fet nosaltres a la seva edat. I cal conèixer el funcionament i les funcionalitats de les dues versions.\nEn qualsevol cas, fer servir la versió GPT-4 et dona una idea de la qualitat del que ve. La meva impressió és que el pas de GPT-3.5 a GPT-4 és com passar de res a GPT-3.5\n","date":"19 de de maig de 2023","externalUrl":null,"permalink":"/ludo/posts/pagas-por-chatgpt/","section":"Posts","summary":"Després de dècades fent servir serveis gratuïts en línia, i veure els resultats de ser el producte i no el client (Vegeu Soshana Zuboff “The Age of Survailance Capitalism” , o el documental de Netflix “The social dilemma”.), cada cop sóc menys garrepa i procuro pagar pels serveis que em són d’utilitat real, especialment per la meva feina.\n","title":"Pagueu per ChatGPT?","type":"posts"},{"content":"","date":"19 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/upc/","section":"Tags","summary":"","title":"Upc","type":"tags"},{"content":"En aquesta entrada us explico com instal·lar i fer servir un petit script de python que he escrit. Aquest script es connecta a l’API d’OpenAI per usar GPT-3.5_turbo per traduir fitxers d’un idioma a un altre. Tant és que siguin fitxers llargs. Cal tenir una clau API d’OpenAI per fer servir el programa. Aquesta API té un cost, però és molt baix, de l’ordre d’1 cèntim d’euro la traducció.\nLa major part d’aquesta entrada està escrita amb ChatGTP i serveix d’exemple de com de senzill és escriure documentació i apunts amb aquesta eina. En qualsevol cas, jo en sóc l’editor, sóc jo qui decideixo què vull que s’expliqui i, per tant: jo en sóc l’autor. Podem debatre aquest tema, que no és trivial.\nInstal·lar GitHub Desktop # Què és GitHub? # Segons ChatGPT\nGitHub és com un Google Drive per a programadors, però amb algunes característiques addicionals molt útils. Imagina que estàs treballant en un projecte i vols desar-ne versions diferents per poder tornar a una versió anterior si alguna cosa surt malament. Això és el que fa GitHub. A més, si treballes en equip, cada membre pot treballar en parts diferents del projecte al mateix temps, i després GitHub ajuda a unir tota la feina de manera ordenada. Finalment, també és com una xarxa social per a programadors, perquè pots compartir els teus projectes amb altres, i fins i tot col·laborar en projectes d’altres persones.\nÉs una bona explicació.\nInstal·lar GitHub Desktop # GitHub Desktop és una interfície gràfica que permet interactuar amb GitHub sense usar la línia d’ordres. És útil per gestionar repositoris, fer commits, push i pull, resoldre conflictes, entre d’altres coses. Aquí tens unes instruccions breus per instal·lar-lo a Windows:\nVes a la pàgina oficial de GitHub Desktop a https://desktop.github.com/ Fes clic al botó “Download for Windows (64bit)” si el teu sistema operatiu és de 64 bits. Si no n’estàs segur, ho pots comprovar anant a Configuració de Windows -\u0026gt; Sistema -\u0026gt; Quant a -\u0026gt; Tipus de sistema.\nUn cop descarregat el fitxer .exe, fes doble clic a sobre per començar la instal·lació.\nSegueix les instruccions que apareixen a la pantalla per completar la instal·lació.\nUn cop completada la instal·lació, podràs obrir GitHub Desktop des del menú Inici de Windows.\nLa primera vegada que obris l’aplicació, et demanarà que iniciïs sessió amb el teu compte de GitHub. Si no en tens, el pots crear a https://github.com/\nUn cop hagis iniciat sessió, pots començar a usar GitHub Desktop per gestionar els teus repositoris de GitHub.\nInstal·lar Python # ChatGPT diu que:\nPython és un llenguatge de programació, és a dir, una manera de donar instruccions a un ordinador. És com una recepta de cuina per a la màquina: li dius exactament què ha de fer i com fer-ho. Allò que fa especial Python és que està dissenyat per ser fàcil de llegir i escriure. És com un llibre de receptes que s’esforça per ser senzill i clar, evitant les complicacions innecessàries. Per això, sovint s’utilitza per ensenyar programació als principiants. Però no t’equivoquis, Python és molt potent i s’utilitza en molts àmbits, des de llocs web fins a recerca científica i desenvolupament de jocs.\nA més, hem de tenir en compte que és un llenguatge interpretat:\nUn llenguatge interpretat, com Python, és un tipus de llenguatge de programació que s’executa línia per línia, és a dir, en temps real. Imagina que ets en una obra de teatre i el director et va dient què fer escena per escena, en comptes de donar-te tot el guió d’un cop. Així funciona Python: l’ordinador va llegint i executant les instruccions del codi que has escrit una per una.\nAixò té alguns avantatges, com que és més fàcil d’aprendre i d’usar, a més de permetre’t provar parts del codi a mesura que avances. Tanmateix, pot ser una mica més lent que altres llenguatges que es compilen (és a dir, es tradueixen completament a llenguatge de màquina) abans d’executar-se.\nPer instal·lar Python 3.10 a Windows, pots seguir aquests passos:\nVes al lloc web oficial de Python a https://www.python.org/\nFes clic a la pestanya “Downloads” a la part superior de la pàgina.\nVeureu un botó que diu “Download Python 3.10.x” (x serà un número depenent de l’última versió disponible). Fes clic en aquest botó per descarregar l’instal·lador.\nUn cop el fitxer .exe s’hagi descarregat, fes-hi clic per obrir l’instal·lador.\nA la finestra de l’instal·lador, assegura’t de marcar la casella “Add Python 3.10 to PATH” a la part inferior. Això farà que puguis usar Python des de la línia d’ordres de Windows.\nDesprés, fes clic a “Install Now”.\nL’instal·lador començarà a copiar fitxers i configurar Python al teu sistema. Aquest procés pot trigar uns minuts.\nUn cop la instal·lació s’hagi completat, veuràs una pantalla que diu “Setup was successful”. Ja tens Python 3.10 instal·lat al teu sistema!\nPer comprovar que la instal·lació ha estat correcta, pots obrir la línia d’ordres (CMD o PowerShell) i introduir l’ordre python --version. T’hauria de mostrar la versió de Python que acabes d’instal·lar.\nEl que no diu ChatGPT és que t’has d’assegurar de marcar “afegir python.exe” al PATH. …i eliminar la limitació de longitud del PATH (Disable path length limit).\nInstal·lació de l\u0026rsquo;API d\u0026rsquo;OpenAI per a Python # Per instal·lar l’API d’OpenAI per a Python, necessitaràs fer servir pip, que és una eina que ve amb Python i serveix per instal·lar paquets o biblioteques addicionals.\nSegueix aquests passos:\nObre la línia d’ordres de l’ordinador. A Windows, pots cercar “CMD” o “Command Prompt” al menú d’inici.\nUn cop oberta la línia d’ordres, escriu la següent ordre i prem Enter:\npip install openai\nPotser “pip” no funciona al teu sistema i has d’usar “pip3”\nEspera que es completi la instal·lació. Veureu diversos missatges a la línia d’ordres mentre es descarrega i s’instal·la el paquet. Obtenir una clau d\u0026rsquo;accés a l\u0026rsquo;API d\u0026rsquo;OpenAI # Per obtenir una API Key d’OpenAI, has de seguir aquests passos:\nVes a la pàgina web d’OpenAI a https://beta.openai.com/signup/ i crea un compte si encara no en tens.\nUn cop hagis iniciat sessió, ves al Dashboard (tauler de control).\nAl Dashboard, cerca la secció de “API Keys” (Claus API).\nFes clic a “Create new API Key” (Crear clau API nova).\nEt demanarà que escriguis un nom per a la clau i que seleccionis algunes opcions. Un cop ho hagis fet, fes clic a “Create”.\nEt mostrarà una API Key nova. Assegura’t de copiar-la i desar-la en un lloc segur, ja que no la podràs tornar a veure.\nAra pots fer servir aquesta clau API al teu codi per interactuar amb l’API d’OpenAI.\nRecorda tractar la teva API Key com si fos una contrasenya, ja que proporciona accés al teu compte d’OpenAI i als serveis de pagament. No la comparteixis amb ningú i no la publiquis en llocs públics com repositoris de codi a GitHub.\nÉs possible que hagis de donar d’alta un mecanisme de pagament a la plataforma, ja que l’accés a les API és de pagament. Per fer proves amb models com GPT-3.5_turbo el cost és molt baix. De l’ordre de cèntims o mil·lèsimes d’euro per crida. Models com DALL-E o GPT-4 són més cars.\nGDPR i API d\u0026rsquo;OpenAI # OpenAI, amb seu als Estats Units, no ha de rebre dades personals d’usuaris europeus a través de la seva API sense garanties de compliment de la GDPR. Això vol dir que, quan utilitzis l’API d’OpenAI, t’has d’assegurar de no enviar dades que puguin identificar una persona, com noms, adreces de correu electrònic, números de telèfon i qualsevol altra dada que es pugui usar per identificar algú.\nÉs important entendre que la responsabilitat de garantir que les dades enviades a l’API d’OpenAI compleixin amb la GDPR recau en l’usuari que envia les dades. Per tant, sempre has d’anar amb compte a l’hora de gestionar i processar dades personals i assegurar-te que estàs complint totes les lleis i regulacions aplicables.\n( Si vols fer servir l’API d’OpenAI amb dades sensibles a Europa has d’usar la versió de l’API al Cloud de Microsoft Azure https://azure.microsoft.com/en-us/products/cognitive-services/openai-service/ )\nEl meu programa de traducció # El meu programa de traducció es troba al meu repositori de GitHub https://github.com/granludo/gpt-test , a la carpeta file-translator. Has d’usar GitHub Desktop per clonar la carpeta al teu ordinador.\nAquestes són les instruccions del Readme.md en castellà:\nPer Marc Alier @granludo https://wasabi.essi.upc.edu/ludo\nLlicenciat sota la Llicència Pública General de GNU v3.0\nPrograma simple en Python 3 que utilitza el model GPT-3.5-turbo d’OpenAI per traduir fitxers d’un idioma a un altre. Divideix el fitxer en fragments de 20 línies.\nrequisits # Necessites tenir una clau per usar l’API d’OpenAI, la pots obtenir aquí: https://beta.openai.com/docs/developer-quickstart/api-key aquest programa busca la clau en un fitxer indicat a la variable “mykeypath” per defecte a la ruta ‘..//..//mykey.json’. (És a dir, dins de la carpeta de GitHub)\nExemple del contingut de mykey.json:\n{ “key”: “sk-7QzXHpaajenpuakn1tgHT3Bxxxxxxxxxxx” }\nNecessites instal·lar els paquets json i openai\npip install openai\nús # python3 gpt-traductor.py archivo_origen idioma_origen idioma_destino archivo_destinoExemple\npython3 gpt-translate.py sample.md catalan italian sample_translated.md\nEspero que us sigui d’utilitat.\n","date":"17 de de maig de 2023","externalUrl":null,"permalink":"/ludo/posts/mi-script-de-traducci%C3%B3n-de-ficheros-de-texto-usando-el-api-de-chatgpt.-guia-de-instalaci%C3%B3n/","section":"Posts","summary":"En aquesta entrada us explico com instal·lar i fer servir un petit script de python que he escrit. Aquest script es connecta a l’API d’OpenAI per usar GPT-3.5_turbo per traduir fitxers d’un idioma a un altre. Tant és que siguin fitxers llargs. Cal tenir una clau API d’OpenAI per fer servir el programa. Aquesta API té un cost, però és molt baix, de l’ordre d’1 cèntim d’euro la traducció.\n","title":"El meu script de traducció de fitxers de text fent servir l'API de ChatGPT. Guia d'instal·lació","type":"posts"},{"content":"","date":"17 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/guia-instalaci%C3%B3n/","section":"Tags","summary":"","title":"Guia-Instalación","type":"tags"},{"content":"","date":"17 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/python/","section":"Tags","summary":"","title":"Python","type":"tags"},{"content":"","date":"17 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/software/","section":"Tags","summary":"","title":"Software","type":"tags"},{"content":"","date":"17 de de maig de 2023","externalUrl":null,"permalink":"/ludo/tags/traductor/","section":"Tags","summary":"","title":"Traductor","type":"tags"},{"content":"A partir dels cursos que he dissenyat i impartit a més de 300 professors universitaris amb el títol ‘ChatGPT, oportunitat i repte per a la docència’, i a petició del vicerectorat de política universitària de la UPC he escrit aquest esborrany de decàleg de recomanacions. Amb aportacions addicionals, aquest document ha estat presentat a la comunitat de la Universitat Politècnica de Catalunya. Aquesta és la meva versió amb algunes revisions addicionals.\nIA A LA UNIVERSITAT, DECÀLEG DE RECOMANACIONS # Ens trobem davant d\u0026rsquo;una tecnologia de gran potencial transformador: la disponibilitat de models generatius basats en IA - com ChatGPT - que tenen la capacitat de generar continguts (text, codi, imatges, so, vídeo…) similars als que podria generar una persona. Els models generatius ja formen part de les eines de treball que tenim i aprendre a fer-les servir de manera efectiva, responsable i entenent-ne les limitacions, és una competència nova a aprendre i integrar en la manera de treballar de tothom, docents i estudiants. Probablement, només som a l\u0026rsquo;inici d\u0026rsquo;un nou paradigma que ens portarà a repensar l\u0026rsquo;activitat acadèmica, no només perquè tenir a l\u0026rsquo;abast aquestes eines té potencial per transformar l\u0026rsquo;experiència d\u0026rsquo;aprenentatge, sinó també perquè poden canviar/evolucionar les competències que els professionals requeriran en el futur.\nEN L\u0026rsquo;ESTUDI # Cal conèixer i comprendre aquestes eines. És important comprendre mínimament aquesta nova tecnologia, les seves possibilitats, oportunitats i reptes en el mateix àmbit de treball o d\u0026rsquo;estudi. Cal identificar com afecten els models generatius a cadascuna de les disciplines, quines tasques esdevenen automatitzables, amb quin nivell de fiabilitat i precisió, i quines no. Els models generatius poden ser una eina de consulta, per generar idees i primers esborranys per a moltes tasques. És possible fer-los servir dins i fora de l\u0026rsquo;aula. Ja s\u0026rsquo;està investigant com fer versions adaptables a dominis de coneixement específic com la temàtica d\u0026rsquo;una assignatura. Certes metodologies docents en què l\u0026rsquo;estudiantat ha de posar en pràctica els seus coneixements a l\u0026rsquo;aula (com la classe inversa) poden ser eficaces per treure profit i/o conviure amb aquestes noves eines en l\u0026rsquo;àmbit acadèmic. Cal ser molt curosos amb la informació que donem a models d\u0026rsquo;IA oferts com a “software as a service” al núvol. Cal tenir en compte si aquests serveis compleixen amb el RGPD i qui farà servir la informació que donem durant un xat. EN L\u0026rsquo;AVALUACIÓ # La possibilitat que els treballs fets fora de l\u0026rsquo;aula no siguin obra original de l\u0026rsquo;estudiant sempre ha estat present. No és cap novetat. Els models generatius ho simplifiquen i abarateixen (en el cas d\u0026rsquo;acadèmies o organitzacions que fan treballs acadèmics a canvi de diners) Les eines de detecció de còpia com URKUND-Ouriginal no són fiables, i possiblement no ho tornin a ser mai, especialment per a textos de menys de 1000 caràcters. Cal tenir en compte l\u0026rsquo;alt índex de falsos positius; les conseqüències d\u0026rsquo;actuar en el cas d\u0026rsquo;un fals positiu són greus i s\u0026rsquo;han d\u0026rsquo;evitar. Certs projectes, exercicis i tasques es poden automatitzar. Cal valorar alternatives com proposar nous tipus de treballs i avaluar el procés de treball per damunt del resultat. Algunes activitats d\u0026rsquo;avaluació que es poden proposar són portafolis formatius, presentacions de treballs a classe, avaluació oral, simulacions, etc. Els exàmens presencials, sense accés a internet, no es veuen afectats. De la mateixa manera que alguns exàmens han estat amb apunts ou connexió a internet, pot ser un repte proposar exàmens amb accés a models generatius. ","date":"1 de de maig de 2023","externalUrl":null,"permalink":"/ludo/posts/decalogo-sobre-el-uso-de-la-ia-en-el-aula/","section":"Posts","summary":"A partir dels cursos que he dissenyat i impartit a més de 300 professors universitaris amb el títol ‘ChatGPT, oportunitat i repte per a la docència’, i a petició del vicerectorat de política universitària de la UPC he escrit aquest esborrany de decàleg de recomanacions. Amb aportacions addicionals, aquest document ha estat presentat a la comunitat de la Universitat Politècnica de Catalunya. Aquesta és la meva versió amb algunes revisions addicionals.\n","title":"Un decàleg de recomanacions sobre l'ús de la IA a l'aula.","type":"posts"},{"content":"","date":"26 de d’abril de 2023","externalUrl":null,"permalink":"/ludo/tags/cursos/","section":"Tags","summary":"","title":"Cursos","type":"tags"},{"content":"Diu la llegenda que el savi Anand (nom suggerit per ChatGPT, a qui jo anomeno Skippy ^2) va ajudar al rei Devendra (nom també proposat per Skippy) a resoldre un problema difícil. En agraïment Devendra va oferir a Anand el pagament que desitgés. Anand va demanar que el rei li donés un gra d’arròs pel primer quadre d’un tauler d’escacs i que dupliqués la quantitat en cada quadre successiu. El rei va acceptar, però després d’una bona estona els matemàtics del rei el van informar que no hi havia prou blat a tot el regne per pagar el que Anand demanava.\nGordon Moore, un dels fundadors d’Intel, va observar el 1965 que la capacitat d’integrar transistors en un xip es dobla cada 18 mesos. És a dir, seguint una progressió exponencial. Aquesta observació va esdevenir un predictor del comportament de la indústria que s’ha anat complint fins a la mort de Moore a principis de 2023.\nSembla impossible que quelcom es dobli 64 vegades, però des de l’observació de Moore la potència dels processadors s’ha doblat 43 vegades. Però encara n’hi ha més: fa 20 anys l’inventor i futurista Ray Kurzweil, va calcular la capacitat de computació que hom ha pogut adquirir per 1000 dollars ajustats per inflació durant tot el segle XX. El resultat indicava un creixement exponencial començant potser abans de principis de segle XX, si tenim en compte els treballs de Blaise Pascal, Charles Babbage i Ada de Lovelace a principis de segle XIX. El que sí podem dir és que durant el S.XX la capacitat de computació que podem comprar a un preu determinat s’ha doblat, independentment de la tecnologia emprada, 66 vegades durant el segle XX. Més que quadres en un taulell l’escacs. I aquest comportament no s’ha aturat els 23 anys que portem de segle XXI.\nTant el savi Anand com el rei Devendra estarien bocabadats. Però la pregunta que es faria el savi Anand és: què passa quan alguna cosa es duplica tantes vegades i que passa quan això afecta tantes coses?\nUna possible resposta la dona Peter Diamandis, emprenedor i futurista grec-americà, qui proposa al seu llibre “Abundace de future is better than you think “(^1) que quan quelcom es digitalitza esdevé connectat amb aquesta millora exponencial. Això al principi no és gran cosa (és deceptiu) perquè al principi les corbes exponencials són prou planes, però de sobte fan un colze cap amunt i creixen sobtadament. És llavors quan la digitalització es torna disruptiva. I aquesta disrupció implica canvis en la manera que es fan les coses, en els artefactes que fem servir (que es fan més petits o desapareixen), en les feines que hem de fer les persones - la desaparició d’algunes i la creació de les altres -, i en el valor de les coses: algunes coses deixen de tenir valor perquè es tornen abundants i altres coses es tornen molt valuoses.\nLi podeu preguntar a Skippy per les 6 D’s de Diamandis i us ho explicarà molt bé.\nUn altre possible resposta la va donar Alvin Toffler, en un assaig a la prestigiosa revista Playboy - que no és Open Access ni JCR, però segur que n’heu sentit a parlar - el 1970 i posteriorment en el llibre del mateix títol: “Future shock” ^3 . El xoc del futur. Toffler fa l’observació que les transformacions causades per la innovació tecnològica - ja el 1970 - cada cop son més profundes i cada es succeeixen més de pressa, s’acceleren. De manera que el món canvia de manera radical diverses vegades durant el temps de vida d’una persona. I això ens pot deixar perplexos, en el xoc del futur.\nSi Toffler ja observava el xoc del futur fa 53 anys, ara és quelcom evident en el nostre dia a dia. Pensem que fa 25 anys no hi havia web - hi era, però només hi érem 4 friquis -, fa 15 anys no hi havia telèfons mòbils connectats a internet - hi eren, però només en teníem 4 friquis -, fa 6 mesos no hi havia models generatius que semblen Intel·ligències artificials. Bé, hi eren, però només hi jugàvem 4 friquis.\nEl 30 de novembre de 2022 es va posar en marxa ChatGPT, un altre Xatbot a internet com n’havíem vist molts altres, que permetia parlar amb el model generatiu GPT-3 (Generative Pretrained Transformer) desenvolupat per l’organització sense ànim de benefici OpenAi (que s’ho han repensat i ara sí que volen fer beneficis). En 5 dies ChatGPT va arribar als 5 milions d’usuaris, en dos mesos havia arribat als 100 milions d’usuaris. ChatGPT ja pot entrar al llibre Guiness dels records com el producte d’expansió més ràpida fins al moment. El mes de gener de 2023 ChatGPT era tan popular a les cerques de Google com la Shakira, ara - a maig de 2023 - és difícil trobar un terme més popular arreu.\nPer algun motiu ChatGPT és prou bo perquè tots els que el fem servir veiem que això és quelcom diferent. Un Xatbot al qual val la pena parar atenció. Igual que en el seu dia els usuaris d’internet que provaven el nou cercador Google s’adonaven que es tractava de quelcom diferent; deu vegades millor que cap altra cosa, els agrada dir als creadors de Google.\nChatGPT marca l’inici del colze a la progressió d’una nova eina: els models generatius basats en xarxes neuronals, una tecnologia del camp de recerca de la intel·ligència artificial (IA) que fa gairebé 70 anys que corre. No oblidem que, tal com deia John Mc Carty - un dels pares de la disciplina - quan una tecnologia funciona ja no l’anomenem IA, sinó una altra cosa. Els objectius de la IA es mouen més enllà, potser ara ja apuntaran cap a l’objectiu no assolit de les Intel·ligències artificials generals (IAG) equivalents a la intel·ligència humana. Però tranquils que encara no hi som, ni hi serem aviat.\nNo obstant els models generatius ara han esdevingut una tecnologia prou bona per a esdevenir la base de serveis per al públic general. Els sistemes informàtics ara entenen el llenguatge amb què ens comuniquem els humans- qualsevol idioma o gairebé qualsevol - comencen a entendre context i subtileses culturals, i són capaços de respondre donant informació sovint encertada. Cada cop més encertada.\nDarrerament, he vist fotografies d’hemeroteca que mostren professors de matemàtiques manifestant-se pel carrer protestant per l’ús de les calculadores els anys 70. La negació o la prohibició és una de les primeres respostes que podem esperar, malgrat que serveixin de poc. Les calculadores eren i són fantàstiques, permeten fer càlculs aritmètics, accedir a taules de logaritmes i trigonomètriques, i fins i tot executar algorismes. Amb una calculadora som capaços de resoldre problemes molt complexos, de pressa i amb precisió. Segurament problemes que no podríem abordar sense. Però la disponibilitat de les calculadores pot causar que no aprenem a fer aquestes operacions sense elles. O que oblidem com fer-les. “Use it or lose it” diuen.\nChatGPT i la gran família de models generatius que ve - aneu a huggingface.co on trobareu la principal comunitat d’aprenentatge sobre models generatius i transformadors i veureu què s’hi cou - pot fer moltes coses per nosaltres: Ajudar-nos a traduir textos, resumir documents, preparar presentacions, revisar gramàtica i estil, respondre preguntes que abans haguéssim fet a una enciclopèdia, un expert o al cercador d’internet… I encara més, si tenim sort i tenim traça en donar les indicacions (allò que en diuen “prompt”, però són “indicacions”) poden ajudar a resoldre problemes i connectar-se amb altres programes per aconseguir encara més coses. Poden generar codi pels nostres programes, ajudar-nos a millorar l’estil, trobar errors i documentar-los. I moltes altres coses. Que com les calculadores augmentaran les nostres capacitats, però haurem de vigilar perquè fent servir aquestes eines podem perdre l’habilitat de fer les coses sense elles.\nEls models IA Generatius tenen una propietat molt interessant: de vegades al·lucinen. En el context d’IA les al·lucinacions són resultats estranys - erronis, ben segur - que donen de vegades, de manera imprevista i imprevisible, aquests sistemes. De manera que sempre que fem servir un d’aquests models hem de pensar que potser el resultat és acurat o potser és una al·lucinació.\nQuan una calculadora dona un resultat, tenim la capacitat de comprovar si el resultat és correcte? Certament, assolim el risc i la responsabilitat d’acceptar el resultat d’una calculadora - o un full de càlcul o el SAP - cada cop que els fem servir per al nostre dia a dia. Però les calculadores són fiables, estan construïdes amb sistemes deterministes que sempre donen el mateix resultat. I si fallen, podem buscar on és l’error i corregir el sistema.\nAmb els models de xarxes neuronals això no és així. Sabem que funcionen de forma fenomenològica: funcionen perquè funcionen i n’observem un comportament. Res no ens garanteix que continuaran funcionant així o que al·lucinaran o ens explicarà per què funcionen com ho fan. Penseu en això quan, ben aviat, més i més sistemes estiguin controlats per aquests models.\nCom a docents i educadors ens sorgeix el dilema. Hem de fer servir aquestes eines o no les hem de fer servir a les nostres assignatures? I si les hem de fer servir: com les hem de fer servir? Independentment del que decidim els nostres estudiants ja disposen d’aquestes eines, saben qui és la Shakira i també què és ChatGPT.\nEls jugadors experts del videojoc d’estratègia en temps real Starcraft expliquen que per guanyar s’ha de jugar en Macro i en Micro. Cal tenir una estratègia Macro: dominar tot el mapa, tenir una estratègia per guanyar la partida a llarg termini. Però cal aplicar tàctica i operacions en Micro, estar atent i moure les teves unitats allà on hi ha enfrontaments. I saber quan has de parar atenció a Macro o a Micro. Sense dominar el Macro-Micro no es pot guanyar a l’Starcraft.\nDe la mateixa manera cada assignatura té un context Macro: Quins són els objectius de l’assignatura? Els professionals que formem, faran servir eines IA generatives en el seu dia a dia? Com afecta això als nostres objectius? I com afectarà en els mesos i anys vinents, donat el ritme d’avançament xocant de la tecnologia?\nPerò també i hi ha un context Micro: Com ensenyem? Prohibim la IA a l’aula o assumim que en qualsevol moment els nostres estudiants poden tenir oberta la finestra de ChatGTP o alguna altra eina? I els projectes? I els exercicis que han de fer a casa? Com els avaluem sabent que disposen d’eines IA que són impossibles o molt difícils de detectar?\nCada docent, cada equip de docents a cada assignatura tenim l’oportunitat i el repte de repensar la nostra estratègia i pràctica docent. I no ho podem ignorar.\n^1 (Diamandis, P. H., \u0026amp; Kotler, S. (2012). Abundance: The Future Is Better Than You Think. Free Press.” ^2 Skippy és el nom de la IA alienigena que co-protagonitza la sèrie de noveles de ciència ficció Expeditionary Force de l’escriptor Craig Alanson. ^3 Toffler, Alvin. (1970). Future Shock. New York: Random House.\n","date":"26 de d’abril de 2023","externalUrl":null,"permalink":"/ludo/posts/i-la-ia-va-venir-a-laula/","section":"Posts","summary":"Diu la llegenda que el savi Anand (nom suggerit per ChatGPT, a qui jo anomeno Skippy ^2) va ajudar al rei Devendra (nom també proposat per Skippy) a resoldre un problema difícil. En agraïment Devendra va oferir a Anand el pagament que desitgés. Anand va demanar que el rei li donés un gra d’arròs pel primer quadre d’un tauler d’escacs i que dupliqués la quantitat en cada quadre successiu. El rei va acceptar, però després d’una bona estona els matemàtics del rei el van informar que no hi havia prou blat a tot el regne per pagar el que Anand demanava.\n","title":"I la IA va venir a l'aula","type":"posts"},{"content":"","date":"26 de d’abril de 2023","externalUrl":null,"permalink":"/ludo/tags/ice-upc/","section":"Tags","summary":"","title":"Ice-Upc","type":"tags"},{"content":"[Nota : aquesta entrada ha estat traduida amb el pròpi traductor] [Nota: fer servir l’api té costos, el cost del us depèn de la mida dels documents. Com a guia orientativa durant el desenvolupament, proves i traduccions diverses de documents de 2 págines he gastat 0.0.3€ en 5 dies]\nEn aquesta entrada presento un petit projecte que he publicat com a open source. El que abans hauria estat un projecte de molts anys i diversos milions d’euros, ara és una petita prova feta un dissabte al matí. Les claus són Github Copilot, ChatGPT 4 com a assistents de programació i l’API de GPT.3.5 turbo.\ngpt-translator # El pots descarregar de https://github.com/granludo/gpt-test/tree/main/file-trasnlator\nLlicenciat sota la Llicència Pública General de GNU v3.0\nPrograma simple en Python 3 que utilitza el model GPT-3.5-turbo d’OpenAI per traduir fitxers d’un idioma a un altre. Divideix el fitxer en fragments de 20 línies.## Requisits\nNecessites tenir una clau per usar l’API d’OpenAI, pots obtenir-ne una aquí: https://beta.openai.com/docs/developer-quickstart/api-key aquest programa busca la clau en un fitxer indicat a la variable “mykeypath” per defecte en la ruta ‘..//..//mykey.json’\nNecessites tenir instal·lat Python 3 al teu sistema. Jo he usat python 3.10\nNecessites instal·lar els paquets json i openai\npip install openai\npip install json\nPotser al teu sistema hauràs d’usar pip3 en lloc de pip.\nÚs # python3 gpt-traductor.py fitxer_origen idioma_origen idioma_destí fitxer_destí\nExemple\npython3 gpt-translate.py sample.md català italià sample_translated.md\nQue et diverteixis.\n","date":"8 de d’abril de 2023","externalUrl":null,"permalink":"/ludo/posts/traductor-cat/","section":"Posts","summary":"[Nota : aquesta entrada ha estat traduida amb el pròpi traductor] [Nota: fer servir l’api té costos, el cost del us depèn de la mida dels documents. Com a guia orientativa durant el desenvolupament, proves i traduccions diverses de documents de 2 págines he gastat 0.0.3€ en 5 dies]\n","title":"Traductor simple de documents multi-idioma en python. Un projecte ràpid.","type":"posts"},{"content":"[Nota: fer servir l\u0026rsquo;API d\u0026rsquo;OpenAI té els seus costos. El cost de l\u0026rsquo;ús del traductor dependrà de la mida dels documents que tradueixis. Com a orientació, de moment, amb el desenvolupament, les proves i la traducció d\u0026rsquo;alguns documents he gastat 0,03 €. ]\nEn aquesta entrada presento un petit projecte que he publicat com a codi obert. El que abans hauria estat un projecte de molts anys i diversos milions d\u0026rsquo;euros, ara és una petita prova feta un dissabte al matí. Les claus són GitHub Copilot, ChatGPT 4 com a assistents de programació i l\u0026rsquo;API de GPT.3.5 turbo.\ngpt-translator # El pots descarregar de https://github.com/granludo/gpt-test/tree/main/file-trasnlator\nLlicenciat sota la Llicència Pública General de GNU v3.0\nPrograma simple en Python 3 que utilitza el model GPT-3.5-turbo d\u0026rsquo;OpenAI per traduir fitxers d\u0026rsquo;un idioma a un altre. Divideix el fitxer en fragments de 20 línies.\nRequisits # Necessites tenir una clau per utilitzar l\u0026rsquo;API d\u0026rsquo;OpenAI, la pots obtenir aquí: https://beta.openai.com/docs/developer-quickstart/api-key aquest programa cerca la clau en un fitxer indicat a la variable “mykeypath” per defecte a la ruta ‘..//..//mykey.json’\nNecessites tenir instal·lat Python 3 al teu sistema. Jo he fet servir Python 3.10\nNecessites instal·lar els paquets json i openai\npip install openai\npip install json\nPotser al teu sistema hauràs d\u0026rsquo;utilitzar pip3 en lloc de pip.\nÚs # python3 gpt-traductor.py archivo_origen idioma_origen idioma_destino archivo_destinoExemple\npython3 gpt-translate.py sample.md catalan italian sample_translated.md\nQue t\u0026rsquo;ho passis bé.\n","date":"8 de d’abril de 2023","externalUrl":null,"permalink":"/ludo/posts/traductor-simple-de-documentos-multi-idioma-en-python.-un-proyecto-r%C3%A1pido/","section":"Posts","summary":"[Nota: fer servir l’API d’OpenAI té els seus costos. El cost de l’ús del traductor dependrà de la mida dels documents que tradueixis. Com a orientació, de moment, amb el desenvolupament, les proves i la traducció d’alguns documents he gastat 0,03 €. ]\n","title":"Traductor simple de documents multilingües en Python. Un projecte ràpid.","type":"posts"},{"content":"El 2 de març de 2023 vaig participar a la Sessió sobre xatbots d’IA a l’educació superior organitzada per la Universitat Internacional de Catalunya UIC. A https://www.linkedin.com/events/sessi-sobrexatbotsd-intel-lig-n7034187811851235329/comments/ hi teniu el vídeo de la jornada. Un servidor i la seva xerrada apareixen a partir d’1h:25 minuts.\n","date":"1 de de març de 2023","externalUrl":null,"permalink":"/ludo/posts/participaci%C3%B3-a-jornada-sobre-ia-i-docencia-a-la-uic-1/","section":"Posts","summary":"El 2 de març de 2023 vaig participar a la Sessió sobre xatbots d’IA a l’educació superior organitzada per la Universitat Internacional de Catalunya UIC. A https://www.linkedin.com/events/sessi-sobrexatbotsd-intel-lig-n7034187811851235329/comments/ hi teniu el vídeo de la jornada. Un servidor i la seva xerrada apareixen a partir d’1h:25 minuts.\n","title":"Participació a la jornada sobre IA i docència a la UIC","type":"posts"},{"content":" Continguts # Què és ChatGPT ? ChatGPT és un Software As A Service (SaaS) Termes i condicions Drets d’autoria i responsabilitat dels outputs de ChatGPT Cost i accés Quina és la finalitat de ChatGPT i perquè es de franc? ChatGPT no és codi obert Aspectes ètics Reflexions ètiques dels creadors de GPT-3 El Hype de ChatGPT Què és ChatGPT ? # ChatGTP és una aplicació web basada en GPT-3, concretament en el model GPT-3.5 “text-davinci-003” desenvolupat per OpenAi. El Model ChatGPT està optimitzat per funcionar en forma conversa, responent a les entrades que els usuaris li donen en forma de “prompt” de text. ChatGPT és un tipus d’IA Generativa basada en unModel de Machine Learning . Podem considerar que ChatGPT és una IA dèbil (veure Típus d’inteligencia Artificial].\nGPT-3 és un model generatiu de llenguatge natural immens. Ha estat entrenat amb 175 mil milions de paràmetres en múltiples idiomes, entre ells el Català. Si el procés d’entrenament s’hagués fet amb un sol ordinador haguessin calgut 355 anys. El cost d’entrenar-lo en una plataforma al núvol de baix cost és de 4.600.000 dòlars. https://lambdalabs.com/blog/demystifying-gpt-3\n(Font imatge: https://blog.accubits.com/getting-started-with-gpt-3-model-by-openai/)\nChatGPT és un Software As A Service (SaaS) # ChatGPT és proporciona com a servei; és un “Software as a Service” no un programari que puguem instal·lar a un servidor o a un servei de computació al núvol. Per tant, els propietaris del servei (OpenAi, entitat participada per Microsoft en un 49% des de gener de 2023) decideixen les condicions de prestació: qui hi té accés, per a quines finalitats i quina qualitat de servei i disponibilitat ofereix.\nTermes i condicions # Els termes de servei de ChatGPT https://openai.com/terms/ indiquen que\nEsteu d’acord i ens doneu instruccions per utilitzar el Contingut per desenvolupar i millorar els serveis. Podeu llegir més aquí sobre com es pot utilitzar el Contingut per millorar el rendiment del model. Entenem que en alguns casos pots no voler que el teu Contingut s’utilitzi per millorar els serveis. Podeu optar per no utilitzar el Contingut per millorar contactant amb suport@openai.com amb la vostra ID d’organització. Tingueu en compte que en alguns casos això pot limitar la capacitat dels nostres serveis per abordar millor el vostre cas d’ús específic.\nO sia que les dades que entrem a ChatGPT en forma de Prompt seran recollides, analitzades i emprades per a la recerca, millora del servei i de ben segur per entrenar futures versions de GPT-N\nOpenAi publica de forma clara quins són els seus termes i condicions, no abusen del llenguatge legal ni fan servir lletra petita. Us recomano la lectura dels termes de servei https://openai.com/terms/ i política de privacitat https://openai.com/privacy/\nDrets d’autoria i responsabilitat dels outputs de ChatGPT # Un aspecte molt important de l’us d’eines d’IA generativa com ChatGPT, DALL-E, Stable Difussion, Whisper o VALL-E, és l’acord establert implícita o explícitament sobre els drets d’autoria d’allò que es genera (text, imatge, àudio o vídeo ). Això determina el copyright i els drets d’ús que se’n deriven per a les parts implicades.\nEls termes genèrics d’OpenAi per a les seves eines defineixen dos conceptes importants: Entrada i sortida. L’Entrada (Input) és el promptgenerat pels usuaris, mentre que la Sortida (Output) és el contingut generat pel Model de machine learning. L’entrada i la sortida conformen el contingut.\nVegem el que diuen els termes traduïts pel mateix ChatGPT.\n_(a) El teu contingut. Pots proporcionar dades d’entrada als serveis (“Entrada”) i rebre les dades de sortida generades i retornades pel servei basades en l’Entrada (“Sortida”). L’Entrada i la Sortida són col·lectivament “Contingut”. Entre les parts i en la mesura permesa per la llei aplicable, tu ets propietari de tota l’Entrada i, sotmès al teu compliment d’aquests Termes, OpenAI et cedeix tot el seu dret, títol i interès en i per la Sortida. OpenAI pot utilitzar el Contingut com sigui necessari per proporcionar i mantenir els Serveis, complir amb la llei aplicable i fer complir les nostres polítiques. Ets responsable del Contingut, incloent-hi assegurar que no viola cap llei aplicable ni aquests Termes.\nO sia que l’autor d’un prompt] té els drets sobre les sortides generades per una IA d’OpenAi sempre que tingui drets sobre les entrades que han generat aquests continguts. En cas de no tenir els drets estaria contravenint els termes de servei d’OpenAi i això comportaria que jo no soc qui per dir-ne res al respecte i cal consultar advocats i serveis legals.\nOpenAi té coses a dir sobre el contingut, la seva naturalesa i la possibilitat de que certes sortides es repeteixin.\n(b) Similitud del contingut. A causa de la naturalesa del aprenentatge automàtic, la Sortida pot no ser única entre els usuaris i els serveis poden generar la mateixa o similar sortida per OpenAI o un tercer. Per exemple, pots proporcionar entrada a un model com “Quin color té el cel?” i rebre sortida com “El cel és blau.” Altres usuaris també poden fer preguntes similars i rebre la mateixa resposta. Les respostes que són sol·licitades per i generades per altres usuaris no són considerades com el teu Contingut.\nO sia, l’originalitat de la sortida depèn de l’originalitat de l’entrada. Els advocats s’ho passaran d’allò més bé els anys vinents. O potser un germà de ChatGPT especialitzat en assessoria legal… però divago.\nCost i accés # A gener de 2023 i des de desembre de 2022 ChatGPT es troba disponible gratuïtament a l’URL https://chat.openai.com\nEls models anteriors de GPT-3 estaven disponibles per a fer proves a través d’una interfície més complexa i per API (Aplication Programming Interface) . Per accedir-hi, després d’un període de prova calia pagar pel seu ús comprant paquets de “tokens”. No està clar quant de temps estarà ChatGPT disponible pel seu ús gratuït.\nJa hi ha una llista d’espera oberta per accedir a la modalitat “pro” de ChatGPT. S’especula que el preu serà de 42$ mensuals, tot i que es manté la modalitat de franc.\nL’accés per a programadors d’aplicacions via API (Aplication Programming Interface) a ChatGTP i en breu es començarà a gestionar gestioni a través dels serveis cloud de Microsoft: Azure. https://indianexpress.com/article/technology/tech-news-technology/openais-chatgpt-api-microsoft-azure-api-businesses-8386106/ A conseqüència d’això ben segur començarem a trobar eines especialitzades que faran us de diversos models de GPT-3.\nUn exemple és el model “códex”, una variant de GPT-3 entrenada amb el codi font disponible a Github (el repositori de projectes de programari lliure més gran a la xarxa, adquirit per Microsoft fa un parell d’anys), on fa uns mesos s’ofereix el sistema Copilot, un assistent a la programació capaç de generar codi, traduir programes entre llenguatges de programació, optimitzar codi i comentar programes, entre altres aplicacions.\nQuina és la finalitat de ChatGPT i perquè es de franc? # L’objectiu de ChatGPT és facilitar l’ús d’aquest model per part d’un gran nombre per persones (de l’ordre de centenars de milions) aconseguint dades per als investigadors d’OpenAi. Tal com apunta el CEO d’OpenAi al Pòdcast Moonshots.\nMoonshots. Peter Diamandis. “The Rise of OpenAi with Sam Altman” https://www.diamandis.com/podcast/sam-altman ChatGPT no és codi obert # GPT-3 no és codi obert, altres Models de machine learning ho son però GPT-3 i DALL-E no. Al respecte ChatGPT diu:\n_GPT-3 és un model de processament de llenguatge desenvolupat per OpenAI. El model i les dades que s’utilitzen per entrenar-lo són propietat d’OpenAI, i per això no són de codi obert. OpenAI ha decidit no fer-lo obert perquè considera que és una tecnologia valuosa i considera que és important protegir-la per poder continuar finançant el seu desenvolupament i millora.\nA més, hi ha preocupacions sobre els possibles riscos associats amb l’ús no intencionat o maliciós de la tecnologia de GPT-3, com ara la generació automatitzada de notícies falses o la automatització de l’enginyeria social. OpenAI ha adoptat una estratègia de llicència restrictiva per evitar aquestes preocupacions i assegurar que GPT-3 s’utilitzi de manera responsable.\nAspectes ètics # Els resultats dels models generatius basats en transformador poden oferir resultats tan convincents com per passar el test de Turing. El juny del 2022 un enginyer de Google, qui va ser acomiadat, va declarar que estava convençut el model Lambda era autoconscient i que, per tant, tenia drets anàlegs als drets humans. https://www.livescience.com/google-sentient-ai-lamda-lemoine\nEl gener de 2023 Les xarxes socials han circulat rumors sobre el nombre de paràmetres de GPT-4. No obstant el CEO d’OpenAi Sam Altman ho ha desmentit i ha fet èmfasi en que GPT-4 no serà una Tipus d’inteligencia artificial.\nChatGPT és un projecte en contínua evolució. Sovint hi ha actualitzacions del servei i molts investigadors han reportat canvis en el seu comportament. A la poca estona de fer servir ChatGPT podem observar que s’ha fet un esforç per fer les seves respostes políticament correctes. Alguns dels exemples són:\nLa insistència en el fet que és un software, que no té agència i que no es una Inteligència artificial Reflexions ètiques dels creadors de GPT-3 # Els creadors de GPT-3 van presentar el projecte en l’article “Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … \u0026amp; Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.” A l’article dediquen una secció ben amplia a discutir els possibles mals usos de sistemes generadors de text com GPT-3.\nResumit per GPT-3\n_Les utilitzacions malicioses dels models de llenguatge poden ser una mica difícils d’anticipar perquè sovint impliquen la reutilització dels models de llenguatge en un entorn molt diferent o per un propòsit diferent del que els investigadors van tenir en compte.\nPer ajudar amb això, podem pensar en termes de marcs de valoració de riscos de seguretat tradicionals, que esbossen passos clau com ara identificar amenaces i impactes potencials, avaluar la probabilitat i determinar el risc com una combinació de probabilitat i impacte.\nDiscutim tres factors: les aplicacions d’ús indegut potencials, els actors de risc i les estructures d’incentius externes. El potencial d’ús indegut dels models de llenguatge augmenta a mesura que millora la qualitat de la síntesi de text. La capacitat de GPT-3 per generar diversos paràgrafs de contingut sintètic que les persones troben difícil de distingir del text escrit per humans és un punt preocupant en aquest sentit._\nLes aplicacions d’ús indegut potencials de models de llenguatge inclouen la desinformació, el spam, el phishing, l’abús de processos legals i governamentals, la redacció fraudulenta d’assajos acadèmics i la precisió d’enginyeria social. El potencial d’ús indegut augmenta amb la millora de la qualitat de la síntesi de text. Els autors identifiquen els diferents tipus potencials “actors d’amenaça” (threat actors) en funció del nivell habilitat i recursos d’aquests. Aquests van des d’actors de baixa o moderada habilitat i recursos fins a grups altament habilitats i ben equipats com els patrocinats per estats que anomenen ATP (Advadced Persistent Therats).\nEls actors de baixa i mitjana habilitat actualment no representen una amenaça immediata, però les millores en la fiabilitat podrien canviar això. Els actors APT no discuteixen les seves operacions en públic, però no s’han detectat diferències en les actuacions d’aquests actors des de la sortida de GPT-2. El comportament dels actors d’amenaça es veu influenciat per les estructures d’incentiu externes com l’escalabilitat, reducció de cost de desplegament i la facilitat d’ús poden influir en l’adopció noves tècniques, tàctiques i procediments (TTPs) adoptades pels actors d’amenaça. S’espera que els investigadors de IA desenvolupin models de llenguatge cada vegada més fiables i dirigibles, el que representaria desafiaments per a la comunitat científica i la necessitat de treballar en solucions de seguretat. Els creadors de GPT-3 continuen el seu anàlisi amb una discussió sobre els biaixos que pot tenir el sistema i com pal·liar-los. I conclou amb un apartat sobre els aspectes energètics del sistema.\nEl Hype de ChatGPT # Ja fa gairebé dos anys que hi ha disponibles eines IA Generatives que permeten creat textos a partir de prompts. No obstant aquestes eines tenien una popularitat molt limitada a entorns d’interés en la IA i innovació tecnològica. Veiem en la següent figura la popularitat de GPT-3, el millor model fins al moment, comparat amb la popularitat en cerques a Google d’un terme relativament mainstream com _“ferrari”__.\nEn canvi, quan afegim el terme “ChatGTP”_ a la comparativa ens trobem amb un ensurt.\nEl terme “ferrari” ´és un bon benchmark perquè manté un interès força estable i ens permet veure com ChatGPT deperta una atenció global molt alta. Però com es compara ChatGPT respecte a un terme amb un fort hype de primer nivell durant el mes de gener de 2023 com “Shakira” qui ha estat molt de moda degut a la seva darrera cançó que ha esdevingut un fenomen a la música i cultura popular.\nDoncs el resultat de Google Trends apunta al fet que el nivell d’atenció a les cerques que “ChatGPT” està suscitant és del mateix ordre que el que suscita la cantant colombiana que fins fa poc vivia a Barcelona.\nRecordem el significart de “Hype\u0026quot;Segons ChatGPT :\nHype és un terme utilitzat per descriure una gran quantitat de publicitat i entusiasme exagerat per un producte, idea o tendència. En general, es refereix a un augment de la popularitat o de l’atenció que s’ha donat a alguna cosa sense una base real o justificació. Així, el terme hype sol referir-se a una situació en què s’han generat expectatives o expectatives desmesurades sobre un producte o servei, de manera que no és coherent amb la seva realitat o les seves capacitats.\nHi hagi base real o justificació ChatGPT és sens dubte un dels termes de cerca més populars a internet.\n","date":"24 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/posts/que-es-chatgtp/","section":"Posts","summary":"Continguts # Què és ChatGPT ? ChatGPT és un Software As A Service (SaaS) Termes i condicions Drets d’autoria i responsabilitat dels outputs de ChatGPT Cost i accés Quina és la finalitat de ChatGPT i perquè es de franc? ChatGPT no és codi obert Aspectes ètics Reflexions ètiques dels creadors de GPT-3 El Hype de ChatGPT Què és ChatGPT ? # ChatGTP és una aplicació web basada en GPT-3, concretament en el model GPT-3.5 “text-davinci-003” desenvolupat per OpenAi. El Model ChatGPT està optimitzat per funcionar en forma conversa, responent a les entrades que els usuaris li donen en forma de “prompt” de text. ChatGPT és un tipus d’IA Generativa basada en unModel de Machine Learning . Podem considerar que ChatGPT és una IA dèbil (veure Típus d’inteligencia Artificial].\n","title":"Què és i què no és ChatGPT?","type":"posts"},{"content":"Conferencia John Mc Carty https://www.youtube.com/watch?v=K13_sWm_gZw\u0026t=23s\n","date":"23 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/posts/recursos-hist%C3%B2ria-de-la-inform%C3%A1tica/","section":"Posts","summary":"Conferencia John Mc Carty https://www.youtube.com/watch?v=K13_sWm_gZw\u0026t=23s\n","title":"Recursos sobre història de la informática","type":"posts"},{"content":"Si ets docent i estàs interessat en les IAs generatives i les seves aplicacions a l’ensenyament, t’interessarà saber que ja pots accedir als vídeos del curs “ChatGPT: Oportunitat i Repte per a la docència” al meu canal de Youtube. En aquest curs es tracta sobre ChatGPT, una eina d’IA generativa de text introduïda a finals de 2022, i les seves implicacions per a la docència universitària.\nPlaylist:ChatGPT Oportunitat i repte per a la docència, i ara que fem?\nEn aquest curs, es reflexiona sobre les oportunitats i reptes que aquesta eina suposa per a la productivitat, automatització de tasques i avaluació dels estudiants. També s’analitzen les aplicacions de ChatGPT en la docència universitària, es proposen estratègies per afrontar els reptes i aprofitar les oportunitats de ChatGPT, i s’identifiquen altres IA generatives a tenir en compte.\nEls continguts del curs són molt útils per als docents, ja que s’expliquen què són les IAs generatives, les seves possibilitats presents i futures, i el seu possible impacte en la societat i en l’educació. També s’identifiquen les oportunitats i reptes que suposa l’ús de ChatGPT en la docència, com ara la automatització de tasques i la millora de la productivitat, però també els reptes com el plagi o les dificultats d’avaluació.\nFinalment, el curs proposa estratègies per afrontar els reptes i aprofitar les oportunitats de ChatGPT aplicades als cursos dels participants. Si ets docent i vols estar a l’avantguarda en l’ús de les IAs generatives en la docència, aquest curs és una oportunitat única per aprendre i compartir coneixements. No dubtis en accedir als vídeos del curs “ChatGPT: Oportunitat i Repte per a la docència” al canal de Youtube.\n","date":"23 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/posts/post-1/","section":"Posts","summary":"Si ets docent i estàs interessat en les IAs generatives i les seves aplicacions a l’ensenyament, t’interessarà saber que ja pots accedir als vídeos del curs “ChatGPT: Oportunitat i Repte per a la docència” al meu canal de Youtube. En aquest curs es tracta sobre ChatGPT, una eina d’IA generativa de text introduïda a finals de 2022, i les seves implicacions per a la docència universitària.\n","title":"Videos del curs ChatGPT Oportunitat i repte per a la docencia v.1","type":"posts"},{"content":"","date":"17 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/tags/podcast/","section":"Tags","summary":"","title":"Podcast","type":"tags"},{"content":"Programar es una Mierda és un podcast de referència per parlar de programació amb amor i humor. Crec que aquesta és la tercera participació en aquest programa en què sempre parlem de coses interessants. En aquesta ocasió parlem d’IA i programació.\n","date":"17 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/posts/invitado-en-el-podcast-programa-es-una-mierda/","section":"Posts","summary":"Programar es una Mierda és un podcast de referència per parlar de programació amb amor i humor. Crec que aquesta és la tercera participació en aquest programa en què sempre parlem de coses interessants. En aquesta ocasió parlem d’IA i programació.\n","title":"Podcast: T'ho comIA tot, Programar es una Mierda","type":"posts"},{"content":"","date":"17 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/tags/programaci%C3%B3n/","section":"Tags","summary":"","title":"Programación","type":"tags"},{"content":"","date":"17 de de febrer de 2023","externalUrl":null,"permalink":"/ludo/tags/video/","section":"Tags","summary":"","title":"Video","type":"tags"},{"content":"Cada vegada veig més senyals que indiquen que Google haurà de posar ordre a casa per ser competitiu. Com aquest [https://archive.ph/7BYDG]. Quan això passi, molts serveis gratuïts o molt econòmics simplement seran descontinuats. No oblidem que “Cementiri de Google” creix cada dia.\nLa compra del 49% d’OpenAi per part de Microsoft (que ja tenia un acord de col·laboració previ, els fruits del qual hem vist amb el GITHUB_COPILOT). Si Microsoft integra de manera efectiva les eines d’OpenAI als seus SAAS com Microsoft Office, molts “clients” de Google migraran cap als seus serveis. Això inclou Bing (Bing+GPT-4) i Office, com a serveis SAAS de pagament. Que els usuaris professionals pagaran ben de gust.\nGoogle només sap guanyar diners a costa de vendre anuncis. Ven SAAS, però no és el seu core business ni forma part de la seva cultura. El pobre suport que ofereixen ho demostra. Algú a la sala ha aconseguit parlar amb un humà en un servei de Google? I un assistent tipus ChatGPT que faci de substitut d’un motor de cerca no mostra anuncis i, per tant, no guanya diners en el model de negoci actual de Google. Com resol això Google?\nOn deixa això la continuïtat de Google Apps (drive, classroom, meet, calendar, fins i tot gmail)? Molt probablement en els pròxims 5 anys aquestes eines evolucionaran més que en els darrers 25 anys a mesura que s’hi integrin IA generatives.\nMantenir aquestes eines actualitzades amb l’estat de l’art, suportar el cost computacional (les GPU que executen IA no tenen cost marginal zero, costen diners) serà una decisió de negoci. I no tenim la certesa que Google decideixi continuar jugant.\nI encara que la probabilitat de descontinuar el servei o deixar-lo obsolet com a servei gratuït de baix valor afegit per a usuaris “free” sigui molt baixa, és el risc en què incorren totes les organitzacions que l’utilitzen per a processos crítics.\nOrganitzacions com la UPC estem incorrent en un risc i un deute tecnològic molt important. Quan ens seria fàcil autoabastir-nos amb solucions de codi obert, mantenint el personal de serveis TIC capacitat, i guanyant oportunitats de negoci per a UPCnet o inLabFIB.\nEn l’article Privacy and E-learning a Pending Task (Alier M, Casañ Guerrero MJ, Amo D, Severance C, Fonseca D. Privacy and E-Learning: A Pending Task. Sustainability. 2021; 13(16):9206. https://doi.org/10.3390/su13169206) ja vam parlar dels efectes a llarg termini d’externalitzar serveis core a les universitats. En el cas de l’article, l’aposta per Moodle i el codi obert va demostrar ser l’encertada el 2003. Què passarà el 2023?\n","date":"17 de de gener de 2023","externalUrl":null,"permalink":"/ludo/posts/post-2/","section":"Posts","summary":"Cada vegada veig més senyals que indiquen que Google haurà de posar ordre a casa per ser competitiu. Com aquest [https://archive.ph/7BYDG]. Quan això passi, molts serveis gratuïts o molt econòmics simplement seran descontinuats. No oblidem que “Cementiri de Google” creix cada dia.\n","title":"El risc de continuar amb Google Apps per a universitats com la UPC","type":"posts"},{"content":"","date":"17 de de febrer de 2020","externalUrl":null,"permalink":"/ludo/tags/conversation/","section":"Tags","summary":"","title":"Conversation","type":"tags"},{"content":"En Martin Dougiamas és el creador del projecte de programari de codi obert Moodle. He col·laborat força amb ell en el passat. Fa unes setmanes, en Martin va tenir la gentilesa de venir a veure’m al LISA (Laboratori d’Inovació i Suport Audiovisual del ICE de la UPC) on vam conversar durant més d’una hora i mitja sobre educació, innovació i moltes altres coses.\nEn Martin editarà i retallarà l’àudio per al seu pòdcast, l’OpenEdTec Podcast. La conversa és en anglès, però el vídeo de YouTube té uns subtítols força bons. Ho fa millor amb l’anglès d’en Martin que amb el meu anglès del Maresme. Espero que us agradi.\n","date":"17 de de febrer de 2020","externalUrl":null,"permalink":"/ludo/posts/post-3/","section":"Posts","summary":"En Martin Dougiamas és el creador del projecte de programari de codi obert Moodle. He col·laborat força amb ell en el passat. Fa unes setmanes, en Martin va tenir la gentilesa de venir a veure’m al LISA (Laboratori d’Inovació i Suport Audiovisual del ICE de la UPC) on vam conversar durant més d’una hora i mitja sobre educació, innovació i moltes altres coses.\n","title":"Una conversa amb Martin Dougiamas sobre TIC i educació","type":"posts"},{"content":" Build and display Mermaid.js diagrams in Hugo Export from Notion to Obsidian Github Repo ","externalUrl":null,"permalink":"/ludo/en/cursos/hugo-obsidian-resources/","section":"Cursos / Courses by Marc Alier","summary":" Build and display Mermaid.js diagrams in Hugo Export from Notion to Obsidian Github Repo ","title":"","type":"cursos"},{"content":"","externalUrl":null,"permalink":"/ludo/en/posts/10-prediccions-de-david-poblador/","section":"Posts","summary":"","title":"","type":"posts"},{"content":"","externalUrl":null,"permalink":"/ludo/en/posts/buscador-de-tfgs-de-ingenier%C3%ADa-inform%C3%A1tica/","section":"Posts","summary":"","title":"","type":"posts"},{"content":" Brief Bio # Marc Alier, an Associate Professor at the Politecnical University of Catalonia (UPC), specializes in computer science, information systems, e-learning, IT Ethics and more. With a computer science engineering degree and a Ph.D. in Sustainability, he has contributed significantly to the Moodle community and has authored over 160 academic publications. Alier currently serves as the academic director of the Engineering Education Ph.D. program and teaches multiple courses at UPC’s Barcelona School of Informatics. Short Bio # Hi there! My name is Marc Alier and I’m an Associate Professor at the Politecnical University of Catalonia (UPC) since 2002. My range of interests include computer science and information systems, e-learning, history and ethics of computing, as well as podcasting and building guitars.\nI hold an engineering degree in computer science and a Ph.D. in Sustainability from UPC. I have over 25 years of experience in research and software development related to e-learning ( in the 90’s I designed and developed a couple of forgotten Learning Management Systems (LMS) and educational content authoring tools). I ocalionally create online courses and MOOCs My Youtube Channel.\nI’ve been developing and contributing to the Moodle community since 2004, designing and implementing core functionalities such as the Wiki module, the Webservices layer, and the IMS LTI consumer. Since 2021 my research interest lies in the intersection of education and IA. Over the years, I’ve authored more than 160 academic publications in journals and conferences. For a list of publications and other research information:\nUPC’s Research Portfolio- Futur http://orcid.org/0000-0003-3922-1516 https://scholar.google.com/citations?user=POVraJQAAAAJ https://publons.com/researcher/3163603/marc-alier/ I am a member of the EduSteam Reseach Group.\nCurrently Teaching # At the Doctoral School of UPC I am academic director of the Ph.D. program in Education in Engineering Sciences and Technology.\nAt the Barcelona School of Informatics I currently teach.\nSocial and Environmental Issues Of Information Technologies Bachelors Degree Course on Histoy, Ethics and social aspects of IT. Development and Management of Information Systems Masters Degree course. Management # From 1997 to 2005 Founder, CEO and CTO of Ludoland Informàtica S.L. a small software development company specialized on back-end web development.\nFrom 2004 to 2015 Academic director of several Masters and Post-degree courses (Information management and Business Intelligence with SAP (2004-2012), Software development for PDA’s and mobile phones(2005-2006), Cloud Computing(2009,2012) and Community Management (2014-2015) at https://www.talent.upc.edu\nFrom 2014 to 2015 I was Director of the Institute of Sciences of Education at UPC.\nFrom 2019 to March 2023 deputy director of the Director of Educational Inovation ar the Institute of Sciences of Education at UPC in the management team of Ariadna Llorens.\nFrom Sept 2021 Academic Coordinator of the PHD Program in Science, Engineering and Technology Education\nOther Interests # I’m also a (really) prolific podcaster at\nmossegalapoma.cat, cabalgaelcometa.com zetatesters.com. creapodcast.com Contact Marc # marc.alier (at) upc.edu https://twitter.com/ludo\n","externalUrl":null,"permalink":"/ludo/about/","section":"About- Marc Alier- Asoc Prof at UPC, Luthier Apprentice And Podcaster","summary":"Brief Bio # Marc Alier, an Associate Professor at the Politecnical University of Catalonia (UPC), specializes in computer science, information systems, e-learning, IT Ethics and more. With a computer science engineering degree and a Ph.D. in Sustainability, he has contributed significantly to the Moodle community and has authored over 160 academic publications. Alier currently serves as the academic director of the Engineering Education Ph.D. program and teaches multiple courses at UPC’s Barcelona School of Informatics. ","title":"About- Marc Alier- Asoc Prof at UPC, Luthier Apprentice And Podcaster","type":"about"},{"content":" Table Of Contents # Future Shock Prompts and interactions with ChatGpt used in this video 2. LLM Basics 3. Training ChatGPT Prompts and interactions with ChatGpt used in this video 4 Learning howto better craft prompts Future Shock # Slides\nPrompts and interactions with ChatGpt used in this video # Future shock* Example of engineering problem with wolfram alpha https://www.wolframalpha.com 2. LLM Basics # Slides\n3. Training ChatGPT # Slides\nPrompts and interactions with ChatGpt used in this video # Training ChatGPT to write in our style 4 Learning howto better craft prompts # ChatGPT Understanding, Improving your prompting strategies Embeddings, Context uses and Self Referencing\n[TABLE]\n","externalUrl":null,"permalink":"/ludo/en/cursos/chatgpt-opportunity-and-challenge/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # Future Shock Prompts and interactions with ChatGpt used in this video 2. LLM Basics 3. Training ChatGPT Prompts and interactions with ChatGpt used in this video 4 Learning howto better craft prompts Future Shock # Slides\n","title":"Course: ChatGPT challenge and oportunity for teaching","type":"cursos"},{"content":" Table Of Contents # Introducció 6. Casos d’us de ChatGPT (I) 7. Guerres de Tonner 8. ChatGPT dins l’aula 9. Casos d’us de ChatGPT i II Video 10. El salt de GPT 3.5 a GPT 4 Com a contingut addicional us recomano el pòdcast que vam gravar amb Faraón Llorens la primera setmana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens\nIntroducció # Transparències Vídeo 1\n2. La Llei dels Rendiments Accelerats # Transparències Vídeo 2\n3. Fent Salsitxes amb IA # Transcripció Vídeo 3 Enllaços:\nEina IA de transcripció de veu a text, Whisper https://openai.com/research/whisper Open Broadcaster Studio https://obsproject.com Corrector ortogràfic i gramatical multilingüe https://languagetool.org NVidia Broadcast ##4. ChatGPT, un Model de Machine Learning Generatiu\nTransparències Vídeo 4\n##5. Usant ChatGPT Presa de contacte\nTransparències Vídeo 5\n6. Casos d’us de ChatGPT (I) # Transparències Vídeo 6\n7. Guerres de Tonner # En aquest video pubicat el Març de 2023 jo ja parlava d’eines de detecció de contingut generat en IA en el context educatiu. Ja llavors deia que no disposarem mai d’eines fiables. Sobretot pel risc i dilema etic que comporta usar eines que donen falsos positius. A Setembre de 2023 encara mantinc la meva posició. I sembla ser que la premsa ja ho ha descobert.\nTransparències Vídeo 7\n8. ChatGPT dins l’aula # Transparencies vídeo 8\n9. Casos d’us de ChatGPT i II # Transparencies video 9\nVideo 10. El salt de GPT 3.5 a GPT 4 # markdownCopy code\nCurs subjecte a Llicència Creative Commons Reconeixement-NoComercial-CompartirIgual 4.0 Internacional.\n","externalUrl":null,"permalink":"/ludo/cursos/chatgpt-oportunitat-i-repte/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # Introducció 6. Casos d’us de ChatGPT (I) 7. Guerres de Tonner 8. ChatGPT dins l’aula 9. Casos d’us de ChatGPT i II Video 10. El salt de GPT 3.5 a GPT 4 Com a contingut addicional us recomano el pòdcast que vam gravar amb Faraón Llorens la primera setmana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens\n","title":"Curs ChatGPT Oportunitat i Repte per a la docencia","type":"cursos"},{"content":" Table Of Contents # 1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia 2. Puntos sobre las IAS 4. Las guerras de Tonner 5. GPT Personal Bullshit Generator 6. Casos de uso de ChatGPT (I) 7. ChatGPT Instrumento de consulta Herramientas usadas para crear estos contenidos Como contenido adicional os recomiendo el podcast que grabamos con Faraón Llorens la primera semana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens Un poco largo, pero vale la pena.\n1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia # Transparencias Vídeo 1\n2. Puntos sobre las IAS # Transparencias Vídeo 2\n3. Entrenando a ChatGPT # Transcripción Vídeo 3\n4. Las guerras de Tonner # Transparencias Vídeo 4\n5. GPT Personal Bullshit Generator # Transparencias Vídeo 5\n6. Casos de uso de ChatGPT (I) # [Transparencias Vídeo 6](pages/open_courseware/es/6_chatgpt_es 1.pdf)\n7. ChatGPT Instrumento de consulta # Transparencias Vídeo 7\nHerramientas usadas para crear estos contenidos # Enlaces:\nHerramienta IA de transcripción de voz a texto, Whisper https://openai.com/research/whisper Open Broadcaster Studio https://obsproject.com Corrector ortográfico y gramatical multilingüe https://languagetool.org NVidia Broadcast [TABLE]\n","externalUrl":null,"permalink":"/ludo/es/cursos/chatgpt-oportunidad-y-reto/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # 1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia 2. Puntos sobre las IAS ","title":"Curso ChatGPT: Oportunidad y Reto para la Docencia. Version en Castellano (Mayo-Junio 2023)","type":"cursos"},{"content":" Cursos en Català # ChatGPT: Oportunitat i Repte per a la Docència Cursos en Castellano # ChatGPT: Oportunidad y Reto para la Docencia Courses in English # ChatGPT: Opportunity and Challenge for Education Resources for Hugo + Obsidian Web Publishing ","externalUrl":null,"permalink":"/ludo/cursos/","section":"Cursos / Courses by Marc Alier","summary":"Cursos en Català # ChatGPT: Oportunitat i Repte per a la Docència Cursos en Castellano # ChatGPT: Oportunidad y Reto para la Docencia Courses in English # ChatGPT: Opportunity and Challenge for Education Resources for Hugo + Obsidian Web Publishing ","title":"Cursos / Courses by Marc Alier","type":"cursos"},{"content":" Models de Traducció i Conversió de Veu i Text # SeamlessM4T: Traducció Multilingüe: Model open source que tradueix text i parla entre diferents idiomes, suportant prop de 100 idiomes en text i 36 en parla. - Enllaç Speech Gen: Conversió Text a Veu: Eina de pagament que converteix text a veu amb alta qualitat. - Enllaç Whisper: Reconeixement de Veu: Model open source d’OpenAI per al reconeixement de veu amb algunes limitacions en converses bilíngües. - Enllaç Whisper-ctranslate2: Millora de Whisper: Millora del model Whisper, amb implementacions més ràpides per SoftCatalà. - Enllaç https://github.com/ggerganov/whisper.cpp versió high performance de Whisper.. oferint api com openai i tot https://github.com/ggerganov/whisper.cpp/pull/1380 Insanely Fast Whisper with Speaker Diarization (GitHub Repo) A somewhat opinionated CLI tool for transcribing audio files. It also now includes speaker segmentation and diarization (e.g., recognizing speaker 1 vs speaker 2). The claim is they can transcribe 2.5 hrs of audio in 100s, even on some of the largest models available. Text a veu # https://github.com/coqui-ai/TTS\nMillora d’audio # Resemble enhance # “Resemble Enhance” és una eina impulsada per la intel·ligència artificial que té com a objectiu millorar la qualitat general de la parla realitzant desenrenou i millora. Consisteix en dos mòduls: un desenrenoador, que separa la parla d’un àudio sorollós, i un millorador, que augmenta encara més la qualitat perceptiva de l’àudio restaurant distorsions d’àudio i ampliant l’amplada de banda de l’àudio. Els dos models estan entrenats amb dades de parla de 44.1kHz d’alta qualitat que garanteixen la millora de la teva parla amb alta qualitat. https://github.com/resemble-ai/resemble-enhance/tree/main\nProcessament d’Imatges # Segment-anything: Segmentació d’Objectes: Model open source de Meta per a la segmentació d’objectes en imatges. - Enllaç Generació d’Imatges: Eina que crea imatges a partir de prompts, com l’exemple de “Elven Lady Galadriel”. - Enllaç emu edit https://emu-edit.metademolab.com APPLE MGIE https://venturebeat.com/ai/apple-releases-mgie-a-revolutionary-ai-model-for-instruction-based-image-editing/?utm_source=tldrai https://github.com/apple/ml-mgie Anàlisi de Documents # Mapdeduce i Chatpdf: Anàlisi de PDF: Eines per analitzar contingut de fitxers PDF, possiblement usant l’API d’OpenAI (GPT-3.5-turbo). - Mapdeduce, Chatpdf Disseny de Logos # Logomaster.ai: Generació de Logos: Eina automàtica per a la generació de logos. - Enllaç Eines de Desenvolupament # Ollama.ai Entorn que permet l’execució de models open source en local. Projecte molt potent que ofereix interficie shell, API-REST, i projectes paralels com Ollama Web UI, o Instructor https://jxnl.github.io/instructor/blog/2024/02/08/ollama/ ChromaDB Ludwig: Aprenentatge Automàtic No Code: Eina per a la creació de pipelines d’aprenentatge automàtic sense necessitat de codificació. - Enllaç Haystack: Eina per al desenvolupament amb diversos models i pipelines. - Enllaç LLM Patterns: Avaluació de LLMs: Patrons per a l’avaluació de Models de Llenguatge de Màquina. - Enllaç PromptTools: Eines per a LLMs: Conjunt d’eines per a l’avaluació i experimentació amb Models de Llenguatge de Màquina. - Enllaç Streamlit https://streamlit.io Run llama RAGS https://github.com/run-llama/rags?utm_source=tldrnewsletter ingest and vectorize https://unstructured-io.github.io/unstructured/examples/chroma.html E-commerce # Marketsy.ai: Creació de Botigues en Línia: Eina per crear botigues en línia amb diverses plantilles i opcions de personalització. - Enllaç Eines de Disseny Gràfic # Eina de Microsoft per al disseny d’imatges, diapositives, retols a partir de prompts. - Enllaç Models de Visió # CLIP: Model d’OpenAI que combina text i imatge per a diverses tasques visuals. - Enllaç LLaVa: Model que pot respondre preguntes sobre imatges, accessible en maquinari de consumidor. - Enllaç **REKA Multimodal https://reka.ai/reka-flash-an-efficient-and-capable-multimodal-language-model/?utm_source=tldrai Generació de Música a partir de Prompt # Stable Audio: Sistema per generar música i efectes sonors a partir de descripcions de text. - Enllaç ChatGPT Plugins # Webpilot: Plugin per a consultes a pàgines web. Wolfram: Plugin per accedir a dades científiques i realitzar càlculs matemàtics. Smart Slides: Plugin que assisteix en la creació de diapositives. Sumarització # https://scisummary.com https://chatpdf.com\nDatasets # SCB-ST-Dataset4: Dataset per l’estudi del comportament espai-temporal en escenaris d’aula. - Enllaç Cada descripció proporciona una idea clara del que ofereix cada eina o tecnologia, acompanyada dels enllaços per a més detalls.\nLLMs # NexusRaven v2 # https://nexusflow.ai/blogs/ravenv2 NexusRaven-V2, un model de llenguatge de 13B, ha superat GPT-4 en la capacitat de cridar funcions sense exemples previs. Això permet convertir instruccions en llenguatge natural en codi executable. Destaca per la seva alta taxa d’èxit en casos d’ús humans, és de codi obert i fàcil d’integrar. Inclou un banc de proves de crida de funcions i un tauler de líders amb exemples humans, cobrint una àmplia gamma de casos i dificultats. És notable per la seva robustesa i precisió, superant els APIs de models de llenguatge propietaris.\nPer a més detalls, pots visitar la pàgina web original aquí.\narticles essencials # Attacks on machine learning models # Prompt Engineering # https://github.com/dair-ai/Prompt-Engineering-Guide\nInteresting engines # scholar.ai perplexity.ai consensus.ai\n","externalUrl":null,"permalink":"/ludo/eines_ia/","section":"Directori d'eines IA útils","summary":"Models de Traducció i Conversió de Veu i Text # SeamlessM4T: Traducció Multilingüe: Model open source que tradueix text i parla entre diferents idiomes, suportant prop de 100 idiomes en text i 36 en parla. - Enllaç Speech Gen: Conversió Text a Veu: Eina de pagament que converteix text a veu amb alta qualitat. - Enllaç Whisper: Reconeixement de Veu: Model open source d’OpenAI per al reconeixement de veu amb algunes limitacions en converses bilíngües. - Enllaç Whisper-ctranslate2: Millora de Whisper: Millora del model Whisper, amb implementacions més ràpides per SoftCatalà. - Enllaç https://github.com/ggerganov/whisper.cpp versió high performance de Whisper.. oferint api com openai i tot https://github.com/ggerganov/whisper.cpp/pull/1380 Insanely Fast Whisper with Speaker Diarization (GitHub Repo) A somewhat opinionated CLI tool for transcribing audio files. It also now includes speaker segmentation and diarization (e.g., recognizing speaker 1 vs speaker 2). The claim is they can transcribe 2.5 hrs of audio in 100s, even on some of the largest models available. Text a veu # https://github.com/coqui-ai/TTS\n","title":"Directori d'eines IA útils","type":"eines_ia"},{"content":"","externalUrl":null,"permalink":"/ludo/series/","section":"Series","summary":"","title":"Series","type":"series"}]