[{"content":"","date":"11 mayo 2026","externalUrl":null,"permalink":"/ludo/en/tags/ai/","section":"Tags","summary":"","title":"Ai","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/categories/","section":"Categories","summary":"","title":"Categories","type":"categories"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/tags/gesti%C3%B3-coneixement/","section":"Tags","summary":"","title":"Gestió-Coneixement","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/tags/gesti%C3%B3n-conocimiento/","section":"Tags","summary":"","title":"Gestión-Conocimiento","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/tags/ia/","section":"Tags","summary":"","title":"Ia","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/tags/infraestructura/","section":"Tags","summary":"","title":"Infraestructura","type":"tags"},{"content":"","date":"11 mayo 2026","externalUrl":null,"permalink":"/ludo/en/tags/infrastructure/","section":"Tags","summary":"","title":"Infrastructure","type":"tags"},{"content":"","date":"11 mayo 2026","externalUrl":null,"permalink":"/ludo/en/tags/knowledge-management/","section":"Tags","summary":"","title":"Knowledge-Management","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/tags/llms-locales/","section":"Tags","summary":"","title":"Llms-Locales","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/tags/llms-locals/","section":"Tags","summary":"","title":"Llms-Locals","type":"tags"},{"content":"","date":"11 mayo 2026","externalUrl":null,"permalink":"/ludo/en/tags/local-llms/","section":"Tags","summary":"","title":"Local-Llms","type":"tags"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/","section":"Marc Alier (Ludo)","summary":"","title":"Marc Alier (Ludo)","type":"page"},{"content":"En una ejecución reciente tuve LLMs locales trabajando más de 28 horas, masticando cuatrocientos treinta y siete ficheros markdown. El modelo era qwen3.5:122b, servido vía Ollama en dos Mac Studio sobre una red local privada. La tarea, nada glamurosa: leer un fichero, devolver un JSON con un resumen de dos frases, las personas nombradas, las etiquetas de temas, las ideas clave que el fichero argumenta. Repetir. Agregar entre ficheros. Escribir los andamios por entrada.\nSi intento hacerlo con claude code me quedo sin tokens en un suspiro, y aun pagando proveedores chinos de nube baratos acabaré no haciendo este tipo de optimizaciones del repositorio de contenidos porque se puede encarecer pronto.\nDesde entonces he empezado a sustituir aquel pipeline por DS4 ejecutando DeepSeek V4 Flash Q4 sobre el mismo hardware. La latencia por llamada ha caído de ciento cincuenta segundos a unos doce. Misma tarea. Misma forma de prompt. Motor distinto, el doble de tamaño en RAM. Una mejora rotunda en rendimiento, e incluso noto que la máquina Studio funciona más fresca.\nEste post es la nota de optimización. Lo que quiero de la flota local es un LLM de calidad con coste variable que se acerque a cero, para tareas por lotes — indexación de wikis, auditoría de referencias, limpieza de transcripciones, clasificación en masa. El tipo de trabajo donde el cuello de botella es la latencia y la fiabilidad, no la inteligencia. Dos motores, dos posturas, una compensación que vale la pena nombrar.\nEl caso de uso # Un índice wiki sobre un repositorio personal de escritura e investigación. Unos cuatrocientos ficheros markdown: capítulos, borradores, material de fuentes, notas de memoria — ¡incluso mi tesis doctoral entera está ahí dentro! Para cada fichero quiero un pequeño artefacto estructurado: un resumen que el índice pueda mostrar, entidades nombradas para poblar las facetas de personas/temas/ideas-clave, referencias cruzadas entre ellas.\nEsto es extracción masiva. Prompt de sistema reutilizable; contenido de usuario variable; salida JSON estructurada. El modelo no necesita ser listo — necesita ser fiable, predecible y estar lo bastante disponible como para tirar adelante cientos de llamadas sin romperse.\nLlamar a un LLM en este registro es un deporte distinto a conversar con uno. La salida es la entrada del siguiente paso del pipeline. Si el veinte por ciento de las llamadas vuelven vacías, es el veinte por ciento de la wiki que falta. Si duplicas la longitud de contexto y la calidad se degrada silenciosamente, el corpus que hay que trocear es tu fichero más grande. La superficie de ingeniería que importa es la latencia, la previsibilidad y el fallo elegante.\nEl patrón wiki de Karpathy # A principios de abril de 2026 Andrej Karpathy publicó un tweet que se hizo viral: \u0026ldquo;a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating [knowledge].\u0026rdquo; Esbozaba un sistema donde las fuentes en bruto — artículos, papers, repositorios, datasets, incluso imágenes — caen en un directorio raw/, y un agente LLM las compila incrementalmente en una wiki estructurada: ficheros markdown enlazados con resúmenes, backlinks, páginas de conceptos. Dos días después lo completó con un idea file — un gist de GitHub que describe el patrón conceptualmente, sin código adjunto, bajo la teoría de que en la era de los agentes la idea es más útil de compartir que la implementación.\nAquel tweet describe el proyecto que estoy construyendo casi palabra por palabra. El repositorio que estoy indexando son años de escritura — capítulos, borradores, transcripciones de fuentes, notas de memoria, todo el lote. El bootstrap que ejecuté es el paso de compilación incremental que Karpathy nombra. Las operaciones que esboza río abajo — ingesta, consulta, lint — son lo que viene a continuación para mí. No inventó el patrón, pero lo hizo legible: lo nombró, le dio forma, lo hizo público en el momento en que el utillaje sobre hardware local lo había alcanzado. Este verano estará en todas partes.\nVersatilidad frente a especialización # Dos posturas se sientan en los extremos del espectro de los LLM locales.\nOllama es el extremo versátil. Sirve cualquier modelo de su biblioteca — Qwen, Llama, Mistral, Gemma, Phi, lo que sea que puedas pillar como GGUF. Una instalación, GUI y CLI, una API HTTP, y puedes cambiar de modelo por tarea. Si cambias de modelo cada semana, Ollama es la herramienta correcta: la fricción de probar uno nuevo es un solo comando ollama pull.\nDS4 es el extremo especializado, el recién llegado. Sirve un modelo — DeepSeek V4 Flash cuantizado en q2 o q4 — y está dedicado a hacer que ese único modelo funcione tan bien como un Mac Studio permita. Caché KV residente en disco, kernels conscientes de MoE, decodificación especulativa MTP, una API HTTP compatible con OpenAI por encima. No puede servir ningún otro modelo. Eso no es un bug; es el diseño y la intención.\nLa compensación es directa. Si te comprometes con un modelo y lo usas intensamente — mismo prefijo de prompt, cientos de llamadas al día, coste de prefill amortizado sobre miles de inferencias — la especialización se paga sola rápidamente. Si saltas entre modelos, el motor especializado es coste hundido. La respuesta correcta depende de cuánto lo uses de verdad.\nOllama + qwen3.5:122b — el titular versátil # qwen3.5:122b es un Mixture-of-Experts potente, 125 mil millones de parámetros totales, capacidad de sobra. Servido vía Ollama es una instalación de una línea y una presencia permanente en la LAN. Ha sido el \u0026ldquo;Tier 1\u0026rdquo; de mi taller durante meses: todo lo que es mecánico y voluminoso y por lo que no quiero pagar una API va ahí.\nPara el bootstrap de la wiki, dos observaciones merecen quedar registradas.\nEl precipicio de contexto. Capé cada llamada a 12k tokens de entrada con un techo duro de 16k vía --num-ctx 16000. Pasado el 16k, la calidad se degrada de manera visible — colas truncadas, entidades nombradas que se pierden, cualificadores numéricos que caen. El capítulo de 30k, la transcripción de 70k, el fichero de cosmovisión de 50k, todos tuvieron que trocearse, resumirse por trozo y reagregar. Cada trozo es otra llamada de Ollama.\nEl modo de fallo de salida vacía. A lo largo de la ejecución, entre el dieciocho y el veinte por ciento de las llamadas devolvía len=0 — un completado vacío. Ni JSON malformado, ni contenido rechazado, simplemente nada. A través de ficheros de todos los tamaños; no predicho por tamaño, tipo, ni contenido. Reintentar la misma llamada suele producir el mismo resultado. Mi mitigación fue una pasada de reintentos con gpt-5-mini vía OpenAI — unos veinte céntimos por cada cien ficheros. Barato, pero no gratis, y no es la cuestión.\nDS4 + DeepSeek V4 Flash — la pila especializada # DS4 es un motor de inferencia alpha construido por antirez, dedicado a DeepSeek V4 Flash — un modelo MoE de 284B totales / 13B activos. La especificación del modelo afirma hasta un millón de tokens de contexto; yo ejecuto el servidor con --ctx 200000 y he probado ficheros hasta 70k tokens. Expone una API HTTP compatible con OpenAI en el puerto 8000 y mantiene una caché KV SHA1 en disco que persiste entre reinicios del servidor.\nTres de esas propiedades importan para la extracción por lotes:\nLa caché KV reutiliza prefijos de prompt. Cuando el prompt de sistema es idéntico en cada llamada — y en un pipeline de extracción estructurada siempre lo es — el coste de prefill se paga una vez, luego queda en caché en disco. De la segunda llamada en adelante el coste por llamada baja dramáticamente. A lo largo de una ejecución larga eso se compone en el ahorro más grande.\n200k de contexto (el modelo reclama más, yo solo he probado hasta aquí). Se acabó trocear los ficheros de 70k. Todo entero entra, todo entero sale resumido. Menos lógica de agregación, menos riesgo de perder una sección.\nNotablemente mejor en salida JSON estructurada en mis primeras pruebas. Cero fallos de salida vacía en las primeras ejecuciones.\nRendimiento de hardware en el M3 Ultra: ~38 tokens por segundo de prefill, 32 de generación — consistente con los números documentados por antirez. La latencia por llamada en el pipeline de enriquecimiento en vivo es de 6,3 a 25,9 s, media 11,6 s para una llamada de 2k de entrada y 500 tokens de salida (últimas 200 llamadas de una ejecución de 1.241). La misma forma de llamada con qwen3.5:122b corría a 90–290 s, media 150–200 s. Un orden de magnitud en el tiempo de reloj que más importaba.\nLatencia media por llamada, en segundos Gráfico de barras verticales. Ollama + Qwen3.5:122b: ~175s de media. DS4 + DeepSeek V4 Flash: 11,6s de media. Medido en Mac Studio M3 Ultra con la misma forma de llamada (2k de entrada, 500 tokens de salida). Latencia media por llamada segundos (más bajo es mejor)\n0 50 100 150 200 ~175s Ollama + Qwen3.5:122b 11,6s DS4 + DeepSeek V4 Flash Q4 Mac Studio M3 Ultra · llamada de 2k de entrada, 500 tokens de salida · diferencia ≈15× La imagen de fiabilidad es más nítida que la de latencia, y la que decide si el pipeline es utilizable en absoluto. Cero fallos silenciosos en 1.241 llamadas, frente a uno de cada cinco con Qwen. El prompt de sistema le dice al modelo \u0026ldquo;si el contexto es demasiado fino, muestra INSUFFICIENT_CONTEXT y nada más\u0026rdquo; — DeepSeek V4 Flash obedece el 15,6 % de las veces. El andamio se mantiene en su sitio; nada se inventa. Qwen, cuando fallaba, fallaba en silencio.\nMétrica DS4 + DeepSeek V4 Flash Ollama + Qwen3.5:122b Latencia por llamada, media 11,6 s 150–200 s Latencia por llamada, rango 6,3 – 25,9 s ~90 – 290 s Fallos silenciosos de salida vacía 0 / 1.241 ~18–20 % Rechazos honestos (andamio mantenido) 194 / 1.241 (15,6 %) n/a Presupuesto de contexto que aguanta calidad 200k tokens (probados) ~16k efectivos Reutilización de caché entre llamadas SHA1 en disco, persistente ninguna Una observación poco científica que merece quedar registrada: el Mac Studio funciona más fresco con DS4 a casi máxima GPU que con Ollama+Qwen3.5:122b a carga comparable. Sin benchmark, solo la temperatura de la carcasa.\nNo atado a DS4. El truco de la caché KV en disco no es propietario. llama.cpp puede mantener caché de prefijos en memoria hoy mismo y tiene caché persistente en disco en el roadmap; Ollama va por encima y lo heredará. El patrón — motor especializado, reutilización de prefijo de prompt — es portable, y la optimización se extenderá a cualquier modelo que estés sirviendo en cada momento.\nGeneración en catalán # No estoy comparando la calidad de generación de estos dos motores en este post. Esa es una pregunta distinta, y en textos lo bastante largos y de peso no confiaría en ninguno de los dos para que me escriba el trabajo. Para el catalán en particular, mi norma vigente es que cualquier cosa generada por un modelo local por debajo del umbral aproximado de ~250B parámetros efectivos pierde el idioma — el ritmo, el vocabulario que no se traduce. Qwen3.5:122b no pasa la prueba. DeepSeek V4 Flash, con trece mil millones de parámetros activos en inferencia, queda en la misma clase efectiva de tamaño y espero que falle la misma prueba hasta que una tanda real de traducción me diga lo contrario.\nLa traducción con catalán como lengua objetivo, en mi taller, va a Claude o a un modelo frontera de OpenAI. La flota local cubre solo el granel ES/EN. El ahorro de coste vive en el lado mecánico en granel; la voz y el idioma no son para ahorrar.\nDesmonetización, en el sentido de Diamandis # En Bold (2015), Peter Diamandis y Steven Kotler describen seis efectos que siguen una vez una tecnología se digitaliza: se vuelve engañosa, disruptiva, desmonetizada, desmaterializada, democratizada. La desmonetización es la que importa aquí. Hace un año, indexar cuatrocientos ficheros markdown personales con un LLM no era económicamente obvio — a precios de API frontera la factura habría sido real, los límites de tasa la habrían estirado a lo largo de semanas. Hoy, sobre hardware que ya poseo, el mismo trabajo es una sola ejecución por lotes a cero coste variable. La llamada marginal es gratis.\nCuando el coste marginal se acerca a cero, los casos de uso que emergen son los que no compensaban la factura antes. La indexación wiki de un corpus personal es uno. Limpieza de transcripciones a escala, borradores multilingües para cosas que vas a reescribir igualmente, búsqueda semántica sobre cientos de papers, auditoría de referencias, extracción de ontologías — cada uno era \u0026ldquo;interesante pero no lo bastante interesante\u0026rdquo; a precios de API frontera, y cada uno es un proyecto secundario ahora.\nEsa es la optimización que importa. No \u0026ldquo;Ollama frente a DS4\u0026rdquo; — esa decisión es pequeña, y la respuesta cambia a medida que llama.cpp se pone al día. La optimización es encontrar los flujos de trabajo que solo tienen sentido una vez que el coste por llamada ha desaparecido.\nReferencia técnica rápida # Si quieres probar el camino DS4 en una máquina Apple Silicon con suficiente memoria (256–512 GB para el build Q4, 96–192 GB para el Q2):\n# 1. Clona + compila (~30 segundos) mkdir -p ~/Code \u0026amp;\u0026amp; cd ~/Code git clone https://github.com/antirez/ds4.git cd ds4 \u0026amp;\u0026amp; make # 2. Descarga el modelo (Q4: 153 GB, Q2: 81 GB) — GGUFs publicados por antirez ./download_model.sh q4 # o `q2` para el build más pequeño # 3. Arranca el servidor mkdir -p ~/.ds4-kv ./ds4-server \\ --ctx 200000 \\ --kv-disk-dir ~/.ds4-kv \\ --kv-disk-space-mb 32768 # 4. Llámalo como cualquier endpoint de OpenAI curl -s http://192.168.1.35:8000/v1/chat/completions \\ -H \u0026#34;Content-Type: application/json\u0026#34; \\ -d \u0026#39;{\u0026#34;model\u0026#34;: \u0026#34;deepseek-v4-flash\u0026#34;, \u0026#34;messages\u0026#34;: [{\u0026#34;role\u0026#34;:\u0026#34;user\u0026#34;,\u0026#34;content\u0026#34;:\u0026#34;Hola\u0026#34;}]}\u0026#39; Por defecto el servidor debería escuchar en 0.0.0.0:8000, aunque la versión que compilé escuchaba en 127.0.0.1:8000 y hubo que reconfigurarla explícitamente para alcanzarla desde la LAN. El --kv-disk-dir es donde vive la caché KV SHA1 — mantenedlo en NVMe interno, no en almacenamiento externo. La primera llamada a un servidor en frío tarda diez a sesenta segundos en cargar los pesos; las siguientes llamadas los reutilizan.\n","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/posts/local-llms-as-bulk-tools/","section":"Posts","summary":"En una ejecución reciente tuve LLMs locales trabajando más de 28 horas, masticando cuatrocientos treinta y siete ficheros markdown. El modelo era qwen3.5:122b, servido vía Ollama en dos Mac Studio sobre una red local privada. La tarea, nada glamurosa: leer un fichero, devolver un JSON con un resumen de dos frases, las personas nombradas, las etiquetas de temas, las ideas clave que el fichero argumenta. Repetir. Agregar entre ficheros. Escribir los andamios por entrada.\n","title":"Optimizando mi configuración de LLMs locales para tareas por lotes","type":"posts"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/categories/posts/","section":"Categories","summary":"","title":"Posts","type":"categories"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/posts/","section":"Posts","summary":"","title":"Posts","type":"posts"},{"content":"","date":"11 de mayo de 2026","externalUrl":null,"permalink":"/ludo/es/tags/","section":"Tags","summary":"","title":"Tags","type":"tags"},{"content":"La escuela de doctorado de la Universidad de Lleida me ha invitado a dar una conferencia (keynote) en su jornada de doctorado el 6/3/2024. Aquí encontraréis el audio y el video de la conferencia:\nhttps://mossegalapoma.cat/el-moment-sputnik-conferencia-den-ludo-marc-alier-a-la-jornada-de-lescola-de-doctorat-de-lleida/\n","date":"1 de marzo de 2024","externalUrl":null,"permalink":"/ludo/es/posts/conferencia-a-la-udl/","section":"Posts","summary":"La escuela de doctorado de la Universidad de Lleida me ha invitado a dar una conferencia (keynote) en su jornada de doctorado el 6/3/2024. Aquí encontraréis el audio y el video de la conferencia:\n","title":"'El Momento Sputnik' conferencia de Marc Alier en la Jornada de Doctorado de la Universidad de Lleida","type":"posts"},{"content":"","date":"1 de marzo de 2024","externalUrl":null,"permalink":"/ludo/es/tags/educaci%C3%B3/","section":"Tags","summary":"","title":"Educació","type":"tags"},{"content":"","date":"12 de febrero de 2024","externalUrl":null,"permalink":"/ludo/es/tags/chatgpt/","section":"Tags","summary":"","title":"Chatgpt","type":"tags"},{"content":"ChatGPT me resume sobre el artículo en The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, profesor en la Birkbeck, University of London, explora el dilema que enfrentan los profesores con el uso de IA por parte de los estudiantes en la redacción de ensayos. Tras detectar un ensayo marcado como “100% generado por IA”, Topinka se encuentra en una situación difícil cuando un estudiante excepcionalmente brillante impugna esta acusación. El caso subraya los desafíos de los detectores de IA, como Turnitin, que pueden confundir el uso legítimo de apoyo tecnológico por parte de los estudiantes con trampa. Topinka argumenta la necesidad de adaptar la evaluación académica a la era de la IA, proponiendo alternativas como presentaciones y podcasts para demostrar el pensamiento crítico y original de los estudiantes, evitando acusaciones injustas y promoviendo la igualdad de oportunidades educativas.\nEl último año he dado cursos a profesores y profesoras de más de 7 universidades (Pueden ver parte del contenido en https://wasabi.essi.upc.edu/ludo/cursos) y siempre he recibido preguntas respecto a cómo detectar que un trabajo lo ha hecho una IA en vez de una persona.\nLos trabajos copiados no son una novedad. Cuando todavía era estudiante daba clases de repaso de la asignatura programación metódica en una academia, y un día me pidieron resolver un ejercicio que resultó ser el mismo que salió en el examen. No me pregunten de dónde salió aquel enunciado, porque no lo sé. Tampoco seguí trabajando en esa academia para averiguarlo.\nDesde que existe la web tenemos cosas como “El rincón del vago” donde estudiantes comparten apuntes, ejercicios y prácticas resueltas. Y en Instagram los estudiantes reciben publicidad de empresas que ofrecen hacerles el trabajo de fin de grado o de máster… para que tengan tiempo para dedicar a su crush. Yo mismo recibo anuncios en X (antes twitter) de empresas que se ofrecen a escribir artículos de investigación en mi campo y publicarlos en mi nombre en prestigiosas revistas.\nPero el problema es la IA. Claro. Porque permite hacer las cosas a escala y a costos irrisorios. Y ahora corremos todos a ella.\nY lo que queremos son soluciones fáciles, como tomar antiinflamatorios, pero aplicados a la calidad docente y a la paz mental que te da un cuadro de control. Sistemas como Urkund y Turnitin, se integran a nuestros Moodle’s y Sakais y nos dicen en qué porcentaje los entregables de nuestros estudiantes son originales o son copias de cosas online o de los trabajos de sus compañeros.\nComo decía Bruce Willis en “The Kid”: “los sándwiches dan seguridad”. Y el color verde al lado de una entrega da paz de espíritu.\nPero ya hace años que los alumnos insertan caracteres en cirílico que parecen letras en el alfabeto latino (ver tabla de caracteres confundibles en https://github.com/mindcrypt/uriDeep/blob/master/data/deepDiccConfusables.txt) y que burlan los sistemas anti copia sin problema.\n¿Y los sistemas de detección de contenido generado por IA?\nEn febrero de 2023 ya dije, y está en YouTube grabado en silicio, que para textos de menos de una página es imposible decir con certeza si un texto ha sido generado por IA o ha sido una persona. Más adelante investigadores de la Universidad de Maryland publicaron “Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W., \u0026amp; Feizi, S. (2023). ¿Puede el texto generado por IA ser detectado de manera fiable? arXiv:2303.11156 [cs.CL]. https://doi.org/10.48550/arXiv.2303.11156”\nVemos en el abstract:\nA continuación, proporcionamos un resultado teórico de imposibilidad que indica que a medida que los modelos de lenguaje se vuelven más sofisticados y mejores en emular el texto humano, el rendimiento del mejor detector posible disminuye. Para un modelo de lenguaje suficientemente avanzado que busca imitar el texto humano, incluso el mejor detector posible podría actuar solo marginalmente mejor que un clasificador aleatorio. Nuestro resultado es lo suficientemente general para capturar escenarios específicos como estilos de escritura particulares, diseño inteligente de prompts o parafraseo de texto.\nO sea, que NO, que no se puede detectar con fiabilidad si un texto ha sido generado por IA. El sistema no será fiable y generará errores: falsos negativos y falsos positivos.\nAhora, hablemos de ética. Ética de la IA de verdad, no de pachanga. La ética de un profesor que decide delegar su juicio a una máquina que dice que un alumno ha “copiado con IA”. La ética de una empresa que vende el servicio de esa máquina que… NO FUNCIONA.\nLos falsos positivos pueden tener impacto sobre la carrera de un estudiante, o un investigador que entra en la lista negra de una editorial a partir de un discriminador IA.\n“La IA me ha dicho que has copiado con IA.” Es una exhibición de cinismo y de pereza, de no querer hacer las cosas bien. De no pensar que si una IA hace el ejercicio que pides, quizás deberías pedir otra cosa.\nAlguna profesora me ha explicado, para mi horror, que su detector de contenido hecho con IA es ChatGPT. Y que se lo cree.Desde hace unos meses ChatGPT ha dejado de mojarse cuando le preguntan si un texto ha sido generado por IA.\n","date":"12 de febrero de 2024","externalUrl":null,"permalink":"/ludo/es/posts/la-ia-dice-que-has-hecho-los-deberes-con-ia./","section":"Posts","summary":"ChatGPT me resume sobre el artículo en The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, profesor en la Birkbeck, University of London, explora el dilema que enfrentan los profesores con el uso de IA por parte de los estudiantes en la redacción de ensayos. Tras detectar un ensayo marcado como “100% generado por IA”, Topinka se encuentra en una situación difícil cuando un estudiante excepcionalmente brillante impugna esta acusación. El caso subraya los desafíos de los detectores de IA, como Turnitin, que pueden confundir el uso legítimo de apoyo tecnológico por parte de los estudiantes con trampa. Topinka argumenta la necesidad de adaptar la evaluación académica a la era de la IA, proponiendo alternativas como presentaciones y podcasts para demostrar el pensamiento crítico y original de los estudiantes, evitando acusaciones injustas y promoviendo la igualdad de oportunidades educativas.\n","title":"La IA dice que has hecho los deberes con IA.","type":"posts"},{"content":"ChatGPT me resume sobre el artículo en The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, profesor en Birkbeck, University of London, explora el dilema al que se enfrentan los profesores con el uso de IA por parte de los estudiantes en la redacción de ensayos. Tras detectar un ensayo marcado como “100% generado por IA”, Topinka se encuentra en una situación difícil cuando un estudiante excepcionalmente brillante impugna esa acusación. El caso subraya los desafíos de los detectores de IA, como Turnitin, que pueden confundir el uso legítimo de apoyo tecnológico por parte de los estudiantes con hacer trampa. Topinka argumenta la necesidad de adaptar la evaluación académica a la era de la IA, proponiendo alternativas como presentaciones y pódcast para demostrar el pensamiento crítico y original de los estudiantes, evitando acusaciones injustas y promoviendo la igualdad de oportunidades educativas.\nEl último año he impartido cursos a profesoras y profesores de más de 7 universidades ( Podéis ver parte del contenido en https://wasabi.essi.upc.edu/ludo/cursos ) y siempre he recibido preguntas al respecto de cómo detectar que un trabajo lo ha hecho una IA en vez de una persona.\nLos trabajos copiados no son una novedad. Cuando aún era estudiante daba clases de repaso de la asignatura programación metódica en una academia, y un día me pidieron resolver un ejercicio que resultó ser el mismo que salió en el examen. No me preguntéis de dónde salió aquel enunciado, porque no lo sé. Tampoco seguí trabajando en aquella academia para averiguarlo.\nDesde que existe la web tenemos cosas como “El Rincón del Vago” donde estudiantes comparten apuntes, ejercicios y prácticas resueltos. Y en Instagram los estudiantes reciben publicidad de empresas que ofrecen hacerles el trabajo de fin de grado o de máster… para que les quede tiempo para dedicárselo a su crush. Yo mismo recibo anuncios en X (antes Twitter) de empresas que se ofrecen a escribir artículos de investigación en mi campo y publicarlos en mi nombre en prestigiosas revistas.\nPero el problema es la IA. Claro. Porque permite hacer las cosas a escala y a costes irrisorios. Y ahora corremos todos.\nY lo que queremos son soluciones fáciles, como tomar antiinflamatorios, pero aplicadas a la calidad docente y a la paz mental que te da un cuadro de control. Sistemas como Urkund y Turnitin se integran en nuestros Moodle y Sakai y nos dicen en qué porcentaje las entregas de nuestros estudiantes son originales o están fusiladas de cosas online o de los trabajos de sus compañeros.\nComo decía Bruce Willis en “The Kid”: “sandwiches give security”. Y el color verde al lado de una entrega da paz de espíritu.\nPero ya hace años que los alumnos insertan caracteres en cirílico que parecen letras del alfabeto latino (ver tabla de caracteres confundibles en https://github.com/mindcrypt/uriDeep/blob/master/data/deepDiccConfusables.txt ) y que burlan los sistemas anticopia sin problema.\n¿Y los sistemas de detección de contenido generado por IA?\nEn febrero de 2023 ya dije, y está en YouTube grabado en silicio, que para textos de menos de una página es imposible decir con certeza si un texto ha sido generado por IA o ha sido una persona. Más adelante, investigadores de la Universidad de Maryland publicaron “Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W., \u0026amp; Feizi, S. (2023). Can AI-Generated Text be Reliably Detected? arXiv:2303.11156 [cs.CL]. https://doi.org/10.48550/arXiv.2303.11156”\nVeamos en el abstract:\nA continuación, proporcionamos un resultado teórico de imposibilidad que indica que a medida que los modelos de lenguaje se vuelven más sofisticados y mejores emulando el texto humano, el rendimiento del mejor detector posible disminuye. Para un modelo de lenguaje lo bastante avanzado que busca imitar el texto humano, incluso el mejor detector posible podría actuar solo marginalmente mejor que un clasificador aleatorio. Nuestro resultado es lo suficientemente general como para capturar escenarios específicos como estilos de escritura particulares, diseño inteligente de prompts o parafraseo de texto.```\nO sea, que NO, que no se puede detectar con fiabilidad si un texto ha sido generado por IA. El sistema no será fiable y generará errores: falsos negativos y falsos positivos.\nAhora, hablemos de ética. Ética de la IA de verdad, no de chichinabo. La ética de un profesor que decide delegar su juicio en una máquina que dice que un alumno ha “copiado con IA”. La ética de una empresa que vende el servicio de esa máquina que….** NO FUNCIONA.**\nLos falsos positivos pueden tener impacto sobre la carrera de un estudiante, o de un investigador que entra en la lista negra de una editorial a partir de un discriminador de IA.\n“La IA me ha dicho que has copiado con IA.” Es una exhibición de cinismo y de pereza, de no querer hacer las cosas bien. De no pensar que si una IA hace el ejercicio que pides, quizá deberías pedir otra cosa.\nAlguna profesora me ha explicado, para mi horror, que su detector de contenido hecho con IA es ChatGPT. Y que se lo cree. Desde hace unos meses ChatGTP ha dejado de mojarse cuando le preguntan si un texto ha sido generado por IA.\n","date":"12 de febrero de 2024","externalUrl":null,"permalink":"/ludo/es/posts/la-ia-diu-que-aquests-deures-els-ha-fet-la-ia/","section":"Posts","summary":"ChatGPT me resume sobre el artículo en The Guardian: https://www.theguardian.com/commentisfree/2024/feb/13/software-student-cheated-combat-ai\nRobert Topinka, profesor en Birkbeck, University of London, explora el dilema al que se enfrentan los profesores con el uso de IA por parte de los estudiantes en la redacción de ensayos. Tras detectar un ensayo marcado como “100% generado por IA”, Topinka se encuentra en una situación difícil cuando un estudiante excepcionalmente brillante impugna esa acusación. El caso subraya los desafíos de los detectores de IA, como Turnitin, que pueden confundir el uso legítimo de apoyo tecnológico por parte de los estudiantes con hacer trampa. Topinka argumenta la necesidad de adaptar la evaluación académica a la era de la IA, proponiendo alternativas como presentaciones y pódcast para demostrar el pensamiento crítico y original de los estudiantes, evitando acusaciones injustas y promoviendo la igualdad de oportunidades educativas.\n","title":"La IA dice que los deberes los ha hecho la IA","type":"posts"},{"content":"","date":"5 de febrero de 2024","externalUrl":null,"permalink":"/ludo/es/tags/code/","section":"Tags","summary":"","title":"Code","type":"tags"},{"content":"En esta entrada os presento RepoSearch un buscador Semántico de TFGs de Ingeniería informática, desarrollado por Juanan Pereira de UPV/EHU https://github.com/juananpe . Usando mágia arcana (embeddings, bases de datos vectoriales, búsqueda de similitud por vectores) esta herramienta permite buscar TFGs de forma semática (di lo que buscas y te dará resultados a partir del contenido de las memórias, no solo del titulo y metadatos más o menos bien etiquetados). Es una iniciativa impresionante. Kudos Juanan! La herramienta en: https://semantic.ikasten.io/\n","date":"5 de febrero de 2024","externalUrl":null,"permalink":"/ludo/es/posts/buscador-de-tfgs-de-ingenier%C3%ADa-inform%C3%A1tica/","section":"Posts","summary":"En esta entrada os presento RepoSearch un buscador Semántico de TFGs de Ingeniería informática, desarrollado por Juanan Pereira de UPV/EHU https://github.com/juananpe . Usando mágia arcana (embeddings, bases de datos vectoriales, búsqueda de similitud por vectores) esta herramienta permite buscar TFGs de forma semática (di lo que buscas y te dará resultados a partir del contenido de las memórias, no solo del titulo y metadatos más o menos bien etiquetados). Es una iniciativa impresionante. Kudos Juanan! La herramienta en: https://semantic.ikasten.io/\n","title":"RepoSearch Buscador Semántico de TFGs de Ingeniería Informática","type":"posts"},{"content":"En esta entrada, presento un documento importante elaborado por la Escuela de Doctorado de la UPC. Se trata del estudio “Datos y aplicaciones: análisis de hábitos en gestión de datos y uso de aplicaciones entre los estudiantes de doctorado del Campus Nord de la UPC”, basado en una encuesta y un grupo focal realizados durante los meses de junio y julio.\nDatos y aplicaciones: análisis de hábitos en gestión de datos y uso de aplicaciones entre los estudiantes de doctorado del Campus Nord de la UPC # El objetivo del estudio es doble:\nExplorar cómo los doctorandos del Campus Nord de la UPC gestionan y utilizan los datos de investigación. Identificar las aplicaciones más utilizadas en la elaboración de tesis doctorales. De acuerdo con las conclusiones del estudio, destacadas en las páginas 29-31 del documento, se destacan los siguientes puntos:\nUn 21% de los encuestados indica estar informado sobre procedimientos específicos para la gestión de datos dentro de su ámbito de investigación. Las aplicaciones más utilizadas por los doctorandos son los gestores de referencias bibliográficas, Overleaf y Grammarly. Alrededor de un 35% de los participantes en la encuesta utiliza ChatGPT u otras aplicaciones basadas en inteligencia artificial generativa. Este estudio proporciona información valiosa sobre los patrones de uso y las necesidades de los estudiantes de doctorado en relación con la gestión de datos y el uso de tecnologías. Su importancia radica en comprender cómo estos elementos se integran en la práctica académica actual.\n","date":"29 de enero de 2024","externalUrl":null,"permalink":"/ludo/es/posts/survey-estudiants-doctorat/","section":"Posts","summary":"En esta entrada, presento un documento importante elaborado por la Escuela de Doctorado de la UPC. Se trata del estudio “Datos y aplicaciones: análisis de hábitos en gestión de datos y uso de aplicaciones entre los estudiantes de doctorado del Campus Nord de la UPC”, basado en una encuesta y un grupo focal realizados durante los meses de junio y julio.\n","title":"Estudio sobre hábitos de los doctorandos de la UPC en gestión de datos y uso de aplicaciones","type":"posts"},{"content":"","date":"1 de enero de 2024","externalUrl":null,"permalink":"/ludo/es/tags/education/","section":"Tags","summary":"","title":"Education","type":"tags"},{"content":"%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Cronología de la Educación Moderna section Siglo XIX 1800s : Leyes de Educación Obligatoria : Las escuelas y aulas reflejan una estructura tipo fábrica : Objetivo de alfabetizar a toda la sociedad : Calificación numérica introducida por William Farish : Surgen los exámenes estandarizados : Cursos por correspondencia section Inicio del Siglo XX Años 1900 : Comienza el Movimiento de la Escuela Nueva : Dewey enfatiza el aprendizaje experiencial : Montessori promueve la individualidad del niño : Máquina de Enseñanza de Pressey (1926) Años 40 y 50 : Piaget introduce la teoría de las etapas del desarrollo : B.F. Skinner desarrolla el conductismo : B.F. Skinner construye la máquina de enseñanza GLIDER : Radiodifusión de conferencias : Software de enseñanza de IBM section Finales del Siglo XX Años 60 : Primeras aplicaciones de ordenadores en educación : Seymour Papert, lenguaje de programación LOGO : Instrucción Asistida por Ordenador (CAI) : Sistema Instruccional IBM 1500 Años 70 : Sistema Instruccional PLATO : Universidades a Distancia (OU, UNED, \u0026hellip; ) : Videocasetes (VCR) : Microordenadores, BASIC : El uso de ordenadores se convierte en materia de estudio\n%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Cronología de la Tecnología Educativa section La Era del Ordenador Personal 1982 : Educación Asistida por Ordenador : LOGO : Reconocimiento Óptico de Marcas en Cuestionarios en Papel 1991 : Contenidos Multimedia : CD-ROM : Herramientas de autoría de contenidos 1996 : Web temprana, primeros cursos y campus online section La Web se Masifica 2003 : Web 2.0 - Páginas web dinámicas : Sistemas Modernos de Gestión del Aprendizaje (Moodle, Sakai, Blackboard) : Wikipedia, Blogs : Sistemas de Información Geográfica : Herramientas de Aprendizaje Online (Foros, Cuestionarios, Tareas, talleres, Wikis, \u0026hellip;) : Pizarras digitales y proyectores : Pulsadores (Clickers) : Estándares de Contenido Educativo Online (Scorm, IMS Cartridge, QTI) : Primeros experimentos con Mundos Virtuales en educación (Second Life) 2007 : Redes Sociales : Robótica Educativa (Lego Mindstorms, Arduino\u0026hellip;) : Contenidos y lecciones de vídeo online (Youtube, Khan Academy \u0026hellip;) : Entornos Personales de Aprendizaje (PLE) : LMS ofrecidos como servicio de Computación en la Nube : Interoperabilidad de LMS, Webservices e IMS-LTI section EdTech se Masifica 2010 : Aprendizaje Móvil : Portátiles muy asequibles: Netbooks / Chromebooks / iPads : Startups invirtiendo en EdTech (Kahoot, Duolingo, Classdojo, Quizlet) : MOOCs 2015 : Analítica del Aprendizaje : Gamificación : Juegos Serios : Aprendizaje Adaptativo\n%%{init: { \u0026rsquo;logLevel\u0026rsquo;: \u0026lsquo;debug\u0026rsquo;, \u0026rsquo;theme\u0026rsquo;: \u0026lsquo;default\u0026rsquo; , \u0026rsquo;themeVariables\u0026rsquo;: { \u0026lsquo;cScale0\u0026rsquo;: \u0026lsquo;#FFD700\u0026rsquo;, \u0026lsquo;cScaleLabel0\u0026rsquo;: \u0026lsquo;#000000\u0026rsquo;, \u0026lsquo;cScale1\u0026rsquo;: \u0026lsquo;#228B22\u0026rsquo;, \u0026lsquo;cScaleLabel1\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, \u0026lsquo;cScale2\u0026rsquo;: \u0026lsquo;#00008B\u0026rsquo;, \u0026lsquo;cScaleLabel2\u0026rsquo;: \u0026lsquo;#FFFFFF\u0026rsquo;, } } }%% timeline title Cronología de Nuevos Horizontes de la Tecnología Educativa section El país desconocido 2020 : Pandemia de Covid : Todos los estudios pasan repentinamente online : Adopción masiva de videoconferencia : Mercados de LMS cambiando hacia Big Tech 2022 : IA Generativa : Primeros encuentros con LLMs (GPT-3, primeros sistemas RAG) : Modelos de generación de imágenes (Stable Diffusion, Dall-E, Midjourney) 2023 : La IA se masifica : ChatGPT entra a lo grande en la educación : Khan Academy lanza Khanmigo section Las cosas se ponen interesantes 2024 : Estás aquí\n","date":"1 de enero de 2024","externalUrl":null,"permalink":"/ludo/es/posts/edtech-timeline/","section":"Posts","summary":"%%{init: { ’logLevel’: ‘debug’, ’theme’: ‘default’ , ’themeVariables’: { ‘cScale0’: ‘#FFD700’, ‘cScaleLabel0’: ‘#000000’, ‘cScale1’: ‘#228B22’, ‘cScaleLabel1’: ‘#FFFFFF’, ‘cScale2’: ‘#00008B’, ‘cScaleLabel2’: ‘#FFFFFF’, } } }%% timeline title Cronología de la Educación Moderna section Siglo XIX 1800s : Leyes de Educación Obligatoria : Las escuelas y aulas reflejan una estructura tipo fábrica : Objetivo de alfabetizar a toda la sociedad : Calificación numérica introducida por William Farish : Surgen los exámenes estandarizados : Cursos por correspondencia section Inicio del Siglo XX Años 1900 : Comienza el Movimiento de la Escuela Nueva : Dewey enfatiza el aprendizaje experiencial : Montessori promueve la individualidad del niño : Máquina de Enseñanza de Pressey (1926) Años 40 y 50 : Piaget introduce la teoría de las etapas del desarrollo : B.F. Skinner desarrolla el conductismo : B.F. Skinner construye la máquina de enseñanza GLIDER : Radiodifusión de conferencias : Software de enseñanza de IBM section Finales del Siglo XX Años 60 : Primeras aplicaciones de ordenadores en educación : Seymour Papert, lenguaje de programación LOGO : Instrucción Asistida por Ordenador (CAI) : Sistema Instruccional IBM 1500 Años 70 : Sistema Instruccional PLATO : Universidades a Distancia (OU, UNED, … ) : Videocasetes (VCR) : Microordenadores, BASIC : El uso de ordenadores se convierte en materia de estudio\n","title":"Líneas de tiempo de EdTech","type":"posts"},{"content":" Table Of Contents # Contenido generado por IA Contenido de buscadores o bases de datos Cómo lidiar con las alucinaciones ¿Qué son las alucinaciones? Estrategias para mitigar las alucinaciones Estrategias prácticas y casos de uso de chatbots como ChatGTP Consideraciones de idioma: para mejores resultados, usa inglés Poniendo el contexto en contexto. Formato de texto: un truco útil en conversaciones con LLM Usa formatos de texto como un ninja Otros usos de los formatos de texto y los chatbots. Los modelos de lenguaje grandes (LLM) como ChatGPT son una familia nueva de tecnologías con mucho potencial, pero también con sus propios retos. Cada vez usamos más estas herramientas de IA para todo: desde preguntas sencillas hasta generar código complejo. Así que conviene preguntarse: ¿realmente sabemos cómo sacarles el máximo partido?\nEn esta entrada repasaremos algunas buenas prácticas clave para usar LLM. Veremos la diferencia entre contenido generado por IA y la información que ofrecen bases de datos o buscadores. También hablaremos del problema de las “alucinaciones”, cuando el modelo te da información incorrecta o engañosa. Y comentaremos por qué el idioma que usas para preguntar influye en la calidad de las respuestas.\nTanto si sientes curiosidad como si planeas integrar LLM en tus proyectos, esta guía pretende ayudarte a usar estas herramientas de forma más eficaz.\nDe dónde saca ChatGTP sus respuestas # Contenido generado por IA # Cuando preguntas algo a un modelo de lenguaje grande como ChatGPT, genera una respuesta basándose en un enorme conjunto de datos con el que fue entrenado. Ese conjunto incluye una gran variedad de fuentes, como sitios web, libros y artículos. Pero es importante saber que estos modelos no pueden acceder a información en tiempo real o actualizada. Lo que obtienes se basa en lo que el modelo ha aprendido hasta un momento dado.\nAdemás, conviene señalar que la información, aunque a menudo es correcta, se genera de forma estocástica o aleatoria. Esto significa que la posibilidad de fallo o error siempre está en la ecuación. Es como una salsa secreta que a veces da sabor y otras estropea el plato.\nContenido de buscadores o bases de datos # En contraste con el contenido generado por IA, la información que ofrecen los buscadores, las bases de datos o sistemas especializados como Wolfram Alpha procede de fuentes factuales y, a menudo, en tiempo real. Estas plataformas suelen proporcionar información revisada por pares o verificada. A diferencia de los modelos de lenguaje grandes, pueden darte los datos más recientes disponibles, ya sea la última actualidad, investigación científica o estadísticas.\nImplicaciones\nEntender la diferencia entre estos dos tipos de contenido es crucial. Si buscas información actualizada o altamente factual, confiar solo en un modelo de lenguaje grande quizá no sea la mejor opción. Aunque estos modelos son muy versátiles y pueden dar respuestas rápidas, no sustituyen la profundidad y fiabilidad de la información que obtendrías de una base de datos o un buscador especializado. Sin embargo, conviene señalar que acceder a estas fuentes especializadas suele requerir habilidades técnicas, como entender interfaces de usuario específicas o lenguajes de programación. En cambio, los modelos de lenguaje grandes ofrecen la comodidad de obtener información mediante consultas en lenguaje natural. Saber cuándo usar cada uno te ayudará a conseguir información más precisa y fiable, sin perder de vista la facilidad de acceso.\nCómo lidiar con las alucinaciones # ¿Qué son las alucinaciones? # En el contexto de los modelos de lenguaje grandes (LLM) como ChatGPT, las alucinaciones se refieren a la generación de información inexacta, exagerada o directamente falsa. Por ejemplo, se ha visto a ChatGPT inventar respuestas verosímiles respaldadas con citas falsas, lo que ha llevado a usuarios a comprobar si habían tropezado por accidente con un fenómeno real. En algunos casos incluso ha fabricado cifras financieras en artículos de prensa o ha generado precedentes legales inexistentes en escritos jurídicos.\nLas alucinaciones suelen producirse por limitaciones en los datos de entrenamiento o en la comprensión del contexto por parte del modelo. El modelo no tiene capacidad para verificar la información que genera; simplemente produce respuestas basándose en patrones de los datos con los que fue entrenado. Esta naturaleza estocástica de los LLM implica que la aleatoriedad y la posibilidad de un fallo absoluto siempre están presentes.\nEstrategias para mitigar las alucinaciones # Ser consciente de la posible invención: El primer paso es saber que los LLM pueden generar contenido inventado. Esta conciencia te hará más crítico con las respuestas que recibes. Valora tu propia pericia: Tu capacidad para juzgar la calidad de la información está ligada a tu nivel de conocimiento sobre el tema. Si dominas un área, estás en mejor posición para detectar inexactitudes. Evaluación crítica y estrategia de validación: Evalúa siempre la información de forma crítica. Ten una estrategia de validación que incluya contrastar con fuentes fiables o consultar a expertos. Si algo parece demasiado complejo o demasiado bonito para ser verdad, probablemente requiere más verificación. Contrasta con fuentes fiables: En caso de duda, contrasta la información con plataformas de confianza como buscadores o Wikipedia. Para el código generado, ejecútalo y pruébalo siempre para asegurar que se comporta como se espera. Revisión humana: En ámbitos de alto riesgo como los escritos legales, la revisión humana es cada vez más necesaria. Algunas jurisdicciones incluso la exigen para garantizar la fiabilidad del contenido generado por IA. Verificación ajustada al riesgo\nLos pasos para verificar información deben ser proporcionales a los riesgos e implicaciones de usarla. Para aplicaciones críticas, como el código generado, son esenciales las pruebas exhaustivas y la revisión por expertos. Para preguntas de cultura general, puede bastar con una rápida comprobación en una fuente fiable.\nSi tienes presentes las consecuencias, podrás ajustar tu proceso de verificación y tomar las precauciones adecuadas. Este enfoque equilibrado te permite aprovechar lo que ofrecen los modelos de lenguaje grandes y, a la vez, protegerte frente a sus limitaciones y riesgos.\nEstrategias prácticas y casos de uso de chatbots como ChatGTP # Consideraciones de idioma: para mejores resultados, usa inglés # Modelos de lenguaje grandes como ChatGPT pueden entender y generar texto en varios idiomas. Sin embargo, para obtener mejores resultados, usa inglés. Una parte muy significativa de sus datos de entrenamiento está en inglés, lo que hace que sus respuestas en este idioma sean más matizadas y precisas. Esto es especialmente importante si no eres nativo de inglés.\nSi necesitas contenido en otro idioma, una estrategia útil es pedir primero la respuesta en inglés para obtener la versión más precisa. Una vez la tengas, puedes pedir a ChatGPT que la traduzca al idioma que desees. Este proceso en dos pasos suele dar resultados más fiables que pedir directamente en un idioma distinto del inglés.\nPoniendo el contexto en contexto. # Cuando chateas con ChatGPT, el contexto incluye toda la conversación previa que has tenido: tanto tus prompts como las respuestas del chatbot. El contexto es la información que ayuda al modelo a entender lo que estás pidiendo. En modelos de lenguaje grandes como ChatGPT, este contexto no se limita a tu consulta actual. También abarca todo el historial de conversación, la forma específica en que formulas las preguntas e incluso las respuestas previas del propio modelo. Como el modelo atiende a este contexto amplio junto con tu prompt actual y sus datos de entrenamiento, puede ofrecer respuestas más matizadas y precisas. Esto significa que no solo entiende tu pregunta inmediata, sino que también considera la conversación más amplia para generar una respuesta más consciente del contexto.\nEjemplo 1: Receta y lista de la compra\nTu prompt: “¿Me das una receta de galletas con pepitas de chocolate?” Respuesta de ChatGPT: “Claro, aquí tienes una receta sencilla de galletas con pepitas de chocolate…” Tu prompt de seguimiento: “Genial, ¿puedes crear ahora una lista de la compra basada en esa receta?” Respuesta de seguimiento de ChatGPT: “Por supuesto, basándome en la receta de galletas con pepitas de chocolate, necesitarás…” En este ejemplo, ChatGPT usa su propia receta generada como contexto para crear una lista de la compra relevante. Muestra cómo la salida previa del modelo informa su siguiente acción, haciendo la interacción más fluida y personalizada.\nEjemplo 2: Evaluación educativa\nTu prompt: Vamos a hacer la evaluación de los ejercicios del alumnado. El problema a resolver es: x + 4 = 7 La respuesta correcta es x = 7 - 4 x = 3 Ahora voy a producir varias respuestas de estudiantes. Compara la solución del estudiante con la solución propuesta y después indica: A) si la respuesta es correcta o no, B) si no es correcta, explica dónde ha fallado el estudiante y cómo puede corregirlo. No des la respuesta correcta, solo orienta al estudiante. Ahora di solo OK. Respuesta de ChatGPT: “OK” En este ejemplo, has preparado un contexto para que ChatGPT evalúe respuestas de estudiantes respecto a una solución correcta dada. El modelo usará ese contexto para dar retroalimentación precisa, ayudando a que entiendan dónde han fallado sin revelarles la respuesta. Es una aplicación práctica de cómo el manejo del contexto puede llevar a interacciones educativas más efectivas.\nTu prompt de seguimiento 1: La respuesta del Estudiante 1 es: x = 7 + 4 x = 11 Respuesta de seguimiento 1 de ChatGPT: A) La respuesta es incorrecta. B) El estudiante ha sumado 4 en lugar de restarlo. Para corregirlo, debería empezar por aislar x_x_ en un lado de la ecuación realizando la operación inversa en ambos lados. Tu prompt de seguimiento 2: La respuesta del Estudiante 2 es: x = 7 / 4 x = 1.75 Respuesta de seguimiento 2 de ChatGPT: A) La respuesta es incorrecta. B) El estudiante ha dividido entre 4 en lugar de restarlo. Debería centrarse en aislar x_x_ usando la operación inversa correcta. Tu prompt de seguimiento 3: La respuesta del Estudiante 3 es: x = 7 - 4 x = 3 Respuesta de seguimiento 3 de ChatGPT: A) La respuesta es correcta. B) El estudiante ha aislado correctamente x_x_ restando 4 en ambos lados de la ecuación. En este ejemplo ampliado, ChatGPT utiliza el contexto proporcionado —la solución correcta de la ecuación x+4=7_x_+4=7— para evaluar las respuestas del alumnado. Después ofrece retroalimentación específica según cómo cada respuesta se compara con la solución correcta. Esto demuestra la capacidad del modelo para usar el contexto y lograr interacciones más matizadas y útiles.\nPerder el contexto es perder el sentido\nEntender el contexto en tus chats con modelos de lenguaje grandes como ChatGPT es crucial. Hace que tus intercambios sean más precisos y matizados. El contexto ayuda al modelo a entender mejor el tema, el tono y tus necesidades específicas. Es clave para evitar errores, especialmente en entornos profesionales o educativos. También permite interacciones más complejas, como discusiones detalladas o usar el modelo para enseñar, como hemos visto en los ejemplos.\nFuente: Fishkin, Rand. “Analizamos millones de sesiones de usuarios de ChatGPT: las visitas han caído un 29% desde mayo; la asistencia a la programación es el 30% del uso.” SparkToro. Consultado el 3 de septiembre de 2023.\nCuriosamente, la investigación muestra (ver figura) que casi la mitad de las sesiones de ChatGPT constan de solo una (34,5%) o dos (14,5%) interacciones. Esto sugiere que un gran número de usuarios no está aprovechando plenamente las capacidades con contexto de estos modelos. Solo alrededor del 35% de las sesiones tienen cinco o más prompts. Al no mantener conversaciones más largas, se pierden ventajas del contexto, como respuestas más precisas y matizadas, especialmente en consultas o debates complejos.\nAl interactuar con ChatGPT, el modo en que formateas tu texto no es solo una cuestión de estética o legibilidad; también afecta a la semántica, al significado de tus palabras. Un formato adecuado actúa como guía para el modelo, ayudándole a comprender mejor la estructura y la intención de tu consulta. A su vez, le permite generar respuestas más precisas, organizadas y ajustadas a lo que realmente pides.\nFormato de texto: un truco útil en conversaciones con LLM # Al interactuar con ChatGPT, la forma de formatear tu texto no es solo una cuestión de estética o legibilidad; también impacta en la semántica, el significado detrás de las palabras. Un formateo adecuado actúa como guía para el modelo, ayudándole a entender mejor la estructura y la intención de tu consulta. A su vez, permite que genere respuestas más precisas, organizadas y ajustadas a lo que realmente estás pidiendo.\nEjemplo 3: Usar viñetas para múltiples preguntas\nTu prompt:\n\u0026quot;Tell me about the benefits of: - Solar energy - Wind energy\u0026quot; Respuesta de ChatGPT:\n\u0026quot;Certainly! - Solar energy is renewable, reduces electricity bills, and has low operating costs. - Wind energy is also renewable, cost-effective, and can be built on existing farms.\u0026quot; En este ejemplo, el uso de viñetas en el prompt ayuda a separar claramente varias preguntas, facilitando que ChatGPT aborde cada una por separado.\nUsa formatos de texto como un ninja # Más allá de las viñetas y las listas numeradas, puedes aprovechar formatos de texto más especializados, comunes en informática, para mejorar tus interacciones con ChatGPT. Formatos como CSV (Comma-Separated Values), JSON (JavaScript Object Notation) y XML (eXtensible Markup Language) pueden incluirse en tus prompts. Son especialmente útiles cuando tratas con consultas basadas en datos o cuando necesitas que el modelo genere respuestas que puedan integrarse fácilmente en otro software o bases de datos.\nPor ejemplo, si tienes datos en un archivo de Excel que te gustaría analizar, puedes exportarlos como CSV y luego usar esos datos en formato CSV en tu prompt a ChatGPT. Así el modelo entiende mejor tu consulta y mejora la precisión de sus respuestas. Incluso puedes preguntarle a ChatGTP: “How do I export data in EXCEL to a CSV File”.\nEjemplo 4:\nTu prompt:\n\u0026quot;Sort the following table by Age in ascending order. The table is in CSV format: Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist \u0026quot;\u0026quot; Respuesta de ChatGPT:\n´´´ Name,Age,Occupation Ella,28,Artist Bob,29,Doctor Alice,34,Engineer David,39,Lawyer Charlie,45,Teacher ´´´ Una nota sobre Markdown\nChatGPT entiende el formato de texto Markdown, lo que le permite mostrar fragmentos de código, tablas, cabeceras, enlaces e incluso imágenes incrustadas en su salida. Sin embargo, si usas un editor compatible con Markdown para tus documentos —como Obsidian o Notion— debes tener cuidado con ciertos códigos Markdown que podrían estropear tu presentación:\nComillas triples invertidas (\u0026quot;`\u0026quot;): se usan para bloques de código en Markdown. Si no tienes cuidado, pueden estropear el formato en tu editor Markdown. Tres guiones (\u0026quot;-\u0026quot;): suelen usarse para líneas horizontales, que podrían dividir tu texto sin querer. Almohadillas (\u0026quot;#\u0026quot;, “##”, “###”): se usan para cabeceras. Úsalas intencionadamente para estructurar tu documento. Asteriscos (\u0026quot;*\u0026quot;): se usan para listas con viñetas. Asegúrate de que estén bien alineados para mantener la estructura de la lista. Tablas: las tablas en Markdown pueden ser útiles pero también delicadas. Asegúrate de alinear bien las columnas para que sean legibles.\nUsar Markdown en la salida de ChatGPT\nVolvamos al último ejemplo: podemos pedir a chatgpt que devuelva los resultados en una tabla en markdown:\nTu prompt:\nSort the following table by Age in ascending order. Format the result **in Markdown**. The table is in CSV format: Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist Respuesta de ChatGPT:\n[TABLA]\nAsí obtienes los datos ordenados en una tabla Markdown, que puedes incluir directamente en tus documentos Markdown. En la página de chatGPT verás la tabla anterior, pero si la copias y pegas en un editor de texto plano obtendrás algo como:\n|Name|Age|Occupation| |---|---|---| |Ella|28|Artist| |Bob|29|Doctor| |Alice|34|Engineer| |David|39|Lawyer| |Charlie|45|Teacher| Que es una representación en Markdown de una tabla.\nOtros usos de los formatos de texto y los chatbots. # Ejemplo: hacer que ChatGPT trabaje con grafos\nTu prompt:\n“¿Existe algún lenguaje basado en texto que pueda usarse para representar grafos?”\nRespuesta de ChatGPT:\n“Sí, hay varios lenguajes y formatos basados en texto que pueden utilizarse para representar grafos. Estos lenguajes suelen emplearse junto con software de visualización o análisis de grafos. Algunos de ellos son:\nLenguaje DOT: el lenguaje DOT es un lenguaje de descripción de grafos en texto plano muy usado como parte del proyecto Graphviz. Es sencillo y permite describir grafos, digrafos y sus atributos. Ejemplo:\ndotCopy code digraph G { A -\u0026gt; B; B -\u0026gt; C; C -\u0026gt; A; } (… la respuesta continúa con varios formatos: YAML, GML, JSON GRAPH… )\n“\nTu siguiente solicitud:\n“Genera un archivo .dot que represente un grafo de las 10 ciudades más pobladas de Europa, sus conexiones de tren de alta velocidad y los kilómetros de cada conexión directa.”\nRespuesta de ChatGPT:\n“Aquí tienes un archivo .dot de ejemplo que representa un grafo de las 10 ciudades más pobladas de Europa, junto con sus conexiones de alta velocidad y las distancias entre ellas.”\ndigraph EuropeCities { \u0026quot;London\u0026quot; -\u0026gt; \u0026quot;Paris\u0026quot; [label=\u0026quot;450 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Madrid\u0026quot; [label=\u0026quot;1,050 km\u0026quot;]; \u0026quot;Madrid\u0026quot; -\u0026gt; \u0026quot;Rome\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Berlin\u0026quot; -\u0026gt; \u0026quot;Moscow\u0026quot; [label=\u0026quot;1,800 km\u0026quot;]; \u0026quot;Moscow\u0026quot; -\u0026gt; \u0026quot;Saint Petersburg\u0026quot; [label=\u0026quot;700 km\u0026quot;]; \u0026quot;Saint Petersburg\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Kiev\u0026quot; -\u0026gt; \u0026quot;Istanbul\u0026quot; [label=\u0026quot;1,300 km\u0026quot;]; \u0026quot;Istanbul\u0026quot; -\u0026gt; \u0026quot;Bucharest\u0026quot; [label=\u0026quot;600 km\u0026quot;]; \u0026quot;Bucharest\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;London\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,050 km\u0026quot;]; \u0026quot;Paris\u0026quot; -\u0026gt; \u0026quot;Rome\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; \u0026quot;Madrid\u0026quot; -\u0026gt; \u0026quot;Berlin\u0026quot; [label=\u0026quot;1,900 km\u0026quot;]; \u0026quot;Berlin\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;1,300 km\u0026quot;]; \u0026quot;Moscow\u0026quot; -\u0026gt; \u0026quot;Kiev\u0026quot; [label=\u0026quot;870 km\u0026quot;]; \u0026quot;Kiev\u0026quot; -\u0026gt; \u0026quot;Bucharest\u0026quot; [label=\u0026quot;800 km\u0026quot;]; \u0026quot;Istanbul\u0026quot; -\u0026gt; \u0026quot;Moscow\u0026quot; [label=\u0026quot;2,200 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Madrid\u0026quot; [label=\u0026quot;1,400 km\u0026quot;]; \u0026quot;Rome\u0026quot; -\u0026gt; \u0026quot;Paris\u0026quot; [label=\u0026quot;1,100 km\u0026quot;]; } Ahora puedes pedir cosas como que ChatGPT encuentre el camino óptimo de Madrid a San Petersburgo y que destaque ese camino en el código .dot. Conseguí que GPT-4 creara el código para este grafo con dos prompts adicionales. Curiosamente, GPT-4 usó el algoritmo de Dijstra para resolver el problema. Te dejo la imagen resultante y lo dejo como reto.\nSi necesitas saber cómo generar la imagen a partir del código .dot… pregúntale a ChatGPT.\nÚltimos prompts # Según la investigación, más del 23% del uso de ChatGPT está relacionado con educación. Tanto docentes como estudiantes están usando ChatGPT, y los nuevos chatbots avanzados que están saliendo (como Bard de Google, Open Assistant, Llama 2 de Meta, etc.) están encontrando buenos casos de uso para ayudarles en sus tareas diarias de enseñanza y aprendizaje. Un buen entendimiento de estas herramientas, sus capacidades y limitaciones es crucial para un uso responsable y ético, especialmente en entornos educativos.\nAdemás de todo lo tratado en este artículo, hay unos últimos puntos que merece la pena considerar:\nHerramientas como ChatGPT han llegado para quedarse; no son una moda pasajera. Representan una nueva era en la tecnología de internet y software, y su impacto será monumental. Si comparamos con la web, ahora mismo estamos en el equivalente de finales de los 90, cacharreando con páginas estáticas. La tecnología va a mejorar de forma exponencial en los próximos cinco años y su impacto en nuestras vidas será tan transformador como la suma de PC, internet y smartphones. El uso sofisticado de ChatGPT y otros modelos de lenguaje grandes (LLM) es cada vez más difícil de detectar. La investigación actual sugiere que es improbable que desarrollemos a corto plazo un detector fiable de “contenido generado por IA”. Quien diga ofrecer tales herramientas, básicamente, vende aceite de serpiente. Desde junio de 2023, ChatGPT ha incorporado una función útil: la posibilidad de compartir un enlace permanente a una conversación. Es muy valiosa porque nos permite mostrar el trabajo realizado con el chatbot para producir un contenido concreto. Por ejemplo, este mismo documento fue desarrollado usando ChatGPT en una conversación que duró varias horas. Proporciono el enlace como ejemplo de lo eficaz que puede ser un chatbot para producir trabajo de calidad. O al menos, tan buena calidad como la de este artículo. Gracias por llegar hasta el final.\n","date":"1 de septiembre de 2023","externalUrl":null,"permalink":"/ludo/es/posts/good_bad_alucinated/","section":"Posts","summary":"Table Of Contents # Contenido generado por IA Contenido de buscadores o bases de datos Cómo lidiar con las alucinaciones ¿Qué son las alucinaciones? Estrategias para mitigar las alucinaciones Estrategias prácticas y casos de uso de chatbots como ChatGTP Consideraciones de idioma: para mejores resultados, usa inglés Poniendo el contexto en contexto. Formato de texto: un truco útil en conversaciones con LLM Usa formatos de texto como un ninja Otros usos de los formatos de texto y los chatbots. Los modelos de lenguaje grandes (LLM) como ChatGPT son una familia nueva de tecnologías con mucho potencial, pero también con sus propios retos. Cada vez usamos más estas herramientas de IA para todo: desde preguntas sencillas hasta generar código complejo. Así que conviene preguntarse: ¿realmente sabemos cómo sacarles el máximo partido?\n","title":"ChatGPT en la práctica: estrategias para interacciones óptimas","type":"posts"},{"content":"","date":"1 de septiembre de 2023","externalUrl":null,"permalink":"/ludo/es/tags/chatgtp/","section":"Tags","summary":"","title":"Chatgtp","type":"tags"},{"content":"","date":"1 de septiembre de 2023","externalUrl":null,"permalink":"/ludo/es/tags/course/","section":"Tags","summary":"","title":"Course","type":"tags"},{"content":"","date":"1 de septiembre de 2023","externalUrl":null,"permalink":"/ludo/es/tags/llm/","section":"Tags","summary":"","title":"Llm","type":"tags"},{"content":" Tabla de Contenidos # 1 Embeddings 1.2 Aplicaciones prácticas de los Embeddings 2 El contexto en los LLMs basados en transformer** 2.1 Contexto como entrenamiento ad hoc 3 Contexto autorreferencial y programabilidad en los LLMs**_ Referencias Los modelos de IA generativa, especialmente los Modelos de Lenguaje Grande (LLMs) como GPT y sus sucesores, se han convertido en una fuerza clave en el avance de la inteligencia artificial. Aunque estos modelos han ganado prominencia por sus capacidades en el procesamiento del lenguaje natural (PLN)—incluyendo tareas como análisis de sentimientos, traducción automática y generación de contenido—sus aplicaciones se extienden más allá del ámbito del PLN [11].\nUno de los objetivos clave de este artículo es explorar las características y la arquitectura específicas de los modelos de IA generativa que los convierten en una tecnología fundamental para el desarrollo de Aplicaciones de Aprendizaje Inteligente. Esta exploración sirve como parte de una investigación más amplia sobre las capacidades, limitaciones y aplicaciones potenciales de estos modelos. Aunque el campo en crecimiento de la IA ofrece opciones para entrenar y ajustar modelos (fine-tuning), gracias a iniciativas de código abierto como Llama 2 y plataformas como OpenAssistant, este artículo toma un enfoque diferente. Buscamos entender cómo las funcionalidades existentes de los modelos disponibles pueden utilizarse eficazmente para desarrollar Aplicaciones de Aprendizaje Inteligente sin requerir modificaciones extensas.\nAl examinar componentes críticos como los embeddings y la capacidad del modelo para entender el contexto, este artículo pretende proporcionar una comprensión matizada que pueda guiar el desarrollo de tecnología educativa y abrir nuevas vías para la innovación.\n1 Embeddings # En el corazón de los LLMs se encuentra el concepto de \u0026ldquo;embedding\u0026rdquo;. En el PLN, los embeddings sirven para transformar entidades lingüísticas—ya sean palabras, frases o documentos enteros—en vectores numéricos de dimensiones fijas. Mikolov et al. introdujeron el modelo Word2Vec, un método popular para generar embeddings de palabras, que ha sido fundamental en el desarrollo de embeddings en los LLMs [12]. Esta transformación es pivotal ya que permite representar los datos textuales de una manera que es tanto computacionalmente eficiente como semánticamente rica. A través del proceso de embedding, los LLMs están equipados para discernir patrones y relaciones intrincadas en el lenguaje.\n1.2 Aplicaciones prácticas de los Embeddings # Los LLMs utilizan embeddings para una miríada de tareas. Desde análisis de sentimientos y traducción automática hasta la generación de contenido, las capacidades de los LLMs son vastas. La naturaleza numérica inherente de los embeddings facilita operaciones que pueden deducir relaciones, establecer analogías y discernir matices en el lenguaje. En el ámbito de la traducción automática, los embeddings han sido instrumentales para identificar términos equivalentes entre idiomas, asegurando que las traducciones mantengan su significado y precisión [13].\nUn ejemplo notable de la aplicación práctica de los embeddings es proporcionado por ChatPDF.com, un sistema llave en mano que permite la incrustación de PDFs enteros, abarcando cientos de páginas. Este sistema permite una interfaz de chat con el documento, ofreciendo un enfoque innovador para la interacción con documentos. ChatPDF.com también proporciona una API para desarrolladores, facilitando la integración de este modelo amigable con embeddings en diversas aplicaciones [14].\nFig. 2. ChatPDF permite una conversación de chat con el contenido de un documento. En el ejemplo, una conversación con el artículo \u0026ldquo;Attention is all you need\u0026rdquo;\n2 El contexto en los LLMs basados en transformer** # En el ámbito de los LLMs, particularmente modelos como GPT-4 y BERT basados en la arquitectura transformer, el término \u0026ldquo;contexto\u0026rdquo; denota la información circundante inmediata que el modelo aprovecha para generar una respuesta [15, 16]. Para GPT-4, este contexto se deriva del texto precedente en una conversación o documento. Dicho contexto es indispensable ya que proporciona al modelo información sobre el tema en curso, el tono y el estilo de la conversación, y cualquier instrucción o restricción específica.\nUn mecanismo esencial que permite esta comprensión contextual es el mecanismo de \u0026ldquo;atención\u0026rdquo;. En las arquitecturas transformer, la atención permite al modelo ponderar diferentes partes del texto de entrada de manera diferente. Esto significa que al generar una respuesta, el modelo no trata todas las palabras o tokens en el contexto por igual. En su lugar, \u0026ldquo;presta atención\u0026rdquo; más a ciertas partes que son más relevantes para la consulta o el prompt en cuestión. Por ejemplo, si la conversación es sobre el cambio climático, palabras como \u0026ldquo;emisiones\u0026rdquo;, \u0026ldquo;carbono\u0026rdquo; y \u0026ldquo;temperatura\u0026rdquo; podrían recibir pesos de atención más altos. Este mecanismo de atención funciona en tándem con el contexto para producir respuestas más precisas y contextualmente apropiadas.\nSin embargo, la comprensión del contexto en los LLMs se extiende más allá del texto precedente inmediato. Dado los vastos conjuntos de datos en los que estos modelos se entrenan, poseen una comprensión integral de una multitud de temas. Cuando se presenta con un contexto específico, el modelo profundiza en esta extensa base de conocimientos, enfocándose en los segmentos relevantes para elaborar una respuesta apropiada.\n2.1 Contexto como entrenamiento ad hoc # La propuesta de utilizar el contexto como una forma de entrenamiento ad hoc presenta un enfoque novedoso para interactuar con los LLMs. Howard y Ruder introdujeron la idea de ajustar (fine-tuning) modelos preentrenados para tareas específicas, lo cual está relacionado de alguna manera con la idea de entrenamiento ad hoc [17].\nAl proporcionar a un LLM un contexto distinto o un conjunto de instrucciones, los usuarios tienen la capacidad de \u0026ldquo;guiar\u0026rdquo; las respuestas del modelo en tiempo real. Este método de proporcionar orientación contextual actúa efectivamente como entrenamiento instantáneo, moldeando el comportamiento del modelo sin necesidad de alterar su arquitectura fundamental o sus pesos.\nEn nuestra exploración del papel del contexto en los modelos de lenguaje, presentamos dos figuras contrastantes para resaltar la diferencia que el contexto puede hacer en las respuestas generadas por un chatbot.\nLa Fig. 3 describe un escenario donde se le pide a un chatbot, entrenado con datos hasta 2021, que escriba un ensayo de dos párrafos sobre la Copa Mundial Femenina de la FIFA 2023 desde la perspectiva de una niña de 10 años. En este caso, el chatbot carece del contexto específico del evento y, por lo tanto, produce una respuesta basada en su entrenamiento pre-2021, careciendo de detalles específicos sobre el evento.\nFig. 3: Una captura de pantalla de una interacción con un chatbot donde se le pide al chatbot, entrenado con datos hasta 2021, que escriba un ensayo de dos párrafos sobre la Copa Mundial Femenina de la FIFA 2023 desde la perspectiva de una niña de 10 años. La respuesta del chatbot carece de detalles específicos sobre el evento.\nPor otro lado, la Fig. 4 muestra el mismo chatbot, pero esta vez se le proporciona contexto en forma de un fragmento de texto de la página de Wikipedia sobre la Copa Mundial Femenina de la FIFA 2023. Cuando se le hace la misma pregunta, el chatbot es capaz de generar una respuesta detallada, discutiendo el evento deportivo, los resultados, los países participantes y las personas involucradas, como si hubiera sido entrenado específicamente con esa información.\nFig. 4: Una captura de pantalla de la misma interacción con el chatbot, pero esta vez se le proporciona al chatbot un fragmento de texto de la página de Wikipedia sobre la Copa Mundial Femenina de la FIFA 2023. Cuando se le hace la misma pregunta, el chatbot genera una respuesta detallada, discutiendo el evento deportivo, los resultados, los países participantes y las personas involucradas, mostrando el poder de la información contextual.\n3 Contexto autorreferencial y programabilidad en los LLMs**_ # Un aspecto a menudo pasado por alto del contexto en los LLMs es la naturaleza autorreferencial de sus respuestas. A medida que un LLM genera una respuesta, esa salida se convierte en parte del contexto en curso para las interacciones subsiguientes. Esta característica dinámica permite una forma única de programabilidad y seguimiento de instrucciones en los LLMs.\nUn aspecto del contexto en los Modelos de Aprendizaje de Lenguaje (LLMs) avanzados como GPT-4 y GPT-3.5 que merece una atención más cercana es la naturaleza autorreferencial de sus respuestas generadas. Aunque los modelos anteriores de la serie GPT tienen cierta capacidad para usar el contexto dentro de una sola interacción, esta capacidad se ha mejorado significativamente en versiones más recientes. Los LLMs avanzados pueden incorporar su propio texto generado en el contexto para futuras interacciones como se representa en la Fig 5., lo que significa que a medida que el modelo genera una respuesta, ese contenido recién generado no solo sirve como respuesta a una consulta; también se convierte en parte del contexto en evolución que informa las respuestas subsiguientes.\nFig. 5: La respuesta generada se incorpora en el contexto en curso, influyendo en el mecanismo de atención del LLM a medida que la respuesta continúa generándose de manera recursiva.\nEsta característica introduce un nivel de actualización dinámica del contexto, permitiendo que el modelo siga instrucciones o realice tareas de una manera más matizada. Por ejemplo, si se le pide a un LLM avanzado como GPT-4 o GPT-3.5 que genere una receta y luego cree una lista de compras basada en esa receta, el modelo puede usar los ingredientes listados en su propia receta generada como contexto para compilar la lista de compras. Esto no solo muestra la capacidad del modelo para entender y mantener el contexto, sino que también destaca su capacidad para ser \u0026ldquo;programable\u0026rdquo; dentro del alcance de una sola interacción. Esta actualización de contexto autorreferencial hace que los LLMs avanzados sean herramientas versátiles para tareas e interacciones más complejas y de múltiples pasos.\nPara ilustrar esto en la Fig 6, le pedimos a GPT-4 que generara una receta para espaguetis a la boloñesa y luego creara una lista de compras basada en esa receta. El modelo primero listó los ingredientes y los pasos para el plato y luego usó esta información para compilar una lista de compras. Esto muestra que el modelo puede usar su propio texto generado como contexto para una tarea subsiguiente dentro de la misma interacción.\nEste ejemplo destaca una característica sencilla pero importante: la capacidad del modelo para actualizar su contexto dinámicamente. La lista de compras no es solo una salida separada; está directamente relacionada con la receta que el modelo proporcionó. Esto demuestra que los modelos de lenguaje pueden seguir instrucciones de su propio texto generado, permitiendo interacciones más matizadas y conscientes del contexto.\nFig. 6: Una captura de pantalla de una interacción con un chatbot donde el usuario le pide a GPT4 una receta de espaguetis a la boloñesa seguida de una lista de compras. El chatbot primero genera la receta y luego la usa como contexto para crear una lista de compras, demostrando el concepto de Actualización Dinámica del Contexto.\nEn un entorno educativo, el contexto autorreferencial puede aprovecharse para permitir que un chatbot revise, califique o proporcione retroalimentación sobre ejercicios de estudiantes. Típicamente, cuando se presenta con el texto de un ejercicio y la solución de un estudiante, tanto GPT-3.5 como GPT-4 tienden a rendir mal en la calificación y en ofrecer retroalimentación. Sin embargo, el rendimiento mejora significativamente cuando se le instruye al chatbot que primero resuelva el problema por sí mismo, luego compare la solución del estudiante con su propia solución generada y finalmente proporcione una calificación y retroalimentación. Los resultados usando este enfoque son notablemente mejores.\nprompt = f\u0026quot;\u0026quot;\u0026quot; Determine if the student's solution is correct or not. Question: I'm building a solar power installation and I need \\\\ help working out the financials. - Land costs $100 / square foot - I can buy solar panels for $250 / square foot - I negotiated a contract for maintenance that will cost \\\\ me a flat $100k per year, and an additional $10 / square \\\\ foot What is the total cost for the first year of operations as a function of the number of square feet. Student's Solution: Let x be the size of the installation in square feet. Costs: 1. Land cost: 100x 2. Solar panel cost: 250x 3. Maintenance cost: 100,000 + 100x Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000 \u0026quot;\u0026quot;\u0026quot; response = get_completion(prompt) print(response) El código que mostramos arriba presenta un ejemplo de prompt pidiendo al chatbot que determine si la solución de un estudiante es correcta o no. Los resultados serán pobres usando este enfoque. Pero en el siguiente fragmento de código podemos ver cómo instruir cuidadosamente en el prompt para resolver primero el problema y luego considerar la solución del estudiante, los resultados serán mucho mejores (Fuente OpenAI Cookbook[18]).\nprompt = f\u0026quot;\u0026quot;\u0026quot; Your task is to determine if the student's solution \\\\ is correct or not. To solve the problem do the following: - First, work out your own solution to the problem. - Then compare your solution to the student's solution \\\\ and evaluate if the student's solution is correct or not. Don't decide if the student's solution is correct until you have done the problem yourself. Use the following format: Question: --- question here --- Student's solution: --- student's solution here --- Actual solution: --- steps to work out the solution and your solution here --- Is the student's solution the same as actual solution \\\\ just calculated: --- yes or no --- Student grade: --- correct or incorrect --- Question: --- I'm building a solar power installation and I need help \\ working out the financials. - Land costs $100 / square foot - I can buy solar panels for $250 / square foot - I negotiated a contract for maintenance that will cost \\ me a flat $100k per year, and an additional $10 / square \\ foot What is the total cost for the first year of operations \\ as a function of the number of square feet. --- Student's solution: --- Let x be the size of the installation in square feet. Costs: 1. Land cost: 100x 2. Solar panel cost: 250x 3. Maintenance cost: 100,000 + 100x Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000 --- Actual solution: \u0026quot;\u0026quot;\u0026quot; response = get_completion(prompt) print(response) 4 La Evolución de la Comprensión Contextual: El Mensaje del Sistema.\nEn marzo de 2023, OpenAI introdujo una característica revolucionaria en la API de sus modelos GPT 3.5 y GPT 4: el \u0026ldquo;mensaje del sistema\u0026rdquo; [18]. Antes de esta actualización, la API permitía que el modelo recibiera prompts y contexto a través de una matriz de mensajes categorizados como \u0026ldquo;user\u0026rdquo; (mensajes iniciados por el usuario) o \u0026ldquo;agent\u0026rdquo; (respuestas anteriores generadas por el modelo). El mensaje del sistema, sin embargo, está diseñado para ser el primer mensaje en esta matriz.\nEl mensaje del sistema cumple una función crítica: delinea el rol y los parámetros de comportamiento esperados del LLM. Esto permite una interacción más matizada y dirigida con el modelo, ya que proporciona al LLM pautas sobre cómo responder a los prompts subsiguientes.\nLa introducción del mensaje del sistema mejora significativamente la capacidad del usuario para guiar el comportamiento del modelo en tiempo real, sirviendo efectivamente como una extensión del concepto de entrenamiento ad hoc discutido anteriormente. Ofrece a los usuarios una herramienta más refinada para personalizar las respuestas del modelo, elevando así el nivel de interacción a una experiencia más dinámica y adaptada.\nEl siguiente fragmento muestra código Python que demuestra cómo usar la característica del mensaje del sistema para establecer el comportamiento del modelo como un mentor socrático.\nimport openai ... # Define the system message to set the behavior of the model as a Socratic mentor system_message = { 'role': 'system', 'content': 'You are a Socratic mentor. Engage in thoughtful dialogue,ask probing questions, and guide the user to deeper understanding.' } # Define a user message user_message1 = { 'role': 'user', 'content': 'What is the meaning of life?' } # Define an agent message (a previous response from the model, if any) agent_message1 = { 'role': 'agent', 'content': 'The meaning of life is a deeply philosophical question. What do you think it is?' } # Define another user message user_message2 = { 'role': 'user', 'content': 'I think it is to find happiness.' } # Combine all messages into a list messages = [system_message, user_message1, agent_message1, user_message2] # Make an API call to GPT-4 response = openai.Completion.create( model=\u0026quot;gpt-4\u0026quot;, messages=messages ) Este fragmento de código ilustra cómo el mensaje del sistema puede usarse para guiar el comportamiento del modelo, haciendo que la interacción sea más dinámica y adaptada a las necesidades individuales.\nReferencias # [12] Mikolov, T., et al. \u0026ldquo;Estimación eficiente de representaciones de palabras en espacio vectorial.\u0026rdquo; arXiv preprint arXiv:1301.3781 (2013).\n[13] Vaswani, A., et al. \u0026ldquo;La atención es todo lo que necesitas.\u0026rdquo; Advances in neural information processing systems. 2017.\n[14] API Backend Documentation.\u0026quot; ChatPDF.com. Accedido el 25 de agosto de 2023. **https://www.chatpdf.com/docs/api/backend**.\n[15] Devlin, J., et al. \u0026ldquo;BERT: Pre-entrenamiento de transformers bidireccionales profundos para la comprensión del lenguaje.\u0026rdquo; arXiv preprint arXiv:1810.04805 (2018).\n[16] Howard, J., and Ruder, S. \u0026ldquo;Ajuste fino de modelo de lenguaje universal para clasificación de texto.\u0026rdquo; arXiv preprint arXiv:1801.06146 (2018).\n[17] Suárez, Diego. \u0026ldquo;Cómo escribir instrucciones \u0026lsquo;System\u0026rsquo; para la API de Chat GPT-4 de OpenAI.\u0026rdquo; Rootstrap Blog, 25 de abril de 2023. Blog de Rootstrap.\n[18] OpenAI. \u0026ldquo;OpenAI Cookbook: Ejemplos y guías para usar la API de OpenAI.\u0026rdquo; Repositorio GitHub. Última modificación 22 de agosto de 2023. https://github.com/openai/openai-cookbook. Accedido el 23 de agosto de 2023\n","date":"31 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/posts/embeddings/","section":"Posts","summary":"Tabla de Contenidos # 1 Embeddings 1.2 Aplicaciones prácticas de los Embeddings 2 El contexto en los LLMs basados en transformer** 2.1 Contexto como entrenamiento ad hoc 3 Contexto autorreferencial y programabilidad en los LLMs**_ Referencias Los modelos de IA generativa, especialmente los Modelos de Lenguaje Grande (LLMs) como GPT y sus sucesores, se han convertido en una fuerza clave en el avance de la inteligencia artificial. Aunque estos modelos han ganado prominencia por sus capacidades en el procesamiento del lenguaje natural (PLN)—incluyendo tareas como análisis de sentimientos, traducción automática y generación de contenido—sus aplicaciones se extienden más allá del ámbito del PLN [11].\n","title":"Embeddings, usos del contexto y autorreferencia en LLMs","type":"posts"},{"content":"Los océanos como herramientas para capturar carbono\nLos océanos son una esponja de carbono masiva, absorbiendo una cuarta parte de las emisiones globales de CO2. Eso los convierte en una herramienta potente para combatir el cambio climático. Una empresa llamada Equatic está probando una idea audaz para eliminar el dióxido de carbono de la atmósfera: extraerlo directamente del océano. La empresa está probando esta idea con una barcaza en Los Ángeles, que elimina 100 kg de CO2 del agua de mar cada día.\nEl proceso de captura directa del océano\nEl proceso de Captura funciona como una gran planta de desalinización. Continuamente atrae agua de mar, separando el 1% de esta para convertirlo en salmuera concentrada, que la empresa hace pasar por una máquina de electrólisis patentada. La electrólisis, un proceso utilizado en diversas industrias, incluida la desalinización, hace pasar agua a través de una serie de membranas electrificadas. Cada membrana separa diferentes moléculas del agua, que forman soluciones ácidas y alcalinas. El ácido se añade al agua del océano restante, donde desencadena una reacción con iones bicarbonato, haciendo que el CO2 salga en forma de burbujas. Después, la empresa añade el álcali al agua para neutralizarla antes de liberarla.\nLos premios X-Prize y su influencia en la captura de carbono\nEmpresas como Equatic y Captura surgen en parte gracias a los premios X-Prize, que son competiciones internacionales que premian soluciones innovadoras a problemas globales. Estos premios son efectivos porque incentivan la investigación y el desarrollo en áreas clave, como la captura de carbono, y atraen la atención de los inversores y del público en general. Los premios X-Prize han sido una fuerza impulsora detrás de muchos avances tecnológicos y han ayudado a acelerar el progreso en áreas como la captura de carbono, la salud global y la exploración espacial.\nVentajas e inconvenientes de la captura directa del océano\nComparada con la captura del aire, la captura directa del océano (DOC) es un territorio menos explorado. Pero Equatic, Captura y otros están intentando demostrar la viabilidad del concepto con el apoyo de la Iniciativa Chan Zuckerberg, la Fundación Gates, empresas de petróleo y gas, y la Agencia de Proyectos de Investigación Avanzada de Energía (ARPA-E). Extraer carbono del agua del océano, donde está presente a una concentración 150 veces mayor que en la atmósfera, es más eficiente que la captura del aire.\nTecnologías alternativas de captura directa del océano\nMientras tanto, en el MIT, el profesor de ingeniería química T. Alan Hatton, el profesor de ingeniería mecánica Kripa Varanasi y sus colegas han ideado una tecnología DOC que minimiza el uso de membranas, haciéndola aún más sencilla y barata que la electrólisis. El sistema de “flujo reactivo” hace pasar agua a través de dos celdas electroquímicas en tándem. En la primera celda, un electrodo de bismuto libera protones que separan el CO2 de los carbonatos y bicarbonatos del agua, mientras que un electrodo de cloruro de plata libera iones de cloruro para equilibrar la carga.\nConsideraciones ambientales\nA medida que las empresas y los inversores avanzan con los proyectos de DOC, las organizaciones medioambientales piden precaución. Será importante que las tecnologías de retirada de carbono oceánico avancen de manera responsable y “no pongan en peligro la salud de los ecosistemas oceánicos ni de quienes dependen de ellos”. La crisis climática es tan clara y grave que necesitamos la retirada de carbono basada en el océano. Pero hay formas naturales y probadas de hacerlo, como la conservación y restauración de las praderas marinas o el cultivo de algas. Las tecnologías electroquímicas de DOC simplemente tienen demasiadas incógnitas como para gastar presupuestos de investigación limitados, dado el tiempo limitado de que disponemos.\nEsta entrada de blog se ha inspirado en el artículo “Using The Oceans To Help Capture Carbon” de Prachi Patel, publicado en IEEE Spectrum. https://spectrum.ieee.org/direct-ocean-carbon-capture\nChatGTP me ha ayudado en la redacción y a hacer buena parte del resumen. Aquí tenéis la conversación de la creación. GPT-4 + Plugin Webpilot https://chat.openai.com/share/5931adec-3d6b-4c91-add2-bdb045696cb2\n","date":"16 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/posts/post-1-1/","section":"Posts","summary":"Los océanos como herramientas para capturar carbono\nLos océanos son una esponja de carbono masiva, absorbiendo una cuarta parte de las emisiones globales de CO2. Eso los convierte en una herramienta potente para combatir el cambio climático. Una empresa llamada Equatic está probando una idea audaz para eliminar el dióxido de carbono de la atmósfera: extraerlo directamente del océano. La empresa está probando esta idea con una barcaza en Los Ángeles, que elimina 100 kg de CO2 del agua de mar cada día.\n","title":"Captura directa de CO2 en el océano: una nueva herramienta para combatir el cambio climático","type":"posts"},{"content":"","date":"16 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/tags/sostenibilitat/","section":"Tags","summary":"","title":"Sostenibilitat","type":"tags"},{"content":"","date":"2 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/tags/ethics/","section":"Tags","summary":"","title":"Ethics","type":"tags"},{"content":"Organizaciones vinculadas al software libre como Creative Commons, Github, Huggingface han hecho público un documento en el que hacen sugerencias sobre cómo mejorar el AI Act para proteger y fomentar el desarrollo de software libre.\nEl documento está en https://huggingface.co/blog/assets/eu_ai_act_oss/supporting_OS_in_the_AIAct.pdf%5D y aquí tenéis un resumen ejecutivo*:\nApoyo al código abierto y a la ciencia abierta en el AI Act de la UE # El open source, la investigación y desarrollo sin ánimo de lucro y la académica juegan un papel esencial en el ecosistema de inteligencia artificial (IA). Seguir apoyando y fomentando este ecosistema abierto será clave para garantizar que la tecnología sirva a todos los ciudadanos de la UE en dos sentidos principales: ● Primero, los valores de la investigación sólida, la reproducibilidad y la transparencia fomentados por la ciencia abierta son fundamentales para el desarrollo de sistemas de IA seguros y responsables. ● Segundo, el desarrollo de código abierto puede permitir la competencia y la innovación por parte de nuevos entrantes y actores más pequeños, incluidos en la UE. El AI Act tiene la promesa de marcar un precedente global en la regulación de la IA para abordar sus riesgos al tiempo que se fomenta la innovación. Apoyando el enfoque creciente del ecosistema abierto hacia la IA, la regulación tiene una oportunidad importante para profundizar en este objetivo mediante una mayor transparencia y colaboración entre las partes interesadas. Desafortunadamente, las propuestas actuales amenazan con crear barreras impracticables y desventajas para los contribuidores de este ecosistema abierto. Las organizaciones firmantes representan tanto a las partes interesadas comerciales como a las sin ánimo de lucro en el ecosistema de IA de código abierto. A continuación, hacemos 5 sugerencias concretas para garantizar que el AI Act funcione para el código abierto:\nDefinir claramente los componentes de la IA Aclarar que el desarrollo colaborativo de componentes de IA de código abierto y ponerlos a disposición en repositorios públicos no somete a los desarrolladores a los requisitos del AI Act, mejorando y ampliando los Considerandos 12a-c del texto del Parlamento y el Artículo 2(5e). Apoyar la coordinación de la Oficina de IA y la gobernanza inclusiva con el ecosistema de código abierto, basándose en el texto del Parlamento. Asegurar que la excepción de I+D sea práctica y efectiva, permitiendo ensayos limitados en condiciones reales, combinando aspectos del enfoque del Consejo y una versión modificada del Artículo 2(5d) del Parlamento. Establecer requisitos proporcionados para los “modelos base”, reconociendo y tratando de manera distinta distintos usos y modalidades de desarrollo, incluyendo los enfoques de código abierto, adaptando el Artículo 28b del Parlamento. (* traducido con IA) ","date":"2 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/posts/open-source-normativa-eu-document/","section":"Posts","summary":"Organizaciones vinculadas al software libre como Creative Commons, Github, Huggingface han hecho público un documento en el que hacen sugerencias sobre cómo mejorar el AI Act para proteger y fomentar el desarrollo de software libre.\n","title":"Organizaciones vinculadas al software libre piden a la UE que revise el AI Act para proteger el software libre","type":"posts"},{"content":"","date":"1 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/tags/enigma/","section":"Tags","summary":"","title":"Enigma","type":"tags"},{"content":"","date":"1 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/tags/hist%C3%B2ria-de-linform%C3%A0tica/","section":"Tags","summary":"","title":"Història-De-Linformàtica","type":"tags"},{"content":"La máquina Enigma, el ingenio de criptografía que jugó un papel clave durante la Segunda Guerra Mundial, es un símbolo potente de nuestro pasado tecnológico. Esta máquina, desarrollada por la Alemania nazi para cifrar sus mensajes, era considerada inescrutable hasta la llegada del matemático británico Alan Turing, quien fue capaz de descifrar su código en 1943.\nUn modelo original de Enigma, concretamente la K723, es la joya de la corona del Batallón de Transmisiones IV/22, conservada en perfecto estado de funcionamiento desde 2007. Esta pieza única está expuesta junto a otras reliquias históricas de las telecomunicaciones militares en el cuartel del Bruc, en Pedralbes.\nEl origen de Enigma se remonta a 1923, cuando fue fabricada por una compañía de Berlín. La máquina fue originalmente desarrollada para un uso comercial, pero pronto el ejército alemán la adoptó para transmitir mensajes con máxima seguridad. En 1936, Adolf Hitler envió un lote de máquinas Enigma a Franco como contribución al bando sublevado, convirtiendo la Guerra Civil Española en el primer campo de pruebas bélico de las máquinas Enigma.\nDespués de la guerra, estas máquinas fueron relegadas a almacenes, olvidadas hasta hace unos años cuando fueron redescubiertas y convertidas en piezas de museo. La K723 del Bruc es una de las últimas Enigmas que llegaron a España, probablemente durante las etapas finales de la Guerra Civil.\nAunque las máquinas Enigma enviadas a Franco no eran tan avanzadas como las que se utilizaron durante la Segunda Guerra Mundial, aún eran lo suficientemente potentes como para ofrecer más de 1,8 millones de combinaciones de letras posibles. Las máquinas Enigma utilizadas por los nazis en la Segunda Guerra Mundial eran aún más sofisticadas, con hasta cinco rotores intercambiables que ampliaban enormemente las opciones de cifrado.\nLa historia de la máquina Enigma y su descifrado por Alan Turing no es solo una parte fascinante de la historia de la informática, sino también un recordatorio de cómo la criptografía ha evolucionado a lo largo del tiempo. Hoy en día, en un mundo dominado por Google, Microsoft y otros gigantes tecnológicos, la importancia de la seguridad de la información y la criptografía sigue siendo tan pertinente como lo era durante los días de Enigma.\nEn la era de la inteligencia artificial, la criptografía es una herramienta vital para garantizar la privacidad y la seguridad de nuestros datos. Y como historiadores de la informática, es vital que recordemos las lecciones del pasado para comprender mejor el presente y prepararnos para el futuro. Como dijo el escritor y filósofo George Santayana, “Aquellos que no pueden recordar el pasado están condenados a repetirlo”. Esto es especialmente cierto en la informática y en la seguridad de la información, donde las lecciones del pasado pueden ayudarnos a navegar por un futuro incierto.\nUna forma divertida de saber más es la novela Criptonomicon de Neal Stephenson (Stephenson, N. (2003). Criptonomicon. (M. Barceló, Prólogo). Ediciones B - Nueva. )\n","date":"1 de agosto de 2023","externalUrl":null,"permalink":"/ludo/es/posts/enigma-a-l-costat-del-campus-nord/","section":"Posts","summary":"La máquina Enigma, el ingenio de criptografía que jugó un papel clave durante la Segunda Guerra Mundial, es un símbolo potente de nuestro pasado tecnológico. Esta máquina, desarrollada por la Alemania nazi para cifrar sus mensajes, era considerada inescrutable hasta la llegada del matemático británico Alan Turing, quien fue capaz de descifrar su código en 1943.\n","title":"Un Enigma de la Guerra Civil se conserva junto al Campus Nord de la UPC","type":"posts"},{"content":"Lo encontré en el antiguo Twitter y me pareció muy acertado.\n","date":"17 de julio de 2023","externalUrl":null,"permalink":"/ludo/es/posts/ai-panic/","section":"Posts","summary":"Lo encontré en el antiguo Twitter y me pareció muy acertado.\n","title":"Pánico por la IA","type":"posts"},{"content":"L’article “The Tech Revolution: 10 Predictions about AI, Internet, and Possibly Our World in 3 Years” de David Poblador i Garcia presenta una sèrie de prediccions sobre com l’IA i internet podrien transformar el nostre món en els propers tres anys. Aquí teniu un resum de les seves prediccions, que val a dir comparteixo:\nEls Models de Llenguatge Grans (LLMs) es convertiran en l’interfície definitiva per a la interacció amb el coneixement, fent que els motors de cerca convencionals siguin gairebé obsolets.\nLa majoria dels LLMs funcionaran sense connexió, alliberant-nos de la necessitat de connectivitat constant a internet.\nEls models d’IA generativa es convertiran en especialistes, proporcionant coneixements profunds en dominis específics.\nEl model de càlcul client-servidor tradicional es retirarà a favor de dispositius més potents i LLMs més avançats.\nL’indústria multimilionària de la publicitat en línia haurà de trobar una manera de passar a l’offline o arriscar-se a quedar obsoleta.\nLes tasques complexes com les reserves d’hotels, les reserves de restaurants o l’organització d’enviaments es realitzaran interactuant amb APIs millorades que col·laboren amb els models d’IA que s’executen localment.\nEmergirà un mercat extens per a les integracions d’IA.\nAmb la disminució de la importància dels llocs web corporatius, internet es transformarà en un espai més personal per a l’expressió.\nEls fabricants de dispositius i els constructors de sistemes operatius es trobaran en la primera línia d’aquesta nova batalla.\nEls creadors de continguts trobaran noves vies en l’era de l’IA, enriquint els LLMs amb els seus coneixements especialitzats.\nL’autor conclou que aquesta transformació podria ocórrer més ràpidament del que inicialment es pensava, possiblement en menys de tres anys.\nTinc més enllaços a articles i fonts sobre IA aquí\n","date":"10 de junio de 2023","externalUrl":null,"permalink":"/ludo/es/posts/10-prediccions-de-david-poblador/","section":"Posts","summary":"L’article “The Tech Revolution: 10 Predictions about AI, Internet, and Possibly Our World in 3 Years” de David Poblador i Garcia presenta una sèrie de prediccions sobre com l’IA i internet podrien transformar el nostre món en els propers tres anys. Aquí teniu un resum de les seves prediccions, que val a dir comparteixo:\n","title":"10 prediccions sobre IA i Internet que comparteixo","type":"posts"},{"content":"","date":"10 de junio de 2023","externalUrl":null,"permalink":"/ludo/es/tags/pon%C3%A9ncias/","section":"Tags","summary":"","title":"Ponéncias","type":"tags"},{"content":"","date":"10 de junio de 2023","externalUrl":null,"permalink":"/ludo/es/tags/videos/","section":"Tags","summary":"","title":"Videos","type":"tags"},{"content":"Journals Engineering Education\n","date":"1 de junio de 2023","externalUrl":null,"permalink":"/ludo/es/posts/donde-publicar-investigaci%C3%B3n-en-engineering-education/","section":"Posts","summary":"Journals Engineering Education\n","title":"Donde publicar Investigación en engineering Education","type":"posts"},{"content":"","date":"1 de junio de 2023","externalUrl":null,"permalink":"/ludo/es/tags/research/","section":"Tags","summary":"","title":"Research","type":"tags"},{"content":"Después de décadas usando servicios gratuitos online, y ver los resultados de ser el producto y no el cliente (Ver Soshana Zuboff “The Age of Survailance Capitalism” , o el documental de Netflix “The social dilemma”.), cada vez soy menos tacaño y procuro pagar por los servicios que me son de utilidad real, especialmente por mi trabajo. Dicho esto.\nChatGPT da resultados completamente distintos si usamos el modelo gratuito (GPT-3.5-turbo) o si usamos el modelo de pago (GPT-4 y GPT-4 más plug-ins). Desde que tengo acceso a GPT-4 lo uso a diario para muchas tareas y a menudo mis documentos son fruto de un diálogo con la máquina. Si considero que GPT-4 es como un becario, a precio de becario justifica su precio en un solo dia, o en una sola mañana. Por otra parte, seguramente nuestros alumnos van a usar la versión gratis total, como hubiéramos hecho nosotros a su edad. Y hay que conocer el funcionamiento y funcionalidades de las dos versiones. En cualquier caso usar la versión GPT-4 te da una idea de la calidad de lo que viene. Mi impresión es que el paso de GPT-3.5 a GPT-4 es como pasar de nada a GPT-3.5\n","date":"19 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/posts/pagas-por-chatgpt/","section":"Posts","summary":"Después de décadas usando servicios gratuitos online, y ver los resultados de ser el producto y no el cliente (Ver Soshana Zuboff “The Age of Survailance Capitalism” , o el documental de Netflix “The social dilemma”.), cada vez soy menos tacaño y procuro pagar por los servicios que me son de utilidad real, especialmente por mi trabajo. ","title":"¿Pagais por ChatGPT?","type":"posts"},{"content":"","date":"19 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/opini%C3%B3n/","section":"Tags","summary":"","title":"Opinión","type":"tags"},{"content":"","date":"19 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/upc/","section":"Tags","summary":"","title":"Upc","type":"tags"},{"content":"","date":"17 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/guia-instalaci%C3%B3n/","section":"Tags","summary":"","title":"Guia-Instalación","type":"tags"},{"content":"En esta entrada os explico como instalar y usar un pequeño script de python que he escrito. dicho script se conecta al API de OpenAI para usar GPT-3.5_turbo para traducir archivos de un idioma a otro. Sin importar que sean archivos largos. Es necesario tener una clave API de OpenAi para usar el programa. Esta Api tiene un coste, pero es muy bajo, del orden de 1 céntimo de euro la traducción.\nLa mayor parte de esta entrada está escrita con ChatGTP y sirve como ejemplo de lo sencillo que es escribir documentación y apuntes con esta herramienta. En cualquier caso, yo soy el editor de la entrada, eligo jo que quiero que se explique y por tanto : yo soy el autor. Podemos debatir este tema, que no es trivial.\nInstalar Github Desktop # ¿Qué es Github? # Según ChatGPT\nGitHub es como un Google Drive para programadores, pero con algunas características adicionales muy útiles. Imagina que estás trabajando en un proyecto y quieres guardar versiones diferentes del mismo, para poder volver a una versión anterior si algo sale mal. Eso es lo que GitHub hace. Además, si trabajas en equipo, cada miembro puede trabajar en partes diferentes del proyecto al mismo tiempo, y luego GitHub ayuda a unir todo el trabajo de forma ordenada. Por último, también es como una red social para programadores, porque puedes compartir tus proyectos con otros, e incluso colaborar en proyectos de otras personas.\nEs una buena explicación.\nInstalar Github Desktop # GitHub Desktop es una interfaz gráfica que permite interactuar con GitHub sin usar la línea de comandos. Es útil para gestionar repositorios, realizar commits, push y pull, resolver conflictos, entre otras cosas. Aquí te dejo unas instrucciones breves para instalarlo en Windows:\nVe a la página oficial de GitHub Desktop en https://desktop.github.com/ Haz clic en el botón “Download for Windows (64bit)” si tu sistema operativo es de 64 bits. Si no estás seguro, puedes comprobarlo yendo a Configuración de Windows -\u0026gt; Sistema -\u0026gt; Acerca de -\u0026gt; Tipo de sistema.\nUna vez descargado el archivo .exe, haz doble clic en él para comenzar la instalación.\nSigue las instrucciones que aparecen en pantalla para completar la instalación.\nUna vez que la instalación se haya completado, podrás abrir GitHub Desktop desde el menú Inicio de Windows.\nLa primera vez que abras la aplicación, te pedirá que inicies sesión con tu cuenta de GitHub. Si no tienes una, puedes crearla en https://github.com/\nUna vez que hayas iniciado sesión, puedes comenzar a usar GitHub Desktop para gestionar tus repositorios de GitHub.\nInstalar Python # ChatGPT dice que :\nPython es un lenguaje de programación, lo que significa que es una forma de darle instrucciones a un ordenador. Es como una receta de cocina para la máquina: le dices exactamente qué hacer y cómo hacerlo. Lo que hace a Python especial es que está diseñado para ser fácil de leer y escribir. Es como un libro de recetas que se esfuerza por ser sencillo y claro, evitando las complicaciones innecesarias. Por eso, a menudo se utiliza para enseñar programación a los principiantes. Pero no te equivoques, Python es muy poderoso y se utiliza en muchos lugares, desde sitios web hasta investigación científica y desarrollo de juegos.\nAdemás, debemos tener en cuenta que es un lenguaje interpretado :\nUn lenguaje interpretado, como Python, es un tipo de lenguaje de programación que se ejecuta línea por línea, es decir, en tiempo real. Imagina que estás en una obra de teatro y el director te va diciendo qué hacer escena por escena, en vez de darte todo el guión de una vez. Así funciona Python, el ordenador va leyendo y realizando las instrucciones del código que escribiste una por una.\nEsto tiene algunas ventajas, como que es más fácil de aprender y usar, además de que puedes probar partes de tu código a medida que avanzas. Sin embargo, puede ser un poco más lento que otros lenguajes que se compilan (es decir, se traducen completamente a lenguaje de máquina) antes de ejecutarse.\nPara instalar Python 3.10 en Windows, puedes seguir estos pasos:\nVe al sitio web oficial de Python en https://www.python.org/\nHaz clic en la pestaña “Downloads” en la parte superior de la página.\nVerás un botón que dice “Download Python 3.10.x” (x será un número dependiendo de la última versión disponible). Haz clic en ese botón para descargar el instalador.\nUna vez que el archivo .exe se haya descargado, haz clic en él para abrir el instalador.\nEn la ventana del instalador, asegúrate de marcar la casilla “Add Python 3.10 to PATH” en la parte inferior. Esto hará que puedas usar Python desde la línea de comandos de Windows.\nLuego, haz clic en “Install Now”.\nEl instalador comenzará a copiar archivos y configurar Python en tu sistema. Este proceso puede tardar unos minutos.\nUna vez que la instalación se haya completado, verás una pantalla que dice “Setup was successful”. ¡Ya tienes Python 3.10 instalado en tu sistema!\nPara comprobar que la instalación fue exitosa, puedes abrir la línea de comandos (CMD o PowerShell) e ingresar el comando python --version. Esto debería mostrar la versión de Python que acabas de instalar.\nLo que no dice ChatGPT es que debes asegurarte de marcar “añadir python.exe” al PATH. …y eliminar la limitación de longitud del PATH (Disable path length limit).\nInstalación de la API de OpenAI para Python # Para instalar la API de OpenAI para Python, necesitarás usar pip, que es una herramienta que viene con Python y sirve para instalar paquetes o bibliotecas adicionales.\nSigue estos pasos:\nAbre la línea de comandos de tu computadora. En Windows, puedes buscar “CMD” o “Command Prompt” en el menú de inicio.\nUna vez abierta la línea de comandos, escribe el siguiente comando y presiona Enter:\npip install openai\nQuizas “pip” no funciona en tu sistema y debes usar “pip3”\nEspera a que se complete la instalación. Verás varios mensajes en la línea de comandos mientras se descarga e instala el paquete. Obtener una clave de acceso al API de openai # Para obtener una API Key de OpenAI, debes seguir estos pasos:\nVe a la página web de OpenAI en https://beta.openai.com/signup/ y crea una cuenta si aún no la tienes.\nUna vez que hayas iniciado sesión, ve al Dashboard (Tablero de control).\nEn el Dashboard, busca la sección de “API Keys” (Claves API).\nHaz clic en “Create new API Key” (Crear nueva clave API).\nTe pedirá que escribas un nombre para la clave y que selecciones algunas opciones. Una vez que hayas hecho esto, haz clic en “Create”.\nTe mostrará una nueva API Key. Asegúrate de copiarla y guardarla en un lugar seguro, ya que no podrás verla de nuevo.\nAhora puedes usar esta clave API en tu código para interactuar con la API de OpenAI.\nRecuerda tratar tu API Key como si fuera una contraseña, ya que proporciona acceso a tu cuenta de OpenAI y a los servicios pagados. No la compartas con nadie y no la publiques en lugares públicos como repositorios de código en GitHub.\nEs posible que debas dar de alta un mecanismo de pago en la plataforma ya que el acceso a las API es de pago. Para hacer pruebas con modelos como GPT-3.5_turbo el coste es muy bajo. Del orden de céntimos o milesimas de euro por llamada. Modelos como DALL-E o GPT-4 son más caros.\nGDPR y API de OpenAI # OpenAI, con sede en los Estados Unidos, no debe recibir datos personales de usuarios europeos a través de su API sin garantías de cumplimiento de la GDPR. Esto significa que cuando utilices la API de OpenAI, debes asegurarte de no enviar datos que puedan identificar a una persona, como nombres, direcciones de correo electrónico, números de teléfono, y cualquier otro dato que se pueda usar para identificar a alguien.\nEs importante entender que la responsabilidad de garantizar que los datos enviados a la API de OpenAI cumplan con la GDPR recae en el usuario que envía los datos. Por lo tanto, siempre debes tener cuidado al manejar y procesar datos personales y asegurarte de que estás cumpliendo con todas las leyes y regulaciones aplicables.\n( Si quieres usar el API de OpenAI con datos sensibles en Europa debes usar la versión del API en el Cloud de Microsoft Azure https://azure.microsoft.com/en-us/products/cognitive-services/openai-service/ )\nMi programa de traducción # Mi programa de traduccion se encuentra en mi repositorio de github https://github.com/granludo/gpt-test , en la carpeta file-translator. Debes usar Github Desktop para clonar la carpeta en tu ordenador.\nEstas son las instrucciones del Readme.md en castellano:\nPor Marc Alier @granludo https://wasabi.essi.upc.edu/ludo\nLicenciado bajo la Licencia Pública General de GNU v3.0\nPrograma simple en Python 3 que utiliza el modelo GPT-3.5-turbo de OpenAI para traducir archivos de un idioma a otro. Divide el archivo en fragmentos de 20 líneas.\nrequisitos # Necesitas tener una clave para usar la API de OpenAI, puedes obtener una aquí: https://beta.openai.com/docs/developer-quickstart/api-key este programa busca la clave en un archivo indicado en la variable “mykeypath” por defecto en la ruta ‘..//..//mykey.json’. (O sea dentro de la carpeta github)\nEjemplo del contenido de mykey.json:\n{ “key”: “sk-7QzXHpaajenpuakn1tgHT3Bxxxxxxxxxxx” }\nNecesitas instalar los paquetes json y openai\npip install openai\nuso # python3 gpt-traductor.py archivo_origen idioma_origen idioma_destino archivo_destinoEjemplo\npython3 gpt-translate.py sample.md catalan italian sample_translated.md\nEspero que os sea de utilidad.\n","date":"17 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/posts/mi-script-de-traducci%C3%B3n-de-ficheros-de-texto-usando-el-api-de-chatgpt.-guia-de-instalaci%C3%B3n/","section":"Posts","summary":"En esta entrada os explico como instalar y usar un pequeño script de python que he escrito. dicho script se conecta al API de OpenAI para usar GPT-3.5_turbo para traducir archivos de un idioma a otro. Sin importar que sean archivos largos. Es necesario tener una clave API de OpenAi para usar el programa. Esta Api tiene un coste, pero es muy bajo, del orden de 1 céntimo de euro la traducción.\n","title":"Mi script de traducción de ficheros de texto usando el api de chatgpt. Guia de instalación","type":"posts"},{"content":"","date":"17 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/python/","section":"Tags","summary":"","title":"Python","type":"tags"},{"content":"","date":"17 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/software/","section":"Tags","summary":"","title":"Software","type":"tags"},{"content":"","date":"17 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/tags/traductor/","section":"Tags","summary":"","title":"Traductor","type":"tags"},{"content":"A partir de los cursos que he diseñado e impartido a más de 300 profesores universitarios con el título ‘ChatGPT, oportunidad y reto para la docencia’, y a petición del vicerectorado de política universitaria de la UPC he escrito este borrador de decálogo de recomendaciones. Con aportaciones adicionales, dicho documento ha sido presentado a la comunidad de la Universitat Politécnica de Catalunya. Esta es mi versión con algunas revisiones adicionales.\nIA EN LA UNIVERSIDAD, DECÁLOGO DE RECOMENDACIONES # Nos encontramos ante una tecnología de gran potencial transformador: la disponibilidad de modelos generativos basados en IA - como ChatGPT - que tienen la capacidad de generar contenidos (texto, código, imágenes, sonido, video…) similares a los que podría generar una persona. Los modelos generativos ya son parte de las herramientas de trabajo que tenemos y aprender a usarlas de forma efectiva, responsable y entendiendo sus limitaciones, es una competencia nueva a aprender e integrar en la forma de trabajo de todos, docentes y estudiantes. Probablemente, estamos solo al comienzo de un nuevo paradigma que nos llevará a repensar la actividad académica, no solo porque tener a disposición estas herramientas tiene potencial para transformar la experiencia de aprendizaje, sino también porque pueden cambiar/evolucionar las competencias que los profesionales requerirán en el futuro.\nEN EL ESTUDIO # Es necesario conocer y comprender estas herramientas. Es importante comprender mínimamente esta nueva tecnología, sus posibilidades, oportunidades y retos en el mismo ámbito de trabajo o estudio. Es necesario identificar cómo afectan los modelos generativos a cada una de las disciplinas, qué tareas se vuelven automatizables, y con qué nivel de fiabilidad y precisión, y cuáles no. Los modelos generativos pueden ser una herramienta de consulta, para generar ideas y primeros borradores para muchas tareas. Es posible usarlos dentro y fuera del aula. Ya se está investigando cómo hacer versiones adaptables a dominios de conocimiento específico como la temática de una asignatura. Ciertas metodologías docentes donde el estudiantado tiene que poner en práctica sus conocimientos en el aula (como la clase invertida) pueden ser eficaces para sacar partido y/o convivir con estas nuevas herramientas en el ámbito académico. Es necesario ser muy cuidadosos con la información que damos a modelos IA ofrecidos como “software as a service” en la nube. Es necesario tener en cuenta si estos servicios cumplen con la GDPR y quién usará la información que damos durante un chat. EN LA EVALUACIÓN # La posibilidad que los trabajos realizados fuera del aula no sean obra original del estudiante siempre ha estado presente. No es una novedad. Los modelos generativos simplifican y abaratan ( en el caso de academias o organizaciones que hacen trabajos académicos a cambio de dinero) Las herramientas de detección de copia como URKUND-Ouriginal no son fiables, y posiblemente no lo vuelvan a ser nunca, especialmente para textos de menos de 1000 caracteres. Hay que tener en cuenta el alto incide de falsos positivos; las consecuencias de actuar en el caso de un falso positivo son graves y se deben evitar. Ciertos proyectos, ejercicios y tareas se pueden automatizar. Es necesario valorar alternativas como proponer nuevos tipos de trabajos y evaluar el proceso de trabajo por encima del resultado. Algunas actividades de evaluación que se pueden proponer son portafolios formativos, presentaciones de trabajos en clase, evaluación oral, simulaciones, etc. Los exámenes presenciales, sin acceso a internet, no se ven afectados. De la misma manera que algunos exámenes han sido con apuntes o conexión a internet, puede ser un reto proponer exámenes con acceso a modelos generativos. ","date":"1 de mayo de 2023","externalUrl":null,"permalink":"/ludo/es/posts/decalogo-sobre-el-uso-de-la-ia-en-el-aula/","section":"Posts","summary":"A partir de los cursos que he diseñado e impartido a más de 300 profesores universitarios con el título ‘ChatGPT, oportunidad y reto para la docencia’, y a petición del vicerectorado de política universitaria de la UPC he escrito este borrador de decálogo de recomendaciones. Con aportaciones adicionales, dicho documento ha sido presentado a la comunidad de la Universitat Politécnica de Catalunya. Esta es mi versión con algunas revisiones adicionales.\n","title":"Un decálogo de recomendaciones sobre el uso de la IA en el aula.","type":"posts"},{"content":"","date":"26 de abril de 2023","externalUrl":null,"permalink":"/ludo/es/tags/cursos/","section":"Tags","summary":"","title":"Cursos","type":"tags"},{"content":"","date":"26 de abril de 2023","externalUrl":null,"permalink":"/ludo/es/tags/ice-upc/","section":"Tags","summary":"","title":"Ice-Upc","type":"tags"},{"content":"Cuenta la leyenda que el sabio Anand (nombre sugerido por ChatGPT, a quien yo llamo Skippy ^2) ayudó al rey Devendra (nombre también propuesto por Skippy) a resolver un problema difícil. En agradecimiento Devendra ofreció a Anand el pago que deseara. Anand pidió que el rey le diera un grano de arroz por la primera casilla de un tablero de ajedrez y que duplicara la cantidad en cada casilla sucesiva. El rey aceptó, pero después de un buen rato los matemáticos del rey le informaron que no había suficiente trigo en todo el reino para pagar lo que Anand pedía.\nGordon Moore, uno de los fundadores de Intel, observó en 1965 que la capacidad de integrar transistores en un chip se duplica cada 18 meses. Es decir, siguiendo una progresión exponencial. Esta observación se convirtió en un predictor del comportamiento de la industria que se ha ido cumpliendo hasta la muerte de Moore a principios de 2023.\nParece imposible que algo se duplique 64 veces, pero desde la observación de Moore la potencia de los procesadores se ha duplicado 43 veces. Pero aún hay más: hace 20 años el inventor y futurista Ray Kurzweil, calculó la capacidad de computación que uno ha podido adquirir por 1000 dólares ajustados por inflación durante todo el siglo XX. El resultado indicaba un crecimiento exponencial comenzando quizás antes de principios de siglo XX, si tenemos en cuenta los trabajos de Blaise Pascal, Charles Babbage y Ada de Lovelace a principios de siglo XIX. Lo que sí podemos decir es que durante el S.XX la capacidad de computación que podemos comprar a un precio determinado se ha duplicado, independientemente de la tecnología empleada, 66 veces durante el siglo XX. Más que casillas en un tablero de ajedrez. Y este comportamiento no se ha detenido en los 23 años que llevamos de siglo XXI.\nTanto el sabio Anand como el rey Devendra estarían boquiabiertos. Pero la pregunta que se haría el sabio Anand es: ¿qué pasa cuando algo se duplica tantas veces y qué pasa cuando esto afecta a tantas cosas?\nUna posible respuesta la da Peter Diamandis, emprendedor y futurista greco-estadounidense, quien propone en su libro “Abundance: The Future Is Better Than You Think” (^1) que cuando algo se digitaliza se convierte en conectado con esta mejora exponencial. Esto al principio no es gran cosa (es engañoso) porque al principio las curvas exponenciales son bastante planas, pero de repente hacen un codo hacia arriba y crecen súbitamente. Es entonces cuando la digitalización se vuelve disruptiva. Y esta disrupción implica cambios en la manera que se hacen las cosas, en los artefactos que usamos (que se hacen más pequeños o desaparecen), en los trabajos que tenemos que hacer las personas - la desaparición de algunos y la creación de otros -, y en el valor de las cosas: algunas cosas dejan de tener valor porque se vuelven abundantes y otras cosas se vuelven muy valiosas.\nLe podéis preguntar a Skippy por las 6 D’s de Diamandis y os lo explicará muy bien.\nOtra posible respuesta la dio Alvin Toffler, en un ensayo en la prestigiosa revista Playboy - que no es Open Access ni JCR, pero seguro que habéis oído hablar de ella - en 1970 y posteriormente en el libro del mismo título: “Future shock” ^3 . El shock del futuro. Toffler hace la observación de que las transformaciones causadas por la innovación tecnológica - ya en 1970 - cada vez son más profundas y cada vez se suceden más de prisa, se aceleran. De manera que el mundo cambia de manera radical varias veces durante el tiempo de vida de una persona. Y esto nos puede dejar perplejos, en el shock del futuro.\nSi Toffler ya observaba el shock del futuro hace 53 años, ahora es algo evidente en nuestro día a día. Pensemos que hace 25 años no había web - estaba, pero solo éramos 4 friquis -, hace 15 años no había teléfonos móviles conectados a internet - estaban, pero solo teníamos 4 friquis -, hace 6 meses no había modelos generativos que parecen Inteligencias artificiales. Bueno, estaban, pero solo jugábamos 4 friquis.\nEl 30 de noviembre de 2022 se puso en marcha ChatGPT, otro Chatbot en internet como habíamos visto muchos otros, que permitía hablar con el modelo generativo GPT-3 (Generative Pretrained Transformer) desarrollado por la organización sin ánimo de lucro OpenAI (que se lo han repensado y ahora sí que quieren hacer beneficios). En 5 días ChatGPT llegó a los 5 millones de usuarios, en dos meses había llegado a los 100 millones de usuarios. ChatGPT ya puede entrar en el libro Guinness de los récords como el producto de expansión más rápida hasta el momento. El mes de enero de 2023 ChatGPT era tan popular en las búsquedas de Google como la Shakira, ahora - en mayo de 2023 - es difícil encontrar un término más popular por todas partes.\nPor algún motivo ChatGPT es lo suficientemente bueno para que todos los que lo usamos veamos que esto es algo diferente. Un Chatbot al que vale la pena prestar atención. Igual que en su día los usuarios de internet que probaban el nuevo buscador Google se daban cuenta de que se trataba de algo diferente; diez veces mejor que cualquier otra cosa, les gusta decir a los creadores de Google.\nChatGPT marca el inicio del codo en la progresión de una nueva herramienta: los modelos generativos basados en redes neuronales, una tecnología del campo de investigación de la inteligencia artificial (IA) que lleva casi 70 años corriendo. No olvidemos que, tal como decía John McCarthy - uno de los padres de la disciplina - cuando una tecnología funciona ya no la llamamos IA, sino otra cosa. Los objetivos de la IA se mueven más allá, quizás ahora ya apunten hacia el objetivo no alcanzado de las Inteligencias artificiales generales (IAG) equivalentes a la inteligencia humana. Pero tranquilos que aún no estamos ahí, ni estaremos pronto.\nNo obstante los modelos generativos ahora se han convertido en una tecnología lo suficientemente buena para convertirse en la base de servicios para el público general. Los sistemas informáticos ahora entienden el lenguaje con el que nos comunicamos los humanos - cualquier idioma o casi cualquier - comienzan a entender contexto y sutilezas culturales, y son capaces de responder dando información a menudo acertada. Cada vez más acertada.\nÚltimamente, he visto fotografías de hemeroteca que muestran profesores de matemáticas manifestándose en la calle protestando por el uso de las calculadoras en los años 70. La negación o la prohibición es una de las primeras respuestas que podemos esperar, aunque sirvan de poco.\nLas calculadoras eran y son fantásticas, permiten hacer cálculos aritméticos, acceder a tablas de logaritmos y trigonométricas, e incluso ejecutar algoritmos. Con una calculadora somos capaces de resolver problemas muy complejos, rápido y con precisión. Seguramente problemas que no podríamos abordar sin ellas. Pero la disponibilidad de las calculadoras puede causar que no aprendamos a hacer estas operaciones sin ellas. O que olvidemos cómo hacerlas. “Use it or lose it” dicen.\nChatGPT y la gran familia de modelos generativos que viene - id a huggingface.co donde encontraréis la principal comunidad de aprendizaje sobre modelos generativos y transformadores y veréis qué se cuece allí - puede hacer muchas cosas por nosotros: Ayudarnos a traducir textos, resumir documentos, preparar presentaciones, revisar gramática y estilo, responder preguntas que antes hubiéramos hecho a una enciclopedia, un experto o al buscador de internet… Y aún más, si tenemos suerte y tenemos habilidad para dar las indicaciones (lo que llaman “prompt”, pero son “indicaciones”) pueden ayudar a resolver problemas y conectarse con otros programas para conseguir aún más cosas. Pueden generar código para nuestros programas, ayudarnos a mejorar el estilo, encontrar errores y documentarlos. Y muchas otras cosas. Que como las calculadoras aumentarán nuestras capacidades, pero tendremos que vigilar porque usando estas herramientas podemos perder la habilidad de hacer las cosas sin ellas.\nLos modelos IA Generativos tienen una propiedad muy interesante: a veces alucinan. En el contexto de IA las alucinaciones son resultados extraños - erróneos, seguro - que dan a veces, de manera imprevista e impredecible, estos sistemas. De manera que siempre que usamos uno de estos modelos tenemos que pensar que quizás el resultado es preciso o quizás es una alucinación.\nCuando una calculadora da un resultado, ¿tenemos la capacidad de comprobar si el resultado es correcto? Ciertamente, asumimos el riesgo y la responsabilidad de aceptar el resultado de una calculadora - o una hoja de cálculo o el SAP - cada vez que los usamos para nuestro día a día. Pero las calculadoras son fiables, están construidas con sistemas deterministas que siempre dan el mismo resultado. Y si fallan, podemos buscar dónde está el error y corregir el sistema.\nCon los modelos de redes neuronales esto no es así. Sabemos que funcionan de forma fenomenológica: funcionan porque funcionan y observamos un comportamiento. Nada nos garantiza que continuarán funcionando así o que alucinarán o nos explicará por qué funcionan como lo hacen. Pensad en esto cuando, muy pronto, más y más sistemas estén controlados por estos modelos.\nComo docentes y educadores nos surge el dilema. ¿Debemos usar estas herramientas o no debemos usarlas en nuestras asignaturas? Y si las debemos usar: ¿cómo las debemos usar? Independientemente de lo que decidamos nuestros estudiantes ya disponen de estas herramientas, saben quién es la Shakira y también qué es ChatGPT.\nLos jugadores expertos del videojuego de estrategia en tiempo real Starcraft explican que para ganar se ha de jugar en Macro y en Micro. Hay que tener una estrategia Macro: dominar todo el mapa, tener una estrategia para ganar la partida a largo plazo. Pero hay que aplicar táctica y operaciones en Micro, estar atento y mover tus unidades allí donde hay enfrentamientos. Y saber cuándo has de prestar atención a Macro o a Micro. Sin dominar el Macro-Micro no se puede ganar al Starcraft.\nDe la misma manera cada asignatura tiene un contexto Macro: ¿Cuáles son los objetivos de la asignatura? ¿Los profesionales que formamos, usarán herramientas IA generativas en su día a día? ¿Cómo afecta esto a nuestros objetivos? Y cómo afectará en los meses y años venideros, dado el ritmo de avance chocante de la tecnología?\nPero también hay un contexto Micro: ¿Cómo enseñamos? ¿Prohibimos la IA en el aula o asumimos que en cualquier momento nuestros estudiantes pueden tener abierta la ventana de ChatGPT o alguna otra herramienta? Y los proyectos? Y los ejercicios que deben hacer en casa? ¿Cómo los evaluamos sabiendo que disponen de herramientas IA que son imposibles o muy difíciles de detectar?\nCada docente, cada equipo de docentes en cada asignatura tenemos la oportunidad y el reto de repensar nuestra estrategia y práctica docente. Y no lo podemos ignorar.\n^1 (Diamandis, P. H., \u0026amp; Kotler, S. (2012). Abundance: The Future Is Better Than You Think. Free Press.” ^2 Skippy es el nombre de la IA alienígena que co-protagoniza la serie de novelas de ciencia ficción Expeditionary Force del escritor Craig Alanson. ^3 Toffler, Alvin. (1970). Future Shock. New York: Random House.\n","date":"26 de abril de 2023","externalUrl":null,"permalink":"/ludo/es/posts/i-la-ia-va-venir-a-laula/","section":"Posts","summary":"Cuenta la leyenda que el sabio Anand (nombre sugerido por ChatGPT, a quien yo llamo Skippy ^2) ayudó al rey Devendra (nombre también propuesto por Skippy) a resolver un problema difícil. En agradecimiento Devendra ofreció a Anand el pago que deseara. Anand pidió que el rey le diera un grano de arroz por la primera casilla de un tablero de ajedrez y que duplicara la cantidad en cada casilla sucesiva. El rey aceptó, pero después de un buen rato los matemáticos del rey le informaron que no había suficiente trigo en todo el reino para pagar lo que Anand pedía.\n","title":"Y la IA vino al aula","type":"posts"},{"content":"[Nota: esta entrada ha sido traducida con el propio traductor] [Nota: usar la API tiene costes, el coste del uso depende del tamaño de los documentos. Como guía orientativa, durante el desarrollo, pruebas y traducciones varias de documentos de 2 páginas he gastado 0.0.3€ en 5 días]\nEn esta entrada presento un pequeño proyecto que he publicado como open source. Lo que antes habría sido un proyecto de muchos años y varios millones de euros, ahora es una pequeña prueba hecha un sábado por la mañana. Las claves son Github Copilot, ChatGPT 4 como asistentes de programación y la API de GPT.3.5 turbo.\ngpt-translator # Lo puedes descargar de https://github.com/granludo/gpt-test/tree/main/file-trasnlator\nLicenciado bajo la Licencia Pública General de GNU v3.0\nPrograma simple en Python 3 que utiliza el modelo GPT-3.5-turbo de OpenAI para traducir archivos de un idioma a otro. Divide el archivo en fragmentos de 20 líneas.## Requisitos\nNecesitas tener una clave para usar la API de OpenAI; puedes obtener una aquí: https://beta.openai.com/docs/developer-quickstart/api-key este programa busca la clave en un archivo indicado en la variable “mykeypath”, por defecto en la ruta ‘..//..//mykey.json’\nNecesitas tener instalado Python 3 en tu sistema. Yo he usado Python 3.10\nNecesitas instalar los paquetes json y openai\npip install openai\npip install json\nPuede que en tu sistema tengas que usar pip3 en lugar de pip.\nUso # python3 gpt-traductor.py fitxer_origen idioma_origen idioma_destí fitxer_destí\nEjemplo\npython3 gpt-translate.py sample.md català italià sample_translated.md\nQue te diviertas.\n","date":"8 de abril de 2023","externalUrl":null,"permalink":"/ludo/es/posts/traductor-cat/","section":"Posts","summary":"[Nota: esta entrada ha sido traducida con el propio traductor] [Nota: usar la API tiene costes, el coste del uso depende del tamaño de los documentos. Como guía orientativa, durante el desarrollo, pruebas y traducciones varias de documentos de 2 páginas he gastado 0.0.3€ en 5 días]\n","title":"Traductor sencillo de documentos multiidioma en Python. Un proyecto rápido.","type":"posts"},{"content":"[Nota: usar el api de OpenAi tiene sus costes. El coste del uso del traductor va a depender del tamaño de los documentos que traduzcas. Como orientación, de momento con el desarrollo, pruebas y traducción de algunos documentos he gastado 0.03 €. ]\nEn esta entrada presento un pequeño proyecto que he publicado como open source. Lo que hantes hubiera sido un proyecto de múchos años y varios millones de euros, ahora es una pequeña prueba hecha un sabado por la mañana. Las claves son Github Copilot, ChatGPT 4 como asistenes de programación y la API de GPT.3.5 turbo.\ngpt-translator # Lo puedes descargar de https://github.com/granludo/gpt-test/tree/main/file-trasnlator\nLicenciado bajo la Licencia Pública General de GNU v3.0\nPrograma simple en Python 3 que utiliza el modelo GPT-3.5-turbo de OpenAI para traducir archivos de un idioma a otro. Divide el archivo en fragmentos de 20 líneas.\nRequisitos # Necesitas tener una clave para usar la API de OpenAI, puedes obtener una aquí: https://beta.openai.com/docs/developer-quickstart/api-key este programa busca la clave en un archivo indicado en la variable “mykeypath” por defecto en la ruta ‘..//..//mykey.json’\nNecesitas tener instalado Python 3 en tu sistema. Yo he usado python 3.10\nNecesitas instalar los paquetes json y openai\npip install openai\npip install json\nQuizás en tu sistema debas usar pip3 en vez de pip.\nUso # python3 gpt-traductor.py archivo_origen idioma_origen idioma_destino archivo_destinoEjemplo\npython3 gpt-translate.py sample.md catalan italian sample_translated.md\nQue te diviertas.\n","date":"8 de abril de 2023","externalUrl":null,"permalink":"/ludo/es/posts/traductor-simple-de-documentos-multi-idioma-en-python.-un-proyecto-r%C3%A1pido/","section":"Posts","summary":"[Nota: usar el api de OpenAi tiene sus costes. El coste del uso del traductor va a depender del tamaño de los documentos que traduzcas. Como orientación, de momento con el desarrollo, pruebas y traducción de algunos documentos he gastado 0.03 €. ]\n","title":"Traductor simple de documentos multi-idioma en python. Un proyecto rápido.","type":"posts"},{"content":"El pasado 2 de Marzo de 2023 participé en la Sessión sobre Chatbots de IA en Educación Superior organizada por la Universitat Internacional de Catalunya UIC. En https://www.linkedin.com/events/sessi-sobrexatbotsd-intel-lig-n7034187811851235329/comments/ teneis el video de la jornada. Un servidor y su charla aparecen a partir de 1h:25 minutos.\n","date":"1 de marzo de 2023","externalUrl":null,"permalink":"/ludo/es/posts/participaci%C3%B3-a-jornada-sobre-ia-i-docencia-a-la-uic-1/","section":"Posts","summary":"El pasado 2 de Marzo de 2023 participé en la Sessión sobre Chatbots de IA en Educación Superior organizada por la Universitat Internacional de Catalunya UIC. En https://www.linkedin.com/events/sessi-sobrexatbotsd-intel-lig-n7034187811851235329/comments/ teneis el video de la jornada. Un servidor y su charla aparecen a partir de 1h:25 minutos.\n","title":"Participació a jornada sobre IA i docencia a la UIC","type":"posts"},{"content":" Contenidos # ¿Qué es ChatGPT? ChatGPT es un Software como Servicio (SaaS) Términos y condiciones Derechos de autoría y responsabilidad sobre las salidas de ChatGPT Coste y acceso ¿Cuál es la finalidad de ChatGPT y por qué es gratis? ChatGPT no es código abierto Aspectos éticos Reflexiones éticas de los creadores de GPT-3 El hype de ChatGPT ¿Qué es ChatGPT? # ChatGTP es una aplicación web basada en GPT-3, concretamente en el modelo GPT-3.5 “text-davinci-003” desarrollado por OpenAi. El modelo ChatGPT está optimizado para funcionar en forma de conversación, respondiendo a las entradas que los usuarios le dan en forma de “prompt” de texto. ChatGPT es un tipo de IA generativa basada en un modelo de aprendizaje automático. Podemos considerar que ChatGPT es una IA débil (véase Tipos de inteligencia artificial].\nGPT-3 es un modelo generativo de lenguaje natural inmenso. Ha sido entrenado con 175 mil millones de parámetros en múltiples idiomas, entre ellos el catalán. Si el proceso de entrenamiento se hubiera hecho con un solo ordenador habrían hecho falta 355 años. El coste de entrenarlo en una plataforma en la nube de bajo coste es de 4.600.000 dólares. https://lambdalabs.com/blog/demystifying-gpt-3\n(Fuente de la imagen: https://blog.accubits.com/getting-started-with-gpt-3-model-by-openai/)\nChatGPT es un Software como Servicio (SaaS) # ChatGPT se proporciona como servicio; es un “Software as a Service”, no un programa que podamos instalar en un servidor o en un servicio de computación en la nube. Por tanto, los propietarios del servicio (OpenAi, entidad participada por Microsoft en un 49% desde enero de 2023) deciden las condiciones de prestación: quién tiene acceso, para qué fines y qué calidad de servicio y disponibilidad ofrece.\nTérminos y condiciones # Los términos de servicio de ChatGPT https://openai.com/terms/ indican que\nEstás de acuerdo y nos das instrucciones para utilizar el Contenido para desarrollar y mejorar los servicios. Puedes leer más aquí sobre cómo se puede utilizar el Contenido para mejorar el rendimiento del modelo. Entendemos que en algunos casos puede que no quieras que tu Contenido se utilice para mejorar los servicios. Puedes optar por que tu Contenido no se use para mejorar contactando con suport@openai.com con tu ID de organización. Ten en cuenta que en algunos casos esto puede limitar la capacidad de nuestros servicios para abordar mejor tu caso de uso específico.\nO sea que los datos que introducimos en ChatGPT en forma de prompt serán recogidos, analizados y empleados para la investigación, la mejora del servicio y, sin duda, para entrenar futuras versiones de GPT-N.\nOpenAi publica de forma clara cuáles son sus términos y condiciones, no abusa del lenguaje legal ni usa letra pequeña. Os recomiendo la lectura de los términos de servicio https://openai.com/terms/ y la política de privacidad https://openai.com/privacy/\nDerechos de autoría y responsabilidad sobre las salidas de ChatGPT # Un aspecto muy importante del uso de herramientas de IA generativa como ChatGPT, DALL-E, Stable Diffusion, Whisper o VALL-E, es el acuerdo establecido implícita o explícitamente sobre los derechos de autoría de lo que se genera (texto, imagen, audio o vídeo). Esto determina el copyright y los derechos de uso que se derivan para las partes implicadas.\nLos términos genéricos de OpenAi para sus herramientas definen dos conceptos importantes: Entrada y salida. La Entrada (Input) es el prompt generado por los usuarios, mientras que la Salida (Output) es el contenido generado por el modelo de aprendizaje automático. La entrada y la salida conforman el contenido.\nVeamos lo que dicen los términos traducidos por el propio ChatGPT.\n_(a) Tu contenido. Puedes proporcionar datos de entrada a los servicios (“Entrada”) y recibir los datos de salida generados y devueltos por el servicio basados en la Entrada (“Salida”). La Entrada y la Salida son colectivamente el “Contenido”. Entre las partes y en la medida permitida por la ley aplicable, tú eres propietario de toda la Entrada y, sujeto a tu cumplimiento de estos Términos, OpenAI te cede todo su derecho, título e interés sobre la Salida. OpenAI puede utilizar el Contenido según sea necesario para proporcionar y mantener los Servicios, cumplir con la ley aplicable y hacer cumplir nuestras políticas. Eres responsable del Contenido, incluyendo asegurar que no viola ninguna ley aplicable ni estos Términos.\nO sea, que el autor de un prompt] tiene los derechos sobre las salidas generadas por una IA de OpenAi siempre que tenga derechos sobre las entradas que han generado esos contenidos. En caso de no tener los derechos estaría contraviniendo los términos de servicio de OpenAi y eso conllevaría que yo no soy quien para decir nada al respecto y hay que consultar abogados y servicios legales.\nOpenAi tiene cosas que decir sobre el contenido, su naturaleza y la posibilidad de que ciertas salidas se repitan.\n(b) Similitud del contenido. Debido a la naturaleza del aprendizaje automático, la Salida puede no ser única entre los usuarios y los servicios pueden generar la misma o similar salida para OpenAI o un tercero. Por ejemplo, puedes proporcionar entrada a un modelo como “¿De qué color es el cielo?” y recibir una salida como “El cielo es azul.” Otros usuarios también pueden hacer preguntas similares y recibir la misma respuesta. Las respuestas que son solicitadas por y generadas por otros usuarios no se consideran tu Contenido.\nO sea, la originalidad de la salida depende de la originalidad de la entrada. Los abogados se lo pasarán en grande en los próximos años. O quizá un hermano de ChatGPT especializado en asesoría legal… pero divago.\nCoste y acceso # En enero de 2023 y desde diciembre de 2022 ChatGPT está disponible gratuitamente en la URL https://chat.openai.com\nLos modelos anteriores de GPT-3 estaban disponibles para hacer pruebas a través de una interfaz más compleja y por API (Aplication Programming Interface). Para acceder, tras un periodo de prueba había que pagar por su uso comprando paquetes de “tokens”. No está claro cuánto tiempo estará ChatGPT disponible para su uso gratuito.\nYa hay una lista de espera abierta para acceder a la modalidad “pro” de ChatGPT. Se especula que el precio será de 42$ mensuales, aunque se mantiene la modalidad gratuita.\nEl acceso para programadores de aplicaciones vía API (Aplication Programming Interface) a ChatGTP y en breve se empezará a gestionar a través de los servicios cloud de Microsoft: Azure. https://indianexpress.com/article/technology/tech-news-technology/openais-chatgpt-api-microsoft-azure-api-businesses-8386106/ A consecuencia de ello con toda seguridad empezaremos a encontrar herramientas especializadas que harán uso de diversos modelos de GPT-3.\nUn ejemplo es el modelo “códex”, una variante de GPT-3 entrenada con el código fuente disponible en Github (el repositorio de proyectos de software libre más grande de la red, adquirido por Microsoft hace un par de años), donde desde hace unos meses se ofrece el sistema Copilot, un asistente a la programación capaz de generar código, traducir programas entre lenguajes de programación, optimizar código y comentar programas, entre otras aplicaciones.\n¿Cuál es la finalidad de ChatGPT y por qué es gratis? # El objetivo de ChatGPT es facilitar el uso de este modelo por parte de un gran número de personas (del orden de cientos de millones), obteniendo datos para los investigadores de OpenAi. Tal como apunta el CEO de OpenAi en el pódcast Moonshots.\nMoonshots. Peter Diamandis. “The Rise of OpenAi with Sam Altman” https://www.diamandis.com/podcast/sam-altman ChatGPT no es código abierto # GPT-3 no es código abierto, otros modelos de aprendizaje automático lo son pero GPT-3 y DALL-E no. Al respecto, ChatGPT dice:\n_GPT-3 es un modelo de procesamiento de lenguaje desarrollado por OpenAI. El modelo y los datos que se utilizan para entrenarlo son propiedad de OpenAI, y por eso no son de código abierto. OpenAI ha decidido no hacerlo abierto porque considera que es una tecnología valiosa y considera que es importante protegerla para poder continuar financiando su desarrollo y mejora.\nAdemás, hay preocupaciones sobre los posibles riesgos asociados con el uso no intencionado o malicioso de la tecnología de GPT-3, como la generación automatizada de noticias falsas o la automatización de la ingeniería social. OpenAI ha adoptado una estrategia de licencia restrictiva para evitar estas preocupaciones y asegurar que GPT-3 se utilice de manera responsable.\nAspectos éticos # Los resultados de los modelos generativos basados en transformador pueden ofrecer resultados tan convincentes como para pasar el test de Turing. En junio de 2022 un ingeniero de Google, quien fue despedido, declaró que estaba convencido de que el modelo Lambda era autoconsciente y que, por tanto, tenía derechos análogos a los derechos humanos. https://www.livescience.com/google-sentient-ai-lamda-lemoine\nEn enero de 2023 en las redes sociales han circulado rumores sobre el número de parámetros de GPT-4. No obstante, el CEO de OpenAi Sam Altman lo ha desmentido y ha hecho hincapié en que GPT-4 no será una Tipos de inteligencia artificial.\nChatGPT es un proyecto en continua evolución. A menudo hay actualizaciones del servicio y muchos investigadores han reportado cambios en su comportamiento. Al poco rato de usar ChatGPT podemos observar que se ha hecho un esfuerzo por hacer sus respuestas políticamente correctas. Algunos de los ejemplos son:\nLa insistencia en el hecho de que es un software, que no tiene agencia y que no es una inteligencia artificial Reflexiones éticas de los creadores de GPT-3 # Los creadores de GPT-3 presentaron el proyecto en el artículo “Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … \u0026amp; Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.” En el artículo dedican una sección bien amplia a discutir los posibles malos usos de sistemas generadores de texto como GPT-3.\nResumido por GPT-3\n_Los usos maliciosos de los modelos de lenguaje pueden ser algo difíciles de anticipar porque a menudo implican la reutilización de los modelos de lenguaje en un entorno muy diferente o para un propósito distinto del que los investigadores tuvieron en cuenta.\nPara ayudar con esto, podemos pensar en términos de marcos de valoración de riesgos de seguridad tradicionales, que esbozan pasos clave como identificar amenazas e impactos potenciales, evaluar la probabilidad y determinar el riesgo como una combinación de probabilidad e impacto.\nDiscutimos tres factores: las aplicaciones de uso indebido potenciales, los actores de riesgo y las estructuras de incentivo externas. El potencial de uso indebido de los modelos de lenguaje aumenta a medida que mejora la calidad de la síntesis de texto. La capacidad de GPT-3 para generar varios párrafos de contenido sintético que a las personas les resulta difícil distinguir del texto escrito por humanos es un punto preocupante en este sentido._\nLas aplicaciones de uso indebido potenciales de modelos de lenguaje incluyen la desinformación, el spam, el phishing, el abuso de procesos legales y gubernamentales, la redacción fraudulenta de ensayos académicos y la precisión de la ingeniería social. El potencial de uso indebido aumenta con la mejora de la calidad de la síntesis de texto. Los autores identifican los diferentes tipos potenciales de “actores de amenaza” (threat actors) en función del nivel de habilidad y recursos de estos. Estos van desde actores de baja o moderada habilidad y recursos hasta grupos altamente habilidosos y bien equipados como los patrocinados por estados que llaman ATP (Advadced Persistent Therats).\nLos actores de baja y media habilidad actualmente no representan una amenaza inmediata, pero las mejoras en la fiabilidad podrían cambiar esto. Los actores APT no discuten sus operaciones en público, pero no se han detectado diferencias en las actuaciones de estos actores desde la salida de GPT-2. El comportamiento de los actores de amenaza se ve influenciado por las estructuras de incentivo externas como la escalabilidad, la reducción de coste de despliegue y la facilidad de uso pueden influir en la adopción de nuevas técnicas, tácticas y procedimientos (TTPs) adoptados por los actores de amenaza. Se espera que los investigadores de IA desarrollen modelos de lenguaje cada vez más fiables y dirigibles, lo que representaría desafíos para la comunidad científica y la necesidad de trabajar en soluciones de seguridad. Los creadores de GPT-3 continúan su análisis con una discusión sobre los sesgos que puede tener el sistema y cómo paliarlos. Y concluyen con un apartado sobre los aspectos energéticos del sistema.\nEl hype de ChatGPT # Ya hace casi dos años que hay disponibles herramientas de IA generativas que permiten crear textos a partir de prompts. No obstante, estas herramientas tenían una popularidad muy limitada en entornos de interés en la IA y la innovación tecnológica. Vemos en la siguiente figura la popularidad de GPT-3, el mejor modelo hasta el momento, comparado con la popularidad en búsquedas en Google de un término relativamente mainstream como _“ferrari”__.\nEn cambio, cuando añadimos el término “ChatGTP”_ a la comparativa nos llevamos un susto.\nEl término “ferrari” es un buen benchmark porque mantiene un interés bastante estable y nos permite ver cómo ChatGPT despierta una atención global muy alta. Pero, ¿cómo se compara ChatGPT respecto a un término con un fuerte hype de primer nivel durante el mes de enero de 2023 como “Shakira”, quien ha estado muy de moda debido a su última canción que se ha convertido en un fenómeno en la música y la cultura popular?\nPues el resultado de Google Trends apunta al hecho de que el nivel de atención a las búsquedas que “ChatGPT” está suscitando es del mismo orden que el que suscita la cantante colombiana que hasta hace poco vivía en Barcelona.\nRecordemos el significado de “hype”. Según ChatGPT:\nHype es un término utilizado para describir una gran cantidad de publicidad y entusiasmo exagerado por un producto, idea o tendencia. En general, se refiere a un aumento de la popularidad o de la atención que se ha dado a algo sin una base real o justificación. Así, el término hype suele referirse a una situación en la que se han generado expectativas o expectativas desmesuradas sobre un producto o servicio, de manera que no es coherente con su realidad o sus capacidades.\nHaya o no base real o justificación, ChatGPT es sin duda uno de los términos de búsqueda más populares en internet.\n","date":"24 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/posts/que-es-chatgtp/","section":"Posts","summary":"Contenidos # ¿Qué es ChatGPT? ChatGPT es un Software como Servicio (SaaS) Términos y condiciones Derechos de autoría y responsabilidad sobre las salidas de ChatGPT Coste y acceso ¿Cuál es la finalidad de ChatGPT y por qué es gratis? ChatGPT no es código abierto Aspectos éticos Reflexiones éticas de los creadores de GPT-3 El hype de ChatGPT ¿Qué es ChatGPT? # ChatGTP es una aplicación web basada en GPT-3, concretamente en el modelo GPT-3.5 “text-davinci-003” desarrollado por OpenAi. El modelo ChatGPT está optimizado para funcionar en forma de conversación, respondiendo a las entradas que los usuarios le dan en forma de “prompt” de texto. ChatGPT es un tipo de IA generativa basada en un modelo de aprendizaje automático. Podemos considerar que ChatGPT es una IA débil (véase Tipos de inteligencia artificial].\n","title":"¿Qué es y qué no es ChatGPT?","type":"posts"},{"content":"Conferencia John Mc Carty https://www.youtube.com/watch?v=K13_sWm_gZw\u0026t=23s\n","date":"23 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/posts/recursos-hist%C3%B2ria-de-la-inform%C3%A1tica/","section":"Posts","summary":"Conferencia John Mc Carty https://www.youtube.com/watch?v=K13_sWm_gZw\u0026t=23s\n","title":"Recursos sobre historia de la informática","type":"posts"},{"content":"Si eres docente y estás interesado en las IAs generativas y sus aplicaciones a la enseñanza, te interesará saber que ya puedes acceder a los vídeos del curso “ChatGPT: Oportunidad y Reto para la docencia” en mi canal de YouTube. En este curso se trata de ChatGPT, una herramienta de IA generativa de texto introducida a finales de 2022, y sus implicaciones para la docencia universitaria.\nLista de reproducción:ChatGPT Oportunidad y reto para la docencia, y ahora qué hacemos?\nEn este curso, se reflexiona sobre las oportunidades y retos que esta herramienta supone para la productividad, automatización de tareas y evaluación de los estudiantes. También se analizan las aplicaciones de ChatGPT en la docencia universitaria, se proponen estrategias para afrontar los retos y aprovechar las oportunidades de ChatGPT, y se identifican otras IAs generativas a tener en cuenta.\nLos contenidos del curso son muy útiles para los docentes, ya que se explican qué son las IAs generativas, sus posibilidades presentes y futuras, y su posible impacto en la sociedad y en la educación. También se identifican las oportunidades y retos que supone el uso de ChatGPT en la docencia, como la automatización de tareas y la mejora de la productividad, pero también los retos como el plagio o las dificultades de evaluación.\nFinalmente, el curso propone estrategias para afrontar los retos y aprovechar las oportunidades de ChatGPT aplicadas a los cursos de los participantes. Si eres docente y quieres estar a la vanguardia en el uso de las IAs generativas en la docencia, este curso es una oportunidad única para aprender y compartir conocimientos. No dudes en acceder a los vídeos del curso “ChatGPT: Oportunidad y Reto para la docencia” en el canal de YouTube.\n","date":"23 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/posts/post-1/","section":"Posts","summary":"Si eres docente y estás interesado en las IAs generativas y sus aplicaciones a la enseñanza, te interesará saber que ya puedes acceder a los vídeos del curso “ChatGPT: Oportunidad y Reto para la docencia” en mi canal de YouTube. En este curso se trata de ChatGPT, una herramienta de IA generativa de texto introducida a finales de 2022, y sus implicaciones para la docencia universitaria.\n","title":"Videos del curso ChatGPT Oportunidad y reto para la docencia v.1","type":"posts"},{"content":"","date":"17 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/tags/podcast/","section":"Tags","summary":"","title":"Podcast","type":"tags"},{"content":"Programar es una Mierda, es un podcast de referencia para hablar de programación con amor y humor. Creo que esta es la tercera participación en este programa en el que siempre hablamos de cosas interesantes. En esta ocasión hablamos de IA y programación.\n","date":"17 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/posts/invitado-en-el-podcast-programa-es-una-mierda/","section":"Posts","summary":"Programar es una Mierda, es un podcast de referencia para hablar de programación con amor y humor. Creo que esta es la tercera participación en este programa en el que siempre hablamos de cosas interesantes. En esta ocasión hablamos de IA y programación.\n","title":"Podcast: Te lo comIA todo, Programar es una Mierda","type":"posts"},{"content":"","date":"17 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/tags/programaci%C3%B3n/","section":"Tags","summary":"","title":"Programación","type":"tags"},{"content":"","date":"17 de febrero de 2023","externalUrl":null,"permalink":"/ludo/es/tags/video/","section":"Tags","summary":"","title":"Video","type":"tags"},{"content":"Cada vez veo más señales que indican que Google tendrá que poner orden en la casa para ser competitivo. Como este [https://archive.ph/7BYDG]. Cuando esto suceda, muchos servicios gratuitos o muy económicos simplemente serán discontinuados. No olvidemos que “Google graveyard” crece cada dia.\nLa compra del 49% de OpenAi por parte de Microsoft (quien ya tenía un acuerdo de colaboración previo, cuyos frutos hemos visto con el GITHUB_COPILOT). Si Microsoft integra de forma efectiva las herramientas de OpenAI en sus SAAS como Microsoft Office, muchos “clientes” de Google migrarán hacia sus servicios. Esto incluye Bing (Bing+GPT-4) y Office, como servicios SAAS de pago. Que los usuarios profesionales pagarán con gusto.\nGoogle solo sabe ganar dinero a costa de vender anuncios. Vende SAAS, pero no es su core-business ni forma parte de su cultura. El pobre soporte que ofrecen lo demuestra. ¿alguien en la sala ha conseguido hablar con un humano en un servicio Google? Y un asistente tipo ChatGPT que haga de sustituto de un motor de búsqueda no muestra anuncios, y por tanto no gana dinero en el modelo de negocio actual de Google. ¿Cómo resuelve esto Google?\n¿Dónde deja esto la continuidad de Google Apps (drive, classroom, meet, calendar, incluso gmail)? Muy probablemente en los próximos 5 años estas herramientas evolucionarán más que en los últimos 25 años a medida que se integren IA generativas.\nMantener estas herramientas actualizadas con el estado del arte, soportar el coste computacional (las GPU que ejecutan IA no tienen costo marginal cero, cuestan dinero) será una decisión de negocio. Y no tenemos certeza de que Google decida seguir jugando.\nY aunque la probabilidad de discontinuar el servicio o dejarlo obsoleto como servicio gratuito de bajo valor añadido para usuarios “free” sea muy baja, es el riesgo en el que incurren todas las organizaciones que lo usan para procesos críticos.\nOrganizaciones como la UPC estamos incurriendo en un riesgo y una deuda tecnológica muy importante. Cuando nos sería fácil auto-abastecernos con soluciones open source, manteniendo al personal de servicios TIC capacitado, y ganando oportunidades de negocio para UPCnet o inLabFIB.\nEn el articulo Privacy and E-learning a Pending Task (Alier M, Casañ Guerrero MJ, Amo D, Severance C, Fonseca D. Privacy and E-Learning: A Pending Task. Sustainability. 2021; 13(16):9206. https://doi.org/10.3390/su13169206) ya hablamos de los efectos a largo plazo de externalizar servicios core en universidades. En el caso del artículo, la apuesta por Moodle y el Open Source demostró ser la acertada en 2003. ?Que va a pasar en 2023?\n","date":"17 de enero de 2023","externalUrl":null,"permalink":"/ludo/es/posts/post-2/","section":"Posts","summary":"Cada vez veo más señales que indican que Google tendrá que poner orden en la casa para ser competitivo. Como este [https://archive.ph/7BYDG]. Cuando esto suceda, muchos servicios gratuitos o muy económicos simplemente serán discontinuados. No olvidemos que “Google graveyard” crece cada dia.\n","title":"El riesgo de seguir con Google Apps para universidades como la UPC","type":"posts"},{"content":"","date":"17 de febrero de 2020","externalUrl":null,"permalink":"/ludo/es/tags/conversation/","section":"Tags","summary":"","title":"Conversation","type":"tags"},{"content":"Martin Dougiamas es el creador del proyecto de software libre Moodle. He colaborado con él extensamente en el pasado. Hace unas semanas, Martin tuvo la amabilidad de venir a visitarme a LISA (Laboratori d’Inovació i Suport Audiovisual del ICE de la UPC) donde mantuvimos una conversación de más de hora y media sobre educación, innovación y muchas otras cosas.\nMartin va a editar y recortar el audio para su pódcast, el OpenEdTec Podcast. La conversación está en inglés, pero el vídeo de YouTube tiene subtítulos decentes. Lo hace mejor con el inglés de Martin que con mi inglés del Maresme. Espero que os guste.\n","date":"17 de febrero de 2020","externalUrl":null,"permalink":"/ludo/es/posts/post-3/","section":"Posts","summary":"Martin Dougiamas es el creador del proyecto de software libre Moodle. He colaborado con él extensamente en el pasado. Hace unas semanas, Martin tuvo la amabilidad de venir a visitarme a LISA (Laboratori d’Inovació i Suport Audiovisual del ICE de la UPC) donde mantuvimos una conversación de más de hora y media sobre educación, innovación y muchas otras cosas.\n","title":"Una conversación con Martin Dougiamas sobre TIC y educación","type":"posts"},{"content":" Build and display Mermaid.js diagrams in Hugo Export from Notion to Obsidian Github Repo ","externalUrl":null,"permalink":"/ludo/en/cursos/hugo-obsidian-resources/","section":"Cursos / Courses by Marc Alier","summary":" Build and display Mermaid.js diagrams in Hugo Export from Notion to Obsidian Github Repo ","title":"","type":"cursos"},{"content":"","externalUrl":null,"permalink":"/ludo/en/posts/10-prediccions-de-david-poblador/","section":"Posts","summary":"","title":"","type":"posts"},{"content":"","externalUrl":null,"permalink":"/ludo/en/posts/buscador-de-tfgs-de-ingenier%C3%ADa-inform%C3%A1tica/","section":"Posts","summary":"","title":"","type":"posts"},{"content":" Brief Bio # Marc Alier, an Associate Professor at the Politecnical University of Catalonia (UPC), specializes in computer science, information systems, e-learning, IT Ethics and more. With a computer science engineering degree and a Ph.D. in Sustainability, he has contributed significantly to the Moodle community and has authored over 160 academic publications. Alier currently serves as the academic director of the Engineering Education Ph.D. program and teaches multiple courses at UPC’s Barcelona School of Informatics. Short Bio # Hi there! My name is Marc Alier and I’m an Associate Professor at the Politecnical University of Catalonia (UPC) since 2002. My range of interests include computer science and information systems, e-learning, history and ethics of computing, as well as podcasting and building guitars.\nI hold an engineering degree in computer science and a Ph.D. in Sustainability from UPC. I have over 25 years of experience in research and software development related to e-learning ( in the 90’s I designed and developed a couple of forgotten Learning Management Systems (LMS) and educational content authoring tools). I ocalionally create online courses and MOOCs My Youtube Channel.\nI’ve been developing and contributing to the Moodle community since 2004, designing and implementing core functionalities such as the Wiki module, the Webservices layer, and the IMS LTI consumer. Since 2021 my research interest lies in the intersection of education and IA. Over the years, I’ve authored more than 160 academic publications in journals and conferences. For a list of publications and other research information:\nUPC’s Research Portfolio- Futur http://orcid.org/0000-0003-3922-1516 https://scholar.google.com/citations?user=POVraJQAAAAJ https://publons.com/researcher/3163603/marc-alier/ I am a member of the EduSteam Reseach Group.\nCurrently Teaching # At the Doctoral School of UPC I am academic director of the Ph.D. program in Education in Engineering Sciences and Technology.\nAt the Barcelona School of Informatics I currently teach.\nSocial and Environmental Issues Of Information Technologies Bachelors Degree Course on Histoy, Ethics and social aspects of IT. Development and Management of Information Systems Masters Degree course. Management # From 1997 to 2005 Founder, CEO and CTO of Ludoland Informàtica S.L. a small software development company specialized on back-end web development.\nFrom 2004 to 2015 Academic director of several Masters and Post-degree courses (Information management and Business Intelligence with SAP (2004-2012), Software development for PDA’s and mobile phones(2005-2006), Cloud Computing(2009,2012) and Community Management (2014-2015) at https://www.talent.upc.edu\nFrom 2014 to 2015 I was Director of the Institute of Sciences of Education at UPC.\nFrom 2019 to March 2023 deputy director of the Director of Educational Inovation ar the Institute of Sciences of Education at UPC in the management team of Ariadna Llorens.\nFrom Sept 2021 Academic Coordinator of the PHD Program in Science, Engineering and Technology Education\nOther Interests # I’m also a (really) prolific podcaster at\nmossegalapoma.cat, cabalgaelcometa.com zetatesters.com. creapodcast.com Contact Marc # marc.alier (at) upc.edu https://twitter.com/ludo\n","externalUrl":null,"permalink":"/ludo/es/about/","section":"About- Marc Alier- Asoc Prof at UPC, Luthier Apprentice And Podcaster","summary":"Brief Bio # Marc Alier, an Associate Professor at the Politecnical University of Catalonia (UPC), specializes in computer science, information systems, e-learning, IT Ethics and more. With a computer science engineering degree and a Ph.D. in Sustainability, he has contributed significantly to the Moodle community and has authored over 160 academic publications. Alier currently serves as the academic director of the Engineering Education Ph.D. program and teaches multiple courses at UPC’s Barcelona School of Informatics. ","title":"About- Marc Alier- Asoc Prof at UPC, Luthier Apprentice And Podcaster","type":"about"},{"content":" Table Of Contents # Future Shock Prompts and interactions with ChatGpt used in this video 2. LLM Basics 3. Training ChatGPT Prompts and interactions with ChatGpt used in this video 4 Learning howto better craft prompts Future Shock # Slides\nPrompts and interactions with ChatGpt used in this video # Future shock* Example of engineering problem with wolfram alpha https://www.wolframalpha.com 2. LLM Basics # Slides\n3. Training ChatGPT # Slides\nPrompts and interactions with ChatGpt used in this video # Training ChatGPT to write in our style 4 Learning howto better craft prompts # ChatGPT Understanding, Improving your prompting strategies Embeddings, Context uses and Self Referencing\n[TABLE]\n","externalUrl":null,"permalink":"/ludo/en/cursos/chatgpt-opportunity-and-challenge/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # Future Shock Prompts and interactions with ChatGpt used in this video 2. LLM Basics 3. Training ChatGPT Prompts and interactions with ChatGpt used in this video 4 Learning howto better craft prompts Future Shock # Slides\n","title":"Course: ChatGPT challenge and oportunity for teaching","type":"cursos"},{"content":" Table Of Contents # Introducció 6. Casos d’us de ChatGPT (I) 7. Guerres de Tonner 8. ChatGPT dins l’aula 9. Casos d’us de ChatGPT i II Video 10. El salt de GPT 3.5 a GPT 4 Com a contingut addicional us recomano el pòdcast que vam gravar amb Faraón Llorens la primera setmana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens\nIntroducció # Transparències Vídeo 1\n2. La Llei dels Rendiments Accelerats # Transparències Vídeo 2\n3. Fent Salsitxes amb IA # Transcripció Vídeo 3 Enllaços:\nEina IA de transcripció de veu a text, Whisper https://openai.com/research/whisper Open Broadcaster Studio https://obsproject.com Corrector ortogràfic i gramatical multilingüe https://languagetool.org NVidia Broadcast ##4. ChatGPT, un Model de Machine Learning Generatiu\nTransparències Vídeo 4\n##5. Usant ChatGPT Presa de contacte\nTransparències Vídeo 5\n6. Casos d’us de ChatGPT (I) # Transparències Vídeo 6\n7. Guerres de Tonner # En aquest video pubicat el Març de 2023 jo ja parlava d’eines de detecció de contingut generat en IA en el context educatiu. Ja llavors deia que no disposarem mai d’eines fiables. Sobretot pel risc i dilema etic que comporta usar eines que donen falsos positius. A Setembre de 2023 encara mantinc la meva posició. I sembla ser que la premsa ja ho ha descobert.\nTransparències Vídeo 7\n8. ChatGPT dins l’aula # Transparencies vídeo 8\n9. Casos d’us de ChatGPT i II # Transparencies video 9\nVideo 10. El salt de GPT 3.5 a GPT 4 # markdownCopy code\nCurs subjecte a Llicència Creative Commons Reconeixement-NoComercial-CompartirIgual 4.0 Internacional.\n","externalUrl":null,"permalink":"/ludo/cursos/chatgpt-oportunitat-i-repte/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # Introducció 6. Casos d’us de ChatGPT (I) 7. Guerres de Tonner 8. ChatGPT dins l’aula 9. Casos d’us de ChatGPT i II Video 10. El salt de GPT 3.5 a GPT 4 Com a contingut addicional us recomano el pòdcast que vam gravar amb Faraón Llorens la primera setmana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens\n","title":"Curs ChatGPT Oportunitat i Repte per a la docencia","type":"cursos"},{"content":" Table Of Contents # 1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia 2. Puntos sobre las IAS 4. Las guerras de Tonner 5. GPT Personal Bullshit Generator 6. Casos de uso de ChatGPT (I) 7. ChatGPT Instrumento de consulta Herramientas usadas para crear estos contenidos Como contenido adicional os recomiendo el podcast que grabamos con Faraón Llorens la primera semana de 2023. Cabalga El Cometa EP 31: Las alucinaciones de ChatGPT con Faraón LLorens Un poco largo, pero vale la pena.\n1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia # Transparencias Vídeo 1\n2. Puntos sobre las IAS # Transparencias Vídeo 2\n3. Entrenando a ChatGPT # Transcripción Vídeo 3\n4. Las guerras de Tonner # Transparencias Vídeo 4\n5. GPT Personal Bullshit Generator # Transparencias Vídeo 5\n6. Casos de uso de ChatGPT (I) # [Transparencias Vídeo 6](pages/open_courseware/es/6_chatgpt_es 1.pdf)\n7. ChatGPT Instrumento de consulta # Transparencias Vídeo 7\nHerramientas usadas para crear estos contenidos # Enlaces:\nHerramienta IA de transcripción de voz a texto, Whisper https://openai.com/research/whisper Open Broadcaster Studio https://obsproject.com Corrector ortográfico y gramatical multilingüe https://languagetool.org NVidia Broadcast [TABLE]\n","externalUrl":null,"permalink":"/ludo/es/cursos/chatgpt-oportunidad-y-reto/","section":"Cursos / Courses by Marc Alier","summary":"Table Of Contents # 1. El Shock del futuro. Curso ChatGPT Oportunidad y reto para la docencia 2. Puntos sobre las IAS ","title":"Curso ChatGPT: Oportunidad y Reto para la Docencia. Version en Castellano (Mayo-Junio 2023)","type":"cursos"},{"content":" Cursos en Català # ChatGPT: Oportunitat i Repte per a la Docència Cursos en Castellano # ChatGPT: Oportunidad y Reto para la Docencia Courses in English # ChatGPT: Opportunity and Challenge for Education Resources for Hugo + Obsidian Web Publishing ","externalUrl":null,"permalink":"/ludo/es/cursos/","section":"Cursos / Courses by Marc Alier","summary":"Cursos en Català # ChatGPT: Oportunitat i Repte per a la Docència Cursos en Castellano # ChatGPT: Oportunidad y Reto para la Docencia Courses in English # ChatGPT: Opportunity and Challenge for Education Resources for Hugo + Obsidian Web Publishing ","title":"Cursos / Courses by Marc Alier","type":"cursos"},{"content":" Models de Traducció i Conversió de Veu i Text # SeamlessM4T: Traducció Multilingüe: Model open source que tradueix text i parla entre diferents idiomes, suportant prop de 100 idiomes en text i 36 en parla. - Enllaç Speech Gen: Conversió Text a Veu: Eina de pagament que converteix text a veu amb alta qualitat. - Enllaç Whisper: Reconeixement de Veu: Model open source d’OpenAI per al reconeixement de veu amb algunes limitacions en converses bilíngües. - Enllaç Whisper-ctranslate2: Millora de Whisper: Millora del model Whisper, amb implementacions més ràpides per SoftCatalà. - Enllaç https://github.com/ggerganov/whisper.cpp versió high performance de Whisper.. oferint api com openai i tot https://github.com/ggerganov/whisper.cpp/pull/1380 Insanely Fast Whisper with Speaker Diarization (GitHub Repo) A somewhat opinionated CLI tool for transcribing audio files. It also now includes speaker segmentation and diarization (e.g., recognizing speaker 1 vs speaker 2). The claim is they can transcribe 2.5 hrs of audio in 100s, even on some of the largest models available. Text a veu # https://github.com/coqui-ai/TTS\nMillora d’audio # Resemble enhance # “Resemble Enhance” és una eina impulsada per la intel·ligència artificial que té com a objectiu millorar la qualitat general de la parla realitzant desenrenou i millora. Consisteix en dos mòduls: un desenrenoador, que separa la parla d’un àudio sorollós, i un millorador, que augmenta encara més la qualitat perceptiva de l’àudio restaurant distorsions d’àudio i ampliant l’amplada de banda de l’àudio. Els dos models estan entrenats amb dades de parla de 44.1kHz d’alta qualitat que garanteixen la millora de la teva parla amb alta qualitat. https://github.com/resemble-ai/resemble-enhance/tree/main\nProcessament d’Imatges # Segment-anything: Segmentació d’Objectes: Model open source de Meta per a la segmentació d’objectes en imatges. - Enllaç Generació d’Imatges: Eina que crea imatges a partir de prompts, com l’exemple de “Elven Lady Galadriel”. - Enllaç emu edit https://emu-edit.metademolab.com APPLE MGIE https://venturebeat.com/ai/apple-releases-mgie-a-revolutionary-ai-model-for-instruction-based-image-editing/?utm_source=tldrai https://github.com/apple/ml-mgie Anàlisi de Documents # Mapdeduce i Chatpdf: Anàlisi de PDF: Eines per analitzar contingut de fitxers PDF, possiblement usant l’API d’OpenAI (GPT-3.5-turbo). - Mapdeduce, Chatpdf Disseny de Logos # Logomaster.ai: Generació de Logos: Eina automàtica per a la generació de logos. - Enllaç Eines de Desenvolupament # Ollama.ai Entorn que permet l’execució de models open source en local. Projecte molt potent que ofereix interficie shell, API-REST, i projectes paralels com Ollama Web UI, o Instructor https://jxnl.github.io/instructor/blog/2024/02/08/ollama/ ChromaDB Ludwig: Aprenentatge Automàtic No Code: Eina per a la creació de pipelines d’aprenentatge automàtic sense necessitat de codificació. - Enllaç Haystack: Eina per al desenvolupament amb diversos models i pipelines. - Enllaç LLM Patterns: Avaluació de LLMs: Patrons per a l’avaluació de Models de Llenguatge de Màquina. - Enllaç PromptTools: Eines per a LLMs: Conjunt d’eines per a l’avaluació i experimentació amb Models de Llenguatge de Màquina. - Enllaç Streamlit https://streamlit.io Run llama RAGS https://github.com/run-llama/rags?utm_source=tldrnewsletter ingest and vectorize https://unstructured-io.github.io/unstructured/examples/chroma.html E-commerce # Marketsy.ai: Creació de Botigues en Línia: Eina per crear botigues en línia amb diverses plantilles i opcions de personalització. - Enllaç Eines de Disseny Gràfic # Eina de Microsoft per al disseny d’imatges, diapositives, retols a partir de prompts. - Enllaç Models de Visió # CLIP: Model d’OpenAI que combina text i imatge per a diverses tasques visuals. - Enllaç LLaVa: Model que pot respondre preguntes sobre imatges, accessible en maquinari de consumidor. - Enllaç **REKA Multimodal https://reka.ai/reka-flash-an-efficient-and-capable-multimodal-language-model/?utm_source=tldrai Generació de Música a partir de Prompt # Stable Audio: Sistema per generar música i efectes sonors a partir de descripcions de text. - Enllaç ChatGPT Plugins # Webpilot: Plugin per a consultes a pàgines web. Wolfram: Plugin per accedir a dades científiques i realitzar càlculs matemàtics. Smart Slides: Plugin que assisteix en la creació de diapositives. Sumarització # https://scisummary.com https://chatpdf.com\nDatasets # SCB-ST-Dataset4: Dataset per l’estudi del comportament espai-temporal en escenaris d’aula. - Enllaç Cada descripció proporciona una idea clara del que ofereix cada eina o tecnologia, acompanyada dels enllaços per a més detalls.\nLLMs # NexusRaven v2 # https://nexusflow.ai/blogs/ravenv2 NexusRaven-V2, un model de llenguatge de 13B, ha superat GPT-4 en la capacitat de cridar funcions sense exemples previs. Això permet convertir instruccions en llenguatge natural en codi executable. Destaca per la seva alta taxa d’èxit en casos d’ús humans, és de codi obert i fàcil d’integrar. Inclou un banc de proves de crida de funcions i un tauler de líders amb exemples humans, cobrint una àmplia gamma de casos i dificultats. És notable per la seva robustesa i precisió, superant els APIs de models de llenguatge propietaris.\nPer a més detalls, pots visitar la pàgina web original aquí.\narticles essencials # Attacks on machine learning models # Prompt Engineering # https://github.com/dair-ai/Prompt-Engineering-Guide\nInteresting engines # scholar.ai perplexity.ai consensus.ai\n","externalUrl":null,"permalink":"/ludo/es/eines_ia/","section":"Directori d'eines IA útils","summary":"Models de Traducció i Conversió de Veu i Text # SeamlessM4T: Traducció Multilingüe: Model open source que tradueix text i parla entre diferents idiomes, suportant prop de 100 idiomes en text i 36 en parla. - Enllaç Speech Gen: Conversió Text a Veu: Eina de pagament que converteix text a veu amb alta qualitat. - Enllaç Whisper: Reconeixement de Veu: Model open source d’OpenAI per al reconeixement de veu amb algunes limitacions en converses bilíngües. - Enllaç Whisper-ctranslate2: Millora de Whisper: Millora del model Whisper, amb implementacions més ràpides per SoftCatalà. - Enllaç https://github.com/ggerganov/whisper.cpp versió high performance de Whisper.. oferint api com openai i tot https://github.com/ggerganov/whisper.cpp/pull/1380 Insanely Fast Whisper with Speaker Diarization (GitHub Repo) A somewhat opinionated CLI tool for transcribing audio files. It also now includes speaker segmentation and diarization (e.g., recognizing speaker 1 vs speaker 2). The claim is they can transcribe 2.5 hrs of audio in 100s, even on some of the largest models available. Text a veu # https://github.com/coqui-ai/TTS\n","title":"Directori d'eines IA útils","type":"eines_ia"},{"content":"","externalUrl":null,"permalink":"/ludo/es/series/","section":"Series","summary":"","title":"Series","type":"series"}]