Ir al contenido

ChatGPT en la práctica: estrategias para interacciones óptimas

·16 mins
Marc Alier
Autor
Marc Alier
Página personal y Cajón Desastre.

Table Of Contents
#

Los modelos de lenguaje grandes (LLM) como ChatGPT son una familia nueva de tecnologías con mucho potencial, pero también con sus propios retos. Cada vez usamos más estas herramientas de IA para todo: desde preguntas sencillas hasta generar código complejo. Así que conviene preguntarse: ¿realmente sabemos cómo sacarles el máximo partido?

En esta entrada repasaremos algunas buenas prácticas clave para usar LLM. Veremos la diferencia entre contenido generado por IA y la información que ofrecen bases de datos o buscadores. También hablaremos del problema de las “alucinaciones”, cuando el modelo te da información incorrecta o engañosa. Y comentaremos por qué el idioma que usas para preguntar influye en la calidad de las respuestas.

Tanto si sientes curiosidad como si planeas integrar LLM en tus proyectos, esta guía pretende ayudarte a usar estas herramientas de forma más eficaz.

De dónde saca ChatGTP sus respuestas
#

Contenido generado por IA
#

Cuando preguntas algo a un modelo de lenguaje grande como ChatGPT, genera una respuesta basándose en un enorme conjunto de datos con el que fue entrenado. Ese conjunto incluye una gran variedad de fuentes, como sitios web, libros y artículos. Pero es importante saber que estos modelos no pueden acceder a información en tiempo real o actualizada. Lo que obtienes se basa en lo que el modelo ha aprendido hasta un momento dado.

Además, conviene señalar que la información, aunque a menudo es correcta, se genera de forma estocástica o aleatoria. Esto significa que la posibilidad de fallo o error siempre está en la ecuación. Es como una salsa secreta que a veces da sabor y otras estropea el plato.

Contenido de buscadores o bases de datos
#

En contraste con el contenido generado por IA, la información que ofrecen los buscadores, las bases de datos o sistemas especializados como Wolfram Alpha procede de fuentes factuales y, a menudo, en tiempo real. Estas plataformas suelen proporcionar información revisada por pares o verificada. A diferencia de los modelos de lenguaje grandes, pueden darte los datos más recientes disponibles, ya sea la última actualidad, investigación científica o estadísticas.

Implicaciones

Entender la diferencia entre estos dos tipos de contenido es crucial. Si buscas información actualizada o altamente factual, confiar solo en un modelo de lenguaje grande quizá no sea la mejor opción. Aunque estos modelos son muy versátiles y pueden dar respuestas rápidas, no sustituyen la profundidad y fiabilidad de la información que obtendrías de una base de datos o un buscador especializado. Sin embargo, conviene señalar que acceder a estas fuentes especializadas suele requerir habilidades técnicas, como entender interfaces de usuario específicas o lenguajes de programación. En cambio, los modelos de lenguaje grandes ofrecen la comodidad de obtener información mediante consultas en lenguaje natural. Saber cuándo usar cada uno te ayudará a conseguir información más precisa y fiable, sin perder de vista la facilidad de acceso.

Cómo lidiar con las alucinaciones
#

¿Qué son las alucinaciones?
#

En el contexto de los modelos de lenguaje grandes (LLM) como ChatGPT, las alucinaciones se refieren a la generación de información inexacta, exagerada o directamente falsa. Por ejemplo, se ha visto a ChatGPT inventar respuestas verosímiles respaldadas con citas falsas, lo que ha llevado a usuarios a comprobar si habían tropezado por accidente con un fenómeno real. En algunos casos incluso ha fabricado cifras financieras en artículos de prensa o ha generado precedentes legales inexistentes en escritos jurídicos.

Las alucinaciones suelen producirse por limitaciones en los datos de entrenamiento o en la comprensión del contexto por parte del modelo. El modelo no tiene capacidad para verificar la información que genera; simplemente produce respuestas basándose en patrones de los datos con los que fue entrenado. Esta naturaleza estocástica de los LLM implica que la aleatoriedad y la posibilidad de un fallo absoluto siempre están presentes.

Estrategias para mitigar las alucinaciones
#

  1. Ser consciente de la posible invención: El primer paso es saber que los LLM pueden generar contenido inventado. Esta conciencia te hará más crítico con las respuestas que recibes.
  2. Valora tu propia pericia: Tu capacidad para juzgar la calidad de la información está ligada a tu nivel de conocimiento sobre el tema. Si dominas un área, estás en mejor posición para detectar inexactitudes.
  3. Evaluación crítica y estrategia de validación: Evalúa siempre la información de forma crítica. Ten una estrategia de validación que incluya contrastar con fuentes fiables o consultar a expertos. Si algo parece demasiado complejo o demasiado bonito para ser verdad, probablemente requiere más verificación.
  4. Contrasta con fuentes fiables: En caso de duda, contrasta la información con plataformas de confianza como buscadores o Wikipedia. Para el código generado, ejecútalo y pruébalo siempre para asegurar que se comporta como se espera.
  5. Revisión humana: En ámbitos de alto riesgo como los escritos legales, la revisión humana es cada vez más necesaria. Algunas jurisdicciones incluso la exigen para garantizar la fiabilidad del contenido generado por IA.

Verificación ajustada al riesgo

Los pasos para verificar información deben ser proporcionales a los riesgos e implicaciones de usarla. Para aplicaciones críticas, como el código generado, son esenciales las pruebas exhaustivas y la revisión por expertos. Para preguntas de cultura general, puede bastar con una rápida comprobación en una fuente fiable.

Si tienes presentes las consecuencias, podrás ajustar tu proceso de verificación y tomar las precauciones adecuadas. Este enfoque equilibrado te permite aprovechar lo que ofrecen los modelos de lenguaje grandes y, a la vez, protegerte frente a sus limitaciones y riesgos.

Estrategias prácticas y casos de uso de chatbots como ChatGTP
#

Consideraciones de idioma: para mejores resultados, usa inglés
#

Modelos de lenguaje grandes como ChatGPT pueden entender y generar texto en varios idiomas. Sin embargo, para obtener mejores resultados, usa inglés. Una parte muy significativa de sus datos de entrenamiento está en inglés, lo que hace que sus respuestas en este idioma sean más matizadas y precisas. Esto es especialmente importante si no eres nativo de inglés.

Si necesitas contenido en otro idioma, una estrategia útil es pedir primero la respuesta en inglés para obtener la versión más precisa. Una vez la tengas, puedes pedir a ChatGPT que la traduzca al idioma que desees. Este proceso en dos pasos suele dar resultados más fiables que pedir directamente en un idioma distinto del inglés.

Poniendo el contexto en contexto.
#

Cuando chateas con ChatGPT, el contexto incluye toda la conversación previa que has tenido: tanto tus prompts como las respuestas del chatbot. El contexto es la información que ayuda al modelo a entender lo que estás pidiendo. En modelos de lenguaje grandes como ChatGPT, este contexto no se limita a tu consulta actual. También abarca todo el historial de conversación, la forma específica en que formulas las preguntas e incluso las respuestas previas del propio modelo. Como el modelo atiende a este contexto amplio junto con tu prompt actual y sus datos de entrenamiento, puede ofrecer respuestas más matizadas y precisas. Esto significa que no solo entiende tu pregunta inmediata, sino que también considera la conversación más amplia para generar una respuesta más consciente del contexto.

Ejemplo 1: Receta y lista de la compra

  • Tu prompt: “¿Me das una receta de galletas con pepitas de chocolate?”
  • Respuesta de ChatGPT: “Claro, aquí tienes una receta sencilla de galletas con pepitas de chocolate…”
  • Tu prompt de seguimiento: “Genial, ¿puedes crear ahora una lista de la compra basada en esa receta?”
  • Respuesta de seguimiento de ChatGPT: “Por supuesto, basándome en la receta de galletas con pepitas de chocolate, necesitarás…”

En este ejemplo, ChatGPT usa su propia receta generada como contexto para crear una lista de la compra relevante. Muestra cómo la salida previa del modelo informa su siguiente acción, haciendo la interacción más fluida y personalizada.

Ejemplo 2: Evaluación educativa

  • Tu prompt: Vamos a hacer la evaluación de los ejercicios del alumnado. El problema a resolver es: x + 4 = 7 La respuesta correcta es x = 7 - 4 x = 3 Ahora voy a producir varias respuestas de estudiantes. Compara la solución del estudiante con la solución propuesta y después indica: A) si la respuesta es correcta o no, B) si no es correcta, explica dónde ha fallado el estudiante y cómo puede corregirlo. No des la respuesta correcta, solo orienta al estudiante. Ahora di solo OK.
  • Respuesta de ChatGPT: “OK”

En este ejemplo, has preparado un contexto para que ChatGPT evalúe respuestas de estudiantes respecto a una solución correcta dada. El modelo usará ese contexto para dar retroalimentación precisa, ayudando a que entiendan dónde han fallado sin revelarles la respuesta. Es una aplicación práctica de cómo el manejo del contexto puede llevar a interacciones educativas más efectivas.

  • Tu prompt de seguimiento 1: La respuesta del Estudiante 1 es: x = 7 + 4 x = 11
  • Respuesta de seguimiento 1 de ChatGPT: A) La respuesta es incorrecta. B) El estudiante ha sumado 4 en lugar de restarlo. Para corregirlo, debería empezar por aislar x_x_ en un lado de la ecuación realizando la operación inversa en ambos lados.
  • Tu prompt de seguimiento 2: La respuesta del Estudiante 2 es: x = 7 / 4 x = 1.75
  • Respuesta de seguimiento 2 de ChatGPT: A) La respuesta es incorrecta. B) El estudiante ha dividido entre 4 en lugar de restarlo. Debería centrarse en aislar x_x_ usando la operación inversa correcta.
  • Tu prompt de seguimiento 3: La respuesta del Estudiante 3 es: x = 7 - 4 x = 3
  • Respuesta de seguimiento 3 de ChatGPT: A) La respuesta es correcta. B) El estudiante ha aislado correctamente x_x_ restando 4 en ambos lados de la ecuación.

En este ejemplo ampliado, ChatGPT utiliza el contexto proporcionado —la solución correcta de la ecuación x+4=7_x_+4=7— para evaluar las respuestas del alumnado. Después ofrece retroalimentación específica según cómo cada respuesta se compara con la solución correcta. Esto demuestra la capacidad del modelo para usar el contexto y lograr interacciones más matizadas y útiles.

Perder el contexto es perder el sentido

Entender el contexto en tus chats con modelos de lenguaje grandes como ChatGPT es crucial. Hace que tus intercambios sean más precisos y matizados. El contexto ayuda al modelo a entender mejor el tema, el tono y tus necesidades específicas. Es clave para evitar errores, especialmente en entornos profesionales o educativos. También permite interacciones más complejas, como discusiones detalladas o usar el modelo para enseñar, como hemos visto en los ejemplos.

Fuente: Fishkin, Rand. “Analizamos millones de sesiones de usuarios de ChatGPT: las visitas han caído un 29% desde mayo; la asistencia a la programación es el 30% del uso.” SparkToro. Consultado el 3 de septiembre de 2023.

Curiosamente, la investigación muestra (ver figura) que casi la mitad de las sesiones de ChatGPT constan de solo una (34,5%) o dos (14,5%) interacciones. Esto sugiere que un gran número de usuarios no está aprovechando plenamente las capacidades con contexto de estos modelos. Solo alrededor del 35% de las sesiones tienen cinco o más prompts. Al no mantener conversaciones más largas, se pierden ventajas del contexto, como respuestas más precisas y matizadas, especialmente en consultas o debates complejos.

Al interactuar con ChatGPT, el modo en que formateas tu texto no es solo una cuestión de estética o legibilidad; también afecta a la semántica, al significado de tus palabras. Un formato adecuado actúa como guía para el modelo, ayudándole a comprender mejor la estructura y la intención de tu consulta. A su vez, le permite generar respuestas más precisas, organizadas y ajustadas a lo que realmente pides.

Formato de texto: un truco útil en conversaciones con LLM
#

Al interactuar con ChatGPT, la forma de formatear tu texto no es solo una cuestión de estética o legibilidad; también impacta en la semántica, el significado detrás de las palabras. Un formateo adecuado actúa como guía para el modelo, ayudándole a entender mejor la estructura y la intención de tu consulta. A su vez, permite que genere respuestas más precisas, organizadas y ajustadas a lo que realmente estás pidiendo.

Ejemplo 3: Usar viñetas para múltiples preguntas

  • Tu prompt:

      "Tell me about the benefits of:
    
      - Solar energy
      - Wind energy"
    
  • Respuesta de ChatGPT:

      "Certainly!
    
      - Solar energy is renewable, reduces electricity bills, and has low operating costs.
      - Wind energy is also renewable, cost-effective, and can be built on existing farms."
    

En este ejemplo, el uso de viñetas en el prompt ayuda a separar claramente varias preguntas, facilitando que ChatGPT aborde cada una por separado.

Usa formatos de texto como un ninja
#

Más allá de las viñetas y las listas numeradas, puedes aprovechar formatos de texto más especializados, comunes en informática, para mejorar tus interacciones con ChatGPT. Formatos como CSV (Comma-Separated Values), JSON (JavaScript Object Notation) y XML (eXtensible Markup Language) pueden incluirse en tus prompts. Son especialmente útiles cuando tratas con consultas basadas en datos o cuando necesitas que el modelo genere respuestas que puedan integrarse fácilmente en otro software o bases de datos.

Por ejemplo, si tienes datos en un archivo de Excel que te gustaría analizar, puedes exportarlos como CSV y luego usar esos datos en formato CSV en tu prompt a ChatGPT. Así el modelo entiende mejor tu consulta y mejora la precisión de sus respuestas. Incluso puedes preguntarle a ChatGTP: “How do I export data in EXCEL to a CSV File”.

Ejemplo 4:

Tu prompt:

"Sort the following table by Age in ascending order. The table is in CSV format:

Name,Age,Occupation Alice,34,Engineer Bob,29,Doctor Charlie,45,Teacher David,39,Lawyer Ella,28,Artist
""

Respuesta de ChatGPT:

´´´

Name,Age,Occupation Ella,28,Artist Bob,29,Doctor Alice,34,Engineer David,39,Lawyer Charlie,45,Teacher

´´´

Una nota sobre Markdown

ChatGPT entiende el formato de texto Markdown, lo que le permite mostrar fragmentos de código, tablas, cabeceras, enlaces e incluso imágenes incrustadas en su salida. Sin embargo, si usas un editor compatible con Markdown para tus documentos —como Obsidian o Notion— debes tener cuidado con ciertos códigos Markdown que podrían estropear tu presentación:

Comillas triples invertidas ("`"): se usan para bloques de código en Markdown. Si no tienes cuidado, pueden estropear el formato en tu editor Markdown. Tres guiones ("-"): suelen usarse para líneas horizontales, que podrían dividir tu texto sin querer. Almohadillas ("#", “##”, “###”): se usan para cabeceras. Úsalas intencionadamente para estructurar tu documento. Asteriscos ("*"): se usan para listas con viñetas. Asegúrate de que estén bien alineados para mantener la estructura de la lista. Tablas: las tablas en Markdown pueden ser útiles pero también delicadas. Asegúrate de alinear bien las columnas para que sean legibles.

Usar Markdown en la salida de ChatGPT

Volvamos al último ejemplo: podemos pedir a chatgpt que devuelva los resultados en una tabla en markdown:

Tu prompt:

Sort the following table by Age in ascending order. Format the result **in Markdown**. The table is in CSV format:

Name,Age,Occupation
Alice,34,Engineer
Bob,29,Doctor
Charlie,45,Teacher
David,39,Lawyer
Ella,28,Artist

Respuesta de ChatGPT:

[TABLA]

Así obtienes los datos ordenados en una tabla Markdown, que puedes incluir directamente en tus documentos Markdown. En la página de chatGPT verás la tabla anterior, pero si la copias y pegas en un editor de texto plano obtendrás algo como:

|Name|Age|Occupation|
|---|---|---|
|Ella|28|Artist|
|Bob|29|Doctor|
|Alice|34|Engineer|
|David|39|Lawyer|
|Charlie|45|Teacher|

Que es una representación en Markdown de una tabla.

Otros usos de los formatos de texto y los chatbots.
#

Ejemplo: hacer que ChatGPT trabaje con grafos

Tu prompt:

“¿Existe algún lenguaje basado en texto que pueda usarse para representar grafos?”

Respuesta de ChatGPT:

“Sí, hay varios lenguajes y formatos basados en texto que pueden utilizarse para representar grafos. Estos lenguajes suelen emplearse junto con software de visualización o análisis de grafos. Algunos de ellos son:

  • Lenguaje DOT: el lenguaje DOT es un lenguaje de descripción de grafos en texto plano muy usado como parte del proyecto Graphviz. Es sencillo y permite describir grafos, digrafos y sus atributos.

Ejemplo:

dotCopy code digraph G { A -> B; B -> C; C -> A; }

(… la respuesta continúa con varios formatos: YAML, GML, JSON GRAPH… )

Tu siguiente solicitud:

“Genera un archivo .dot que represente un grafo de las 10 ciudades más pobladas de Europa, sus conexiones de tren de alta velocidad y los kilómetros de cada conexión directa.”

Respuesta de ChatGPT:

“Aquí tienes un archivo .dot de ejemplo que representa un grafo de las 10 ciudades más pobladas de Europa, junto con sus conexiones de alta velocidad y las distancias entre ellas.”

digraph EuropeCities { "London" -> "Paris" [label="450 km"]; "Paris" -> "Madrid" [label="1,050 km"]; "Madrid" -> "Rome" [label="1,400 km"]; "Rome" -> "Berlin" [label="1,100 km"]; "Berlin" -> "Moscow" [label="1,800 km"]; "Moscow" -> "Saint Petersburg" [label="700 km"]; "Saint Petersburg" -> "Kiev" [label="1,100 km"]; "Kiev" -> "Istanbul" [label="1,300 km"]; "Istanbul" -> "Bucharest" [label="600 km"]; "Bucharest" -> "Berlin" [label="1,400 km"]; "London" -> "Berlin" [label="1,100 km"]; "Paris" -> "Berlin" [label="1,050 km"]; "Paris" -> "Rome" [label="1,100 km"]; "Madrid" -> "Berlin" [label="1,900 km"]; "Berlin" -> "Kiev" [label="1,300 km"]; "Moscow" -> "Kiev" [label="870 km"]; "Kiev" -> "Bucharest" [label="800 km"]; "Istanbul" -> "Moscow" [label="2,200 km"]; "Rome" -> "Madrid" [label="1,400 km"]; "Rome" -> "Paris" [label="1,100 km"]; }

Ahora puedes pedir cosas como que ChatGPT encuentre el camino óptimo de Madrid a San Petersburgo y que destaque ese camino en el código .dot. Conseguí que GPT-4 creara el código para este grafo con dos prompts adicionales. Curiosamente, GPT-4 usó el algoritmo de Dijstra para resolver el problema. Te dejo la imagen resultante y lo dejo como reto.

Si necesitas saber cómo generar la imagen a partir del código .dot… pregúntale a ChatGPT.

Últimos prompts
#

Según la investigación, más del 23% del uso de ChatGPT está relacionado con educación. Tanto docentes como estudiantes están usando ChatGPT, y los nuevos chatbots avanzados que están saliendo (como Bard de Google, Open Assistant, Llama 2 de Meta, etc.) están encontrando buenos casos de uso para ayudarles en sus tareas diarias de enseñanza y aprendizaje. Un buen entendimiento de estas herramientas, sus capacidades y limitaciones es crucial para un uso responsable y ético, especialmente en entornos educativos.

Además de todo lo tratado en este artículo, hay unos últimos puntos que merece la pena considerar:

  • Herramientas como ChatGPT han llegado para quedarse; no son una moda pasajera. Representan una nueva era en la tecnología de internet y software, y su impacto será monumental. Si comparamos con la web, ahora mismo estamos en el equivalente de finales de los 90, cacharreando con páginas estáticas. La tecnología va a mejorar de forma exponencial en los próximos cinco años y su impacto en nuestras vidas será tan transformador como la suma de PC, internet y smartphones.
  • El uso sofisticado de ChatGPT y otros modelos de lenguaje grandes (LLM) es cada vez más difícil de detectar. La investigación actual sugiere que es improbable que desarrollemos a corto plazo un detector fiable de “contenido generado por IA”. Quien diga ofrecer tales herramientas, básicamente, vende aceite de serpiente.
  • Desde junio de 2023, ChatGPT ha incorporado una función útil: la posibilidad de compartir un enlace permanente a una conversación. Es muy valiosa porque nos permite mostrar el trabajo realizado con el chatbot para producir un contenido concreto. Por ejemplo, este mismo documento fue desarrollado usando ChatGPT en una conversación que duró varias horas. Proporciono el enlace como ejemplo de lo eficaz que puede ser un chatbot para producir trabajo de calidad. O al menos, tan buena calidad como la de este artículo.

Gracias por llegar hasta el final.

Relacionados

10 prediccions sobre IA i Internet que comparteixo

·2 mins
L’article “The Tech Revolution: 10 Predictions about AI, Internet, and Possibly Our World in 3 Years” de David Poblador i Garcia presenta una sèrie de prediccions sobre com l’IA i internet podrien transformar el nostre món en els propers tres anys. Aquí teniu un resum de les seves prediccions, que val a dir comparteixo: