Contenidos#
¿Qué es ChatGPT?#
ChatGTP es una aplicación web basada en GPT-3, concretamente en el modelo GPT-3.5 “text-davinci-003” desarrollado por OpenAi. El modelo ChatGPT está optimizado para funcionar en forma de conversación, respondiendo a las entradas que los usuarios le dan en forma de “prompt” de texto. ChatGPT es un tipo de IA generativa basada en un modelo de aprendizaje automático. Podemos considerar que ChatGPT es una IA débil (véase Tipos de inteligencia artificial].
GPT-3 es un modelo generativo de lenguaje natural inmenso. Ha sido entrenado con 175 mil millones de parámetros en múltiples idiomas, entre ellos el catalán. Si el proceso de entrenamiento se hubiera hecho con un solo ordenador habrían hecho falta 355 años. El coste de entrenarlo en una plataforma en la nube de bajo coste es de 4.600.000 dólares. https://lambdalabs.com/blog/demystifying-gpt-3

ChatGPT es un Software como Servicio (SaaS)#
ChatGPT se proporciona como servicio; es un “Software as a Service”, no un programa que podamos instalar en un servidor o en un servicio de computación en la nube. Por tanto, los propietarios del servicio (OpenAi, entidad participada por Microsoft en un 49% desde enero de 2023) deciden las condiciones de prestación: quién tiene acceso, para qué fines y qué calidad de servicio y disponibilidad ofrece.
Términos y condiciones#
Los términos de servicio de ChatGPT https://openai.com/terms/ indican que
Estás de acuerdo y nos das instrucciones para utilizar el Contenido para desarrollar y mejorar los servicios. Puedes leer más aquí sobre cómo se puede utilizar el Contenido para mejorar el rendimiento del modelo. Entendemos que en algunos casos puede que no quieras que tu Contenido se utilice para mejorar los servicios. Puedes optar por que tu Contenido no se use para mejorar contactando con suport@openai.com con tu ID de organización. Ten en cuenta que en algunos casos esto puede limitar la capacidad de nuestros servicios para abordar mejor tu caso de uso específico.
O sea que los datos que introducimos en ChatGPT en forma de prompt serán recogidos, analizados y empleados para la investigación, la mejora del servicio y, sin duda, para entrenar futuras versiones de GPT-N.
OpenAi publica de forma clara cuáles son sus términos y condiciones, no abusa del lenguaje legal ni usa letra pequeña. Os recomiendo la lectura de los términos de servicio https://openai.com/terms/ y la política de privacidad https://openai.com/privacy/
Derechos de autoría y responsabilidad sobre las salidas de ChatGPT#
Un aspecto muy importante del uso de herramientas de IA generativa como ChatGPT, DALL-E, Stable Diffusion, Whisper o VALL-E, es el acuerdo establecido implícita o explícitamente sobre los derechos de autoría de lo que se genera (texto, imagen, audio o vídeo). Esto determina el copyright y los derechos de uso que se derivan para las partes implicadas.
Los términos genéricos de OpenAi para sus herramientas definen dos conceptos importantes: Entrada y salida. La Entrada (Input) es el prompt generado por los usuarios, mientras que la Salida (Output) es el contenido generado por el modelo de aprendizaje automático. La entrada y la salida conforman el contenido.
Veamos lo que dicen los términos traducidos por el propio ChatGPT.
_(a) Tu contenido. Puedes proporcionar datos de entrada a los servicios (“Entrada”) y recibir los datos de salida generados y devueltos por el servicio basados en la Entrada (“Salida”). La Entrada y la Salida son colectivamente el “Contenido”. Entre las partes y en la medida permitida por la ley aplicable, tú eres propietario de toda la Entrada y, sujeto a tu cumplimiento de estos Términos, OpenAI te cede todo su derecho, título e interés sobre la Salida. OpenAI puede utilizar el Contenido según sea necesario para proporcionar y mantener los Servicios, cumplir con la ley aplicable y hacer cumplir nuestras políticas. Eres responsable del Contenido, incluyendo asegurar que no viola ninguna ley aplicable ni estos Términos.
O sea, que el autor de un prompt] tiene los derechos sobre las salidas generadas por una IA de OpenAi siempre que tenga derechos sobre las entradas que han generado esos contenidos. En caso de no tener los derechos estaría contraviniendo los términos de servicio de OpenAi y eso conllevaría que yo no soy quien para decir nada al respecto y hay que consultar abogados y servicios legales.
OpenAi tiene cosas que decir sobre el contenido, su naturaleza y la posibilidad de que ciertas salidas se repitan.
(b) Similitud del contenido. Debido a la naturaleza del aprendizaje automático, la Salida puede no ser única entre los usuarios y los servicios pueden generar la misma o similar salida para OpenAI o un tercero. Por ejemplo, puedes proporcionar entrada a un modelo como “¿De qué color es el cielo?” y recibir una salida como “El cielo es azul.” Otros usuarios también pueden hacer preguntas similares y recibir la misma respuesta. Las respuestas que son solicitadas por y generadas por otros usuarios no se consideran tu Contenido.
O sea, la originalidad de la salida depende de la originalidad de la entrada. Los abogados se lo pasarán en grande en los próximos años. O quizá un hermano de ChatGPT especializado en asesoría legal… pero divago.
Coste y acceso#
En enero de 2023 y desde diciembre de 2022 ChatGPT está disponible gratuitamente en la URL https://chat.openai.com
Los modelos anteriores de GPT-3 estaban disponibles para hacer pruebas a través de una interfaz más compleja y por API (Aplication Programming Interface). Para acceder, tras un periodo de prueba había que pagar por su uso comprando paquetes de “tokens”. No está claro cuánto tiempo estará ChatGPT disponible para su uso gratuito.
Ya hay una lista de espera abierta para acceder a la modalidad “pro” de ChatGPT. Se especula que el precio será de 42$ mensuales, aunque se mantiene la modalidad gratuita.
El acceso para programadores de aplicaciones vía API (Aplication Programming Interface) a ChatGTP y en breve se empezará a gestionar a través de los servicios cloud de Microsoft: Azure. https://indianexpress.com/article/technology/tech-news-technology/openais-chatgpt-api-microsoft-azure-api-businesses-8386106/ A consecuencia de ello con toda seguridad empezaremos a encontrar herramientas especializadas que harán uso de diversos modelos de GPT-3.
Un ejemplo es el modelo “códex”, una variante de GPT-3 entrenada con el código fuente disponible en Github (el repositorio de proyectos de software libre más grande de la red, adquirido por Microsoft hace un par de años), donde desde hace unos meses se ofrece el sistema Copilot, un asistente a la programación capaz de generar código, traducir programas entre lenguajes de programación, optimizar código y comentar programas, entre otras aplicaciones.
¿Cuál es la finalidad de ChatGPT y por qué es gratis?#
El objetivo de ChatGPT es facilitar el uso de este modelo por parte de un gran número de personas (del orden de cientos de millones), obteniendo datos para los investigadores de OpenAi. Tal como apunta el CEO de OpenAi en el pódcast Moonshots.
- Moonshots. Peter Diamandis. “The Rise of OpenAi with Sam Altman” https://www.diamandis.com/podcast/sam-altman
ChatGPT no es código abierto#
GPT-3 no es código abierto, otros modelos de aprendizaje automático lo son pero GPT-3 y DALL-E no. Al respecto, ChatGPT dice:
_GPT-3 es un modelo de procesamiento de lenguaje desarrollado por OpenAI. El modelo y los datos que se utilizan para entrenarlo son propiedad de OpenAI, y por eso no son de código abierto. OpenAI ha decidido no hacerlo abierto porque considera que es una tecnología valiosa y considera que es importante protegerla para poder continuar financiando su desarrollo y mejora.
Además, hay preocupaciones sobre los posibles riesgos asociados con el uso no intencionado o malicioso de la tecnología de GPT-3, como la generación automatizada de noticias falsas o la automatización de la ingeniería social. OpenAI ha adoptado una estrategia de licencia restrictiva para evitar estas preocupaciones y asegurar que GPT-3 se utilice de manera responsable.
Aspectos éticos#
Los resultados de los modelos generativos basados en transformador pueden ofrecer resultados tan convincentes como para pasar el test de Turing. En junio de 2022 un ingeniero de Google, quien fue despedido, declaró que estaba convencido de que el modelo Lambda era autoconsciente y que, por tanto, tenía derechos análogos a los derechos humanos. https://www.livescience.com/google-sentient-ai-lamda-lemoine
En enero de 2023 en las redes sociales han circulado rumores sobre el número de parámetros de GPT-4. No obstante, el CEO de OpenAi Sam Altman lo ha desmentido y ha hecho hincapié en que GPT-4 no será una Tipos de inteligencia artificial.
ChatGPT es un proyecto en continua evolución. A menudo hay actualizaciones del servicio y muchos investigadores han reportado cambios en su comportamiento. Al poco rato de usar ChatGPT podemos observar que se ha hecho un esfuerzo por hacer sus respuestas políticamente correctas. Algunos de los ejemplos son:
- La insistencia en el hecho de que es un software, que no tiene agencia y que no es una inteligencia artificial
Reflexiones éticas de los creadores de GPT-3#
Los creadores de GPT-3 presentaron el proyecto en el artículo “Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.” En el artículo dedican una sección bien amplia a discutir los posibles malos usos de sistemas generadores de texto como GPT-3.
Resumido por GPT-3
_Los usos maliciosos de los modelos de lenguaje pueden ser algo difíciles de anticipar porque a menudo implican la reutilización de los modelos de lenguaje en un entorno muy diferente o para un propósito distinto del que los investigadores tuvieron en cuenta.
Para ayudar con esto, podemos pensar en términos de marcos de valoración de riesgos de seguridad tradicionales, que esbozan pasos clave como identificar amenazas e impactos potenciales, evaluar la probabilidad y determinar el riesgo como una combinación de probabilidad e impacto.
Discutimos tres factores: las aplicaciones de uso indebido potenciales, los actores de riesgo y las estructuras de incentivo externas. El potencial de uso indebido de los modelos de lenguaje aumenta a medida que mejora la calidad de la síntesis de texto. La capacidad de GPT-3 para generar varios párrafos de contenido sintético que a las personas les resulta difícil distinguir del texto escrito por humanos es un punto preocupante en este sentido._
- Las aplicaciones de uso indebido potenciales de modelos de lenguaje incluyen la desinformación, el spam, el phishing, el abuso de procesos legales y gubernamentales, la redacción fraudulenta de ensayos académicos y la precisión de la ingeniería social.
- El potencial de uso indebido aumenta con la mejora de la calidad de la síntesis de texto.
Los autores identifican los diferentes tipos potenciales de “actores de amenaza” (threat actors) en función del nivel de habilidad y recursos de estos. Estos van desde actores de baja o moderada habilidad y recursos hasta grupos altamente habilidosos y bien equipados como los patrocinados por estados que llaman ATP (Advadced Persistent Therats).
- Los actores de baja y media habilidad actualmente no representan una amenaza inmediata, pero las mejoras en la fiabilidad podrían cambiar esto.
- Los actores APT no discuten sus operaciones en público, pero no se han detectado diferencias en las actuaciones de estos actores desde la salida de GPT-2.
- El comportamiento de los actores de amenaza se ve influenciado por las estructuras de incentivo externas como la escalabilidad, la reducción de coste de despliegue y la facilidad de uso pueden influir en la adopción de nuevas técnicas, tácticas y procedimientos (TTPs) adoptados por los actores de amenaza.
- Se espera que los investigadores de IA desarrollen modelos de lenguaje cada vez más fiables y dirigibles, lo que representaría desafíos para la comunidad científica y la necesidad de trabajar en soluciones de seguridad.
Los creadores de GPT-3 continúan su análisis con una discusión sobre los sesgos que puede tener el sistema y cómo paliarlos. Y concluyen con un apartado sobre los aspectos energéticos del sistema.
El hype de ChatGPT#
Ya hace casi dos años que hay disponibles herramientas de IA generativas que permiten crear textos a partir de prompts. No obstante, estas herramientas tenían una popularidad muy limitada en entornos de interés en la IA y la innovación tecnológica. Vemos en la siguiente figura la popularidad de GPT-3, el mejor modelo hasta el momento, comparado con la popularidad en búsquedas en Google de un término relativamente mainstream como _“ferrari”__.



Pues el resultado de Google Trends apunta al hecho de que el nivel de atención a las búsquedas que “ChatGPT” está suscitando es del mismo orden que el que suscita la cantante colombiana que hasta hace poco vivía en Barcelona.
Recordemos el significado de “hype”. Según ChatGPT:
Hype es un término utilizado para describir una gran cantidad de publicidad y entusiasmo exagerado por un producto, idea o tendencia. En general, se refiere a un aumento de la popularidad o de la atención que se ha dado a algo sin una base real o justificación. Así, el término hype suele referirse a una situación en la que se han generado expectativas o expectativas desmesuradas sobre un producto o servicio, de manera que no es coherente con su realidad o sus capacidades.
Haya o no base real o justificación, ChatGPT es sin duda uno de los términos de búsqueda más populares en internet.
