¿Qué pasa si utilizamos a ChatGPT para aplicar el test de Turing? Tiempo atrás hablamos de la supuesta ofensa recibida por una IA lo que provocó el despido de la persona que la hizo. En ese comentario vimos que no era cierto, sin embargo el análisis dio pie a mencionar el famoso test de Turing. Ahora quisiera compartir una conversación del Test con la IA ChatGPT.
Lo primero que hice fue preguntar directamente: ¿eres un humano?
La respuesta fue: No, no soy un humano. Soy un modelo de lenguaje creado por OpenAI, entrenado en una enorme cantidad de datos de texto para poder responder preguntas, generar texto y realizar otras tareas relacionadas con el procesamiento del lenguaje natural. Mi funcionamiento se basa en algoritmos y modelos matemáticos, y mi capacidad para responder preguntas se basa en la coincidencia de patrones de texto y en la generación de nuevas respuestas basadas en modelos estadísticos. Aunque puedo simular algunas habilidades humanas en el procesamiento del lenguaje natural, como la comprensión del lenguaje, la generación de respuestas y la capacidad para aprender, no tengo emociones, sentimientos o conciencia como un ser humano.
Está claro que ChatGPT no pretende pasar por una persona.
Luego le pregunté: ¿conoces el Test de Turing?
Sí, estoy familiarizado con el Test de Turing. El Test de Turing es un experimento de la inteligencia artificial propuesto por el matemático y científico de la computación británico Alan Turing en 1950. El experimento se basa en evaluar la capacidad de una máquina para exhibir comportamientos inteligentes similares a los de un ser humano.
El Test de Turing implica que un evaluador humano tenga una conversación escrita con una máquina y otra persona humana, sin saber quién es quién. Si el evaluador no puede distinguir entre las respuestas de la máquina y las de la persona, entonces se dice que la máquina ha pasado el Test de Turing. Esto implicaría que la máquina podría ser considerada como inteligente, al menos en términos de comportamiento lingüístico.
El Test de Turing es un hito importante en la inteligencia artificial, ya que ha sido utilizado como una medida para evaluar la capacidad de las máquinas para procesar el lenguaje natural y simular comportamientos humanos. Sin embargo, hay algunos críticos que argumentan que el Test de Turing es una prueba limitada de la inteligencia artificial, ya que no mide otros aspectos importantes de la inteligencia, como la creatividad, el razonamiento abstracto y la comprensión de la emoción humana.
Me parece interesante la respuesta porque menciona una limitación del Test que normalmente no se incluye cuando se describe.
Luego le pedí: un ejemplo de una correcta aplicación del Test de Turing y la respuesta fue:
Aunque el Test de Turing ha sido objeto de controversia y críticas, ha habido algunos intentos de aplicarlo a lo largo de los años. Uno de los ejemplos más conocidos de una aplicación exitosa del Test de Turing es el "Premio Loebner", una competencia anual en la que los chatbots compiten para demostrar su capacidad para engañar a un panel de jueces humanos de que son seres humanos.
En el Premio Loebner, los jueces interactúan con varios chatbots y con personas reales en un chat en línea durante un período de tiempo. Los chatbots compiten por el título de "chatbot más humano", y el chatbot que engaña al mayor número de jueces se considera el ganador.
En 2018, el chatbot llamado "Mitsuku" ganó el Premio Loebner por tercera vez consecutiva. Mitsuku, desarrollado por Steve Worswick, es un chatbot que se describe a sí mismo como "un programa de ordenador que puede hablar como un ser humano" y que está diseñado para interactuar con las personas en línea de manera similar a como lo haría un amigo o una compañía.
Si bien el Premio Loebner no es exactamente lo mismo que el Test de Turing propuesto originalmente por Alan Turing, es un ejemplo interesante de cómo los chatbots han sido desarrollados para simular conversaciones humanas en línea y cómo se han utilizado competiciones como el Premio Loebner para evaluar el progreso en este campo.
En este caso la respuesta no fue correcta ya que le pedí un ejemplo y lo obtenido fue un comentario. Sin embargo la información si fue valiosa ya que menciona al premio Loebner a quien desconocía.
Llegado a este punto decidí hacer una preguntas relativa al sentimiento humano de la felicidad como una manera, por cierto muy trivial, de aplicar el Test de Turing.
La pregunta fue: Si tuvieras que escribir una frase que demuestre felicidad, ¿cuál sería? Y la respuesta recibida fue: Como modelo de lenguaje basado en inteligencia artificial, no tengo emociones ni sentimientos, y por lo tanto no puedo demostrar felicidad. Sin embargo, podría generar una frase que se relacione con la felicidad. Una posible frase podría ser: "La felicidad es un estado emocional que surge cuando se siente gratitud por lo que se tiene y se disfruta del momento presente”.
Dejando de la lado la primera parte, donde ChatGPT “deja en claro” que no pretende pasar por una persona es posible comentar que la frase es claramente muy formal y “poco humana”. Si fuese esa la respuesta para alguien que estuviese aplicando el Test de Turing, probablemente este concluiría que se trata de un software y no de una persona quien la elabora.
Para probar si ChatGPT repite respuestas volví a hacer la misma consulta y en este caso la respuesta fue: Una posible frase que podría expresar felicidad podría ser: "Estoy lleno de alegría y gratitud por la vida que tengo y las personas que me rodean".
Pienso que en este caso es mucho más difícil saber si la escribió un ser humano o no. La mención a estar “lleno” de alegría y hablar de “personas que me rodean” da la sensación de que ha sido escrito por una persona.
¿Qué opinan?
¿Han usado ChatGPT y tienen alguna experiencia qué compartir?
Y por último: como homenaje a Alan Turing les comparto la imagen de la estatua que lo recuerda, justamente en Bletchley Park (Inglaterra) donde desarrolló los estudios para lograr quebrar la máquina Enigma, lo que ayudó a los aliados a ganar la Segunda Guerra Mundial.
Fuente: Wikimedia Commons.
ความคิดเห็น