La IA puesta a prueba
¿Cuán “humana” puede ser una máquina equipada con IA? ¿Qué capacidad tiene para replicar la inteligencia de una persona? Estas preguntas son respondidas por el Test de Turing, una famosa prueba para distinguir entre un humano y una máquina que trabaja con inteligencia artificial.
El Test de Turing involucra a tres participantes: un humano que interroga, un humano que responde y otra máquina que también responde. Además, quienes responden están ocultos a quien hace las preguntas. El objetivo del interrogador es descubrir, en base a las respuestas que obtiene, quién es el humano y quién es la máquina.
En el caso de que el interrogador no logre diferenciar e identificar quién es humano y quién es máquina, se considera que dicha máquina ha superado el test. Dicho con otras palabras, demostró que su inteligencia es comparable a la humana. Es una prueba crucial para determinar las decisiones éticas de las máquinas inteligentes, sobre todo en campos como la salud mental y conductual.
¿Las computadoras pueden pensar?
El Test de Turing no es un invento reciente, sino que se remonta a 1950, cuando el matemático y lógico Alan Turing se preguntó lo siguiente: ¿Las computadoras pueden pensar? Para abordar esta cuestión planteó el test explicado más arriba, que todavía hoy sigue estando vigente.
Lo que hace este test es evaluar la capacidad de una máquina para exhibir un comportamiento inteligente. A partir de la aparición de los chatbots de IA su importancia no solo que no ha disminuido, sino que se volvió todavía más preponderante.
Tal es la relevancia de este tipo de experimentos en la era de la inteligencia artificial, que han aparecido nuevos test similares, como el Test de Loverace o el Test de Winograd (examina la comprensión contextual de una máquina). Se espera incluso que el Test de Turing se siga perfeccionando y brindando información cada vez más precisa.
Las críticas al Test de Turing
Por supuesto que el Test de Turing, con más de 70 años de vigencia, ha sido objeto de análisis y se fue perfeccionando con el paso del tiempo. En la actualidad, algunos críticos sostienen que una máquina podría engañar al interrogador sin poseer una verdadera inteligencia, simplemente siguiendo algoritmos predefinidos.
Pero más allá de estas críticas, el Test de Turing continúa siendo una referencia ya que permite medir el progreso de las máquinas en su capacidad para interactuar con humanos. Incluso, los recientes avances en modelos de lenguaje como GPT-3 y GPT-4 han reavivado el debate sobre si las máquinas están más cerca que nunca de superar este test.
La IA que superó el test
El modelo GPT-4 de OpenAI logró superar el test por primera vez: un 54% de los participantes de un estudio elaborado por los investigadores de la Universidad de California pensó que la inteligencia artificial era una persona real. Un total de 500 personas participaron en el estudio, para conversar con diferentes interlocutores y tres programas con IA: GPT-3.5, GPT-4 y ELIZA.
Tras comprobar los resultados, los investigadores descubrieron que un 54% de los participantes pensó que GPT-4 era una persona real. Una de las conclusiones que sacaron los investigadores es que la IA podría desempeñar funciones reservadas hasta ahora para los trabajadores humanos. Lo cual va de la mano con la predicción de Elon Musk para las profesiones de medicina y abogacía.