Самый человечный ИИ: что показал трёхсторонний тест Тьюринга и почему это пугает
GPT-4.5, последняя версия крупной языковой модели от OpenAI, официально прошла не просто тест Тьюринга — она сделала это в самом сложном его варианте. В новом исследовании, размещённом на arXiv, модель смогла убедить 73% участников в том, что перед ними — живой человек. Причём в некоторых случаях её считали более «настоящей», чем реальных людей.
В рамках трёхстороннего теста Тьюринга участникам предлагалось пообщаться одновременно с человеком и ИИ, не зная, кто есть кто.
В ходе короткой беседы модели старались убедить собеседников в своей человечности. Очень хорошо с этим справлялся GPT-4.5, особенно если он играл роль «интровертного молодого человека, разбирающегося в интернет-культуре».
Интересно, что другой участник теста — LLaMa-3.1 от Meta — тоже смог убедить 56% людей в своей «настоящести». Для сравнения: сам Алан Тьюринг считал, что даже у опытного следователя не будет более 70% шанса угадать, кто из собеседников — машина.
Главная цель теста Тьюринга — не доказать, что ИИ может думать, а показать, насколько хорошо он может имитировать человека. И с этим GPT-4.5 справился на удивление успешно.
«4.5 даже чаще признавали человеком, чем реальных людей», — отмечает один из авторов исследования, Кэмерон Джонс.
Оказалось, что простая установка на «будь человеком работает не так эффективно. Зато если дать модели чёткую роль — например, «молодой интроверт со сленгом» — результат значительно улучшается.
Всё дело в контексте и стиле общения: участники принимали решения не столько на основе знаний, сколько по «атмосфере диалога», тону, эмоциям и манере общения.
Хотя это исследование — значимый шаг для ИИ, оно вызывает и беспокойство. Ведь если мы не можем отличить ИИ от человека, то как распознать попытки манипуляции?
Участники исследования признались, что полагались не на логику, а на ощущения. Это делает современные LLM особенно опасными — в том числе с точки зрения социальной инженерии.
Тест Тью́ринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.
Источник: pravda.ru
Фото: WWW
2025-04-15