ChatGPT-4 показал лучшие результаты в тесте Тьюринга на фоне других моделей
ChatGPT-4, разработанный OpenAI, успешно прошёл тест Тьюринга, обманув испытуемых в 54% случаев, по данным исследователей из Калифорнийского университета в Сан-Диего.
Тест предполагает, что если человек не может отличить ответы компьютера от человеческих, то машина считается разумной. В эксперименте участвовали 500 человек, которым предстояло общаться с тремя ИИ и одним человеком. В результате ChatGPT-4 показал лучшие результаты по сравнению с другими системами, включая более старую версию ChatGPT-3.5 и программу 1960-х годов ELIZA.
Исследователи отмечают, что результаты теста могут больше говорить о его недостатках, чем о реальном интеллекте ИИ, поскольку тест оценивает способность ИИ к имитации человеческого общения, а не к разумным действиям. Тем не менее, если в результате рецензирования эксперимент признают валидным, это будет первым убедительным доказательством того, что ИИ может пройти Тьюринга.
При этом сам тест Тьюринга активно критикуется многими экспертами: из-за изменений в общественном восприятии ИИ и развитии технологий его результаты могут быть необъективными. Исследование ещё ожидает рецензирования, и его результаты следует воспринимать с осторожностью.
Читать первым в Telegram-канале «Код Дурова»