Философия ИИ: тест Тьюринга и китайская комната¶

Коротко

«Может ли машина мыслить?» — это не технический вопрос, а философский, и однозначного ответа у него до сих пор нет. В этом уроке вы разберётесь, что проверяет тест Тьюринга, почему мысленный эксперимент «китайская комната» ставит под сомнение саму идею машинного понимания, и чем сильный ИИ отличается от слабого. А ещё поймёте, почему современные чат-боты вроде Алисы или YandexGPT звучат убедительно, но «понимают» ли они вас — большой вопрос.

Может ли машина мыслить¶

Это один из самых старых вопросов об ИИ, и он не про код, а про смысл слова «мыслить». Когда вы спрашиваете GigaChat про погоду и получаете складный ответ, кажется, что на том конце кто-то вас понял. Но что именно произошло? Программа подобрала подходящие слова — или действительно осознала ваш вопрос?

Проблема в том, что у нас нет прибора, который измерял бы «понимание» или «сознание». Мы судим о других людях по их поведению: человек отвечает осмысленно — значит, он мыслит. С машиной этот привычный способ даёт сбой. Поведение может выглядеть разумным, а вот что стоит за ним — непонятно.

Чтобы не спорить впустую, философы и инженеры придумали несколько способов подойти к вопросу с разных сторон. С двух из них — теста Тьюринга и китайской комнаты — мы и начнём.

Тест Тьюринга: проверка на неотличимость¶

В середине XX века математик Алан Тьюринг предложил обойти неуловимый вопрос «мыслит ли машина» и заменить его на проверяемый.

Тест Тьюринга — это мысленная проверка, в которой человек-судья общается в переписке сразу с двумя собеседниками: один из них человек, другой — машина. Судья не видит и не слышит их, только читает ответы. Если по итогам разговора он не может надёжно определить, кто есть кто, машина считается прошедшей тест.

Идея элегантна: мы не лезем внутрь машины и не пытаемся заглянуть в её «мысли». Мы смотрим только на поведение. Если в разговоре машину не отличить от человека — будем считать, что в практическом смысле она ведёт себя разумно.

Важно

Тест Тьюринга проверяет не правдивость ответов и не интеллект как таковой, а неотличимость в живом диалоге. Машина может пройти тест, рассказывая о себе неправду (например, делая вид, что устала или ошиблась в арифметике) — лишь бы это выглядело по-человечески.

У теста есть слабые места. Он награждает хорошую имитацию, а не понимание. Современные голосовые помощники и чат-боты местами уже звучат очень по-человечески, но из этого не следует, что внутри у них появилось что-то похожее на мысль. Именно эту разницу и подсвечивает следующий мысленный эксперимент.

Китайская комната: символы против понимания¶

В 1980-х философ Джон Сёрл предложил сценарий, который бьёт прямо по идее теста Тьюринга.

Китайская комната — это мысленный эксперимент, в котором человек, не знающий китайского языка, сидит в закрытой комнате с подробной инструкцией. Снаружи ему подают записки с китайскими иероглифами. По инструкции он находит, какими другими иероглифами нужно ответить, и выдаёт результат наружу — не понимая ни одного символа.

Для китайца снаружи всё выглядит так, будто в комнате сидит знаток языка: вопросы получают осмысленные ответы. Но внутри никакого понимания нет — есть лишь механическое сопоставление символов по правилам.

Вывод Сёрла: обработка символов по правилам — это ещё не понимание. Компьютер делает ровно то же самое. Он манипулирует знаками (нулями и единицами, словами, токенами), но сами по себе эти операции не порождают смысла. Программа может блестяще пройти тест Тьюринга и при этом не понимать ни слова — как человек в комнате.

Пример: Алиса и «китайская комната» на практике

Когда вы говорите Алисе «найди кафе рядом», она выдаёт уместный ответ. Но под капотом нет осознания понятий «кафе», «голод» или «рядом» так, как их переживаете вы. Есть распознавание речи, сопоставление с тысячами похожих запросов и подходящий шаблон действия. Снаружи — будто вас поняли. Внутри — очень быстрая и умная обработка символов. Ровно об этом разрыве и говорит Сёрл.

Эксперимент Сёрла не закрыл спор, а распалил его. Кто-то возражает: понимает не человек в комнате, а вся система целиком — комната, инструкция и человек вместе. Единого ответа нет до сих пор, и это нормально для философского вопроса.

Сильный ИИ против слабого ИИ¶

Из этих споров выросло удобное различение, которым пользуются до сих пор.

Сильный ИИ — это гипотетическая система, которая по-настоящему мыслит, понимает и, возможно, обладает чем-то вроде сознания. Не имитирует разум, а действительно им обладает. Такого ИИ на сегодня не существует, и неизвестно, появится ли он вообще.

Слабый ИИ — это система, которая решает конкретные задачи и может выглядеть разумной, но никакого понимания и сознания за этим не стоит. Это инструмент: мощный, полезный, но всё-таки инструмент.

Весь ИИ, с которым вы сталкиваетесь каждый день, — слабый. И это не уничижительная оценка, а точное описание.

	Слабый ИИ	Сильный ИИ
Что умеет	Решает конкретные задачи	Мыслит и понимает в широком смысле
Понимание	Имитирует, смысла не осознаёт	Подлинное (гипотетически)
Существует ли	Да, повсюду	Нет, только в теории
Примеры	Алиса, YandexGPT, GigaChat, рекомендации Кинопоиска	Пока только в фантастике

О том, чем ИИ в целом отличается от соседних областей — машинного обучения, data science и робототехники, — мы подробно говорили в уроке ИИ и смежные области.

Современный взгляд: убедительная имитация и галлюцинации¶

С появлением больших языковых моделей вопрос «понимает ли машина» зазвучал с новой силой. YandexGPT и GigaChat ведут связную беседу, шутят, объясняют, пишут код. Соблазн сказать «они понимают» очень велик.

Но по своей сути такая модель делает одно: предсказывает следующее слово. Она научилась на огромном объёме текстов и подбирает наиболее вероятное продолжение фразы. Получается гладко и осмысленно — и всё же ближе к очень изощрённой «китайской комнате», чем к подлинному пониманию.

Прямое следствие этого устройства — галлюцинации: ситуации, когда модель уверенно выдаёт правдоподобный, но ложный ответ. Она ведь оптимизирует не истину, а правдоподобие текста. Если вероятное продолжение фразы оказывается выдуманным фактом или несуществующим источником, модель всё равно его напишет — складно и убедительно.

Важно

Чем естественнее звучит ответ модели, тем легче ему поверить на слово. Поэтому важные факты, цифры, цитаты и ссылки всегда стоит сверять с первоисточником, а не полагаться на убедительность формулировки.

Именно поэтому опора на проверяемый источник — не придирка, а способ отделить настоящий факт от красивого предсказания текста.

Если важна не убедительность, а точность

Когда нужен ответ, которому можно доверять, помогает связка ИИ с вашими собственными документами и ссылкой на источник. Так устроен ENGRAM: он отвечает на основе ваших данных и показывает, откуда взят ответ, чтобы факты можно было проверить. Данные при этом хранятся в России — это удобно с точки зрения 152-ФЗ.

Упражнение¶

Упражнение: понимает ли чат-бот ваш вопрос?

Представьте, что вы спорите с другом. Он уверен: современный чат-бот «понимает» вопросы. Соберите аргументы за и против — и попробуйте увидеть силу каждой стороны.

Аргументы «за» (понимает):

Ответы по теме, логичные и часто полезные — это поведение, которое мы привыкли называть пониманием у людей.
Бот улавливает контекст беседы, переспрашивает, учитывает предыдущие реплики.
Если судить только по диалогу (как в тесте Тьюринга), отличить его от человека порой трудно.

Аргументы «против» (не понимает):

Внутри — предсказание следующего слова, а не осознание смысла (это идея китайской комнаты).
Бот галлюцинирует: уверенно выдаёт ложь, чего понимающий собеседник, осознающий факты, обычно не делает.
У него нет опыта, тела и связи слов с реальным миром — «кафе» для него лишь символ среди символов.

Разбор. Единственно верного ответа здесь нет — в этом и смысл. Если определять понимание через поведение, чат-бот его «проходит». Если через внутреннее переживание смысла — нет. Вы спорите не столько о боте, сколько о том, что вообще считать пониманием. Это и есть философия ИИ в действии.

Проверьте себя¶

Короткий тест по уроку: выберите ответ и нажмите «Проверить» — увидите счёт и разбор.

Частые вопросы¶

Прошёл ли уже какой-нибудь ИИ тест Тьюринга?

Однозначного «да» нет. В отдельных коротких разговорах современные чат-боты сбивали людей с толку, но строгого, общепризнанного прохождения теста в честных условиях не случилось. К тому же сам тест критикуют: он измеряет качество имитации, а не наличие мысли.

В чём разница между тестом Тьюринга и китайской комнатой?

Тест Тьюринга смотрит снаружи: если поведение машины в разговоре неотличимо от человеческого, она проходит. Китайская комната смотрит изнутри и возражает: можно идеально вести себя по правилам и при этом ничего не понимать. Первое — про поведение, второе — про смысл за поведением.

Алиса, YandexGPT и GigaChat — это сильный или слабый ИИ?

Слабый. Это мощные инструменты, которые отлично решают свои задачи и могут звучать совсем по-человечески, но подлинного понимания или сознания за ними нет. Сильного ИИ на сегодня не существует.

Почему чат-боты выдают неправду, если они такие умные?

Потому что в основе лежит предсказание правдоподобного текста, а не проверка истины. Если выдуманный, но «гладкий» вариант продолжения фразы окажется вероятным, модель его напишет. Это и называют галлюцинацией — поэтому важные факты лучше сверять с источником.

В курсе: ← Назад: ИИ и смежные области: ML, data science, робототехника · Дальше: Поиск и планирование: как ИИ находит решение →

Авторы курса: Герман Коваленко (основатель ENGRAM) и Сергей Добров.

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно