ИИ и смежные области: ML, data science, робототехника¶
Коротко
Искусственный интеллект — это широкая область, а машинное обучение, глубокое обучение, data science и робототехника — соседние дисциплины, которые с ней пересекаются или входят в неё. Машинное обучение — это часть ИИ, а глубокое обучение — часть машинного обучения: вложенность, как у матрёшки. Data science стоит чуть в стороне: это работа с данными на стыке статистики и программирования. Робототехника даёт ИИ «тело» для действий в физическом мире. Разобравшись в этих границах, вы перестанете путать термины в новостях и рекламе.
В прошлом уроке мы разобрались, как вообще определить искусственный интеллект. Теперь наведём порядок в соседних словах. В заголовках статей ИИ, машинное обучение, нейросети и data science часто идут через запятую, как будто это синонимы. На деле у них разные роли, и понимать их полезно — хотя бы чтобы трезво читать обещания вендоров.
ИИ как зонтичная дисциплина¶
Удобнее всего представлять искусственный интеллект — попытку научить машины решать задачи, которые мы считаем «умными» — как большой зонт. Под ним помещается всё: и системы, работающие по жёстко прописанным правилам, и программы, которые учатся на данных, и роботы, и распознавание речи.
Это значит, что не всякий ИИ — это нейросеть или обучение на примерах. Шахматная программа, которая перебирает ходы по заданному алгоритму, — тоже ИИ, хотя она ничему не «учится». Голосовой помощник, навигатор, антифрод-система банка — все они лежат под зонтом ИИ, но устроены по-разному.
Важно
Когда вам говорят «у нас тут ИИ», это почти ничего не уточняет — слишком широкое слово. Полезный вопрос: это система по правилам, машинное обучение или нейросеть? Ответ сразу многое объясняет про возможности и ограничения.
Машинное обучение — подмножество ИИ¶
Машинное обучение — это подход внутри ИИ, при котором программу не программируют правилами вручную, а показывают ей много примеров, и она сама находит закономерности. Ключевое отличие: правила здесь не пишет человек — их «выводит» сама система из данных.
Сравните два способа отличить спам от обычного письма:
- По правилам. Человек заранее прописывает: если в письме есть слово «выигрыш» и три ссылки — это спам. Такие правила быстро устаревают и их легко обойти.
- Через машинное обучение. Системе показывают тысячи писем, помеченных как «спам» и «не спам», и она сама учится распознавать подозрительные признаки. Именно так работают современные спам-фильтры.
Машинное обучение — это и рекомендации товаров на Wildberries и Ozon, и подбор музыки в Яндекс Музыке, и оценка риска мошеннической операции в банковском антифроде. Подробнее про его виды — обучение с учителем, без учителя и с подкреплением — будет в четвёртой главе курса.
Глубокое обучение — подмножество машинного обучения¶
Идём на уровень глубже. Глубокое обучение — это раздел машинного обучения, где используют нейронные сети из множества слоёв. Чем больше слоёв, тем более сложные закономерности модель способна уловить — отсюда слово «глубокое».
Глубокое обучение особенно хорошо там, где данные сложные и «сырые»: изображения, звук, естественный язык. Именно на нём построены самые заметные сегодня системы:
- YandexGPT и GigaChat (Сбер) — большие языковые модели, которые отвечают на вопросы и пишут тексты.
- Распознавание лиц в сервисах вроде FacePay в метро.
- Перевод в Яндекс Переводчике и распознавание речи у голосового помощника Алисы.
Эти три уровня удобно держать в голове как вложенные круги — от самого широкого к самому узкому:
| Уровень | Что это | Пример под РФ |
|---|---|---|
| Искусственный интеллект | Вся область «умных» машин | Навигатор, антифрод, голосовой помощник |
| → Машинное обучение | Подход: учиться на данных, а не по правилам | Рекомендации на Ozon, оценка риска операции |
| → → Глубокое обучение | Машинное обучение на многослойных нейросетях | YandexGPT, GigaChat, распознавание лиц |
Стрелки здесь читаются как «входит в состав». Глубокое обучение — это всегда машинное обучение, а машинное обучение — всегда ИИ. Но обратное неверно: бывает ИИ без обучения вообще.
Data science и статистика — рядом, но не внутри¶
А вот data science (наука о данных) — это не подмножество ИИ, а соседняя область, которая с ним пересекается. Это работа с данными в целом: их сбор, очистка, анализ и выводы для решений. Data science стоит на трёх опорах — данные, статистика и программирование.
Здесь важна статистика — математический фундамент, который позволяет делать обоснованные выводы из данных и оценивать, насколько им можно доверять. Без статистики не было бы ни машинного обучения, ни честной аналитики: именно она объясняет, что такое вероятность, среднее, ошибка и корреляция.
Чем data science отличается от машинного обучения? Машинное обучение почти всегда строит модель, которая что-то предсказывает или классифицирует. Data science шире: специалист может просто проанализировать данные и сделать вывод для бизнеса, вообще без обучаемой модели. Часто эти задачи переплетаются.
Пример: data science в Яндексе
Когда Яндекс улучшает поисковую выдачу или подбирает рекламу, в дело идёт целый набор инструментов. Сначала аналитики собирают и очищают данные о поведении пользователей — это data science. Дальше на этих данных обучают модели ранжирования — это уже машинное обучение, часто с глубоким обучением внутри. А чтобы понять, стала ли выдача лучше, проводят A/B-тесты и оценивают результат статистическими методами. Одна задача — три области сразу.
Робототехника — «тело» для ИИ¶
Робототехника — это создание машин, которые действуют в физическом мире: двигаются, берут предметы, ориентируются в пространстве. Если ИИ — это «мозг», то робот — «тело», через которое этот мозг что-то делает руками и колёсами.
Связь с ИИ тесная, но не обязательная в обе стороны. Промышленный манипулятор на конвейере, который повторяет одно и то же движение, — это робототехника почти без ИИ. А вот доставочный ровер Яндекса, который сам объезжает прохожих на тротуаре, или сервисный робот Промобот, который общается с посетителями, — это робототехника плюс ИИ: распознавание окружения, планирование маршрута, понимание речи.
Получается, ИИ может работать без «тела» — чат-бот живёт в облаке, — а робот может работать почти без ИИ. Самое интересное — на их пересечении, где машина и думает, и действует в реальном мире.
Чем ИИ отличается от обычной автоматизации¶
Есть ещё одно слово, которое путают с ИИ, — автоматизация по правилам. Это когда человек заранее прописывает все шаги: «если пришёл такой запрос — ответь так». Сюда относятся скрипты, макросы, простые чат-боты с кнопками, формулы в таблицах.
Разница принципиальная:
- Автоматизация по правилам делает ровно то, что прописал человек. Новая, не предусмотренная ситуация ставит её в тупик.
- ИИ (особенно с машинным обучением) способен обобщать на случаи, которых не было в инструкции, потому что он опирается на закономерности в данных, а не на жёсткий список «если — то».
Поэтому далеко не всё, что называют ИИ в рекламе, действительно им является. Бот, отвечающий заготовленными фразами по кнопкам, — это автоматизация, а не интеллект. Это нормально и часто полезно, просто стоит называть вещи своими именами.
Упражнение: соотнесите продукт с областью
Попробуйте сами определить, к какой области ближе каждый пример: ИИ в целом, машинное обучение (ML), глубокое обучение (DL), data science или робототехника. Иногда подходит сразу несколько — это нормально.
- YandexGPT отвечает на ваш вопрос связным текстом.
- Аналитик маркетплейса очищает данные о заказах и считает, в каком регионе выше средний чек.
- Доставочный ровер Яндекса объезжает пешехода на тротуаре.
- Антифрод банка по тысячам прошлых операций оценивает, не мошенническая ли эта оплата.
- Простой чат-бот на сайте отвечает по кнопкам заранее заготовленными фразами.
Разбор:
- Глубокое обучение (а значит, заодно ML и ИИ): большая языковая модель — это многослойная нейросеть.
- Data science и статистика: здесь нет обучаемой модели, есть сбор, очистка данных и выводы.
- Робототехника + ИИ: машина действует в физическом мире и при этом распознаёт обстановку и планирует движение.
- Машинное обучение: система училась на размеченных примерах прошлых операций отличать норму от мошенничества.
- Автоматизация по правилам, а не ИИ: бот делает ровно то, что прописал человек, и не обобщает на новые ситуации.
Проверьте себя¶
Короткий тест по уроку: выберите ответ и нажмите «Проверить» — увидите счёт и разбор.
Частые вопросы¶
Машинное обучение и искусственный интеллект — это одно и то же?
Нет. Искусственный интеллект — широкая область, а машинное обучение — один из подходов внутри неё. Любое машинное обучение относится к ИИ, но бывает и ИИ без обучения — например, системы, работающие по заранее заданным правилам.
Чем глубокое обучение отличается от машинного обучения?
Глубокое обучение — это частный случай машинного обучения, в котором используют нейросети из многих слоёв. Оно особенно хорошо справляется со сложными данными: текстом, изображениями, звуком. YandexGPT и GigaChat построены именно на глубоком обучении.
Data science — это часть искусственного интеллекта?
Скорее соседняя область, которая с ИИ пересекается. Data science — это работа с данными в целом: сбор, очистка, анализ и выводы на стыке статистики и программирования. Часть задач решают через машинное обучение, но многое делают и без обучаемых моделей.
Любой робот — это искусственный интеллект?
Нет. Робототехника — это про машины, действующие в физическом мире, и она не обязательно содержит ИИ. Манипулятор, повторяющий одно движение, обходится почти без него. А вот доставочный ровер, который сам ориентируется на улице, — это уже робототехника вместе с ИИ.
В курсе: ← Назад: Как определить искусственный интеллект · Дальше: Философия ИИ: тест Тьюринга и китайская комната →
Авторы курса: Герман Коваленко (основатель ENGRAM) и Сергей Добров.
Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.
Зарегистрироваться бесплатноENGRAM запоминает ваши встречи, документы и переписку и мгновенно находит ответ со ссылкой на источник. Ваша вторая память на базе ИИ. Данные в России, старт бесплатный.
Зарегистрироваться бесплатно