Перейти к содержанию

ИИ и смежные области: ML, data science, робототехника

Коротко

Искусственный интеллект — это широкая область, а машинное обучение, глубокое обучение, data science и робототехника — соседние дисциплины, которые с ней пересекаются или входят в неё. Машинное обучение — это часть ИИ, а глубокое обучение — часть машинного обучения: вложенность, как у матрёшки. Data science стоит чуть в стороне: это работа с данными на стыке статистики и программирования. Робототехника даёт ИИ «тело» для действий в физическом мире. Разобравшись в этих границах, вы перестанете путать термины в новостях и рекламе.

В прошлом уроке мы разобрались, как вообще определить искусственный интеллект. Теперь наведём порядок в соседних словах. В заголовках статей ИИ, машинное обучение, нейросети и data science часто идут через запятую, как будто это синонимы. На деле у них разные роли, и понимать их полезно — хотя бы чтобы трезво читать обещания вендоров.

ИИ как зонтичная дисциплина

Удобнее всего представлять искусственный интеллект — попытку научить машины решать задачи, которые мы считаем «умными» — как большой зонт. Под ним помещается всё: и системы, работающие по жёстко прописанным правилам, и программы, которые учатся на данных, и роботы, и распознавание речи.

Это значит, что не всякий ИИ — это нейросеть или обучение на примерах. Шахматная программа, которая перебирает ходы по заданному алгоритму, — тоже ИИ, хотя она ничему не «учится». Голосовой помощник, навигатор, антифрод-система банка — все они лежат под зонтом ИИ, но устроены по-разному.

Важно

Когда вам говорят «у нас тут ИИ», это почти ничего не уточняет — слишком широкое слово. Полезный вопрос: это система по правилам, машинное обучение или нейросеть? Ответ сразу многое объясняет про возможности и ограничения.

Машинное обучение — подмножество ИИ

Машинное обучение — это подход внутри ИИ, при котором программу не программируют правилами вручную, а показывают ей много примеров, и она сама находит закономерности. Ключевое отличие: правила здесь не пишет человек — их «выводит» сама система из данных.

Сравните два способа отличить спам от обычного письма:

  • По правилам. Человек заранее прописывает: если в письме есть слово «выигрыш» и три ссылки — это спам. Такие правила быстро устаревают и их легко обойти.
  • Через машинное обучение. Системе показывают тысячи писем, помеченных как «спам» и «не спам», и она сама учится распознавать подозрительные признаки. Именно так работают современные спам-фильтры.

Машинное обучение — это и рекомендации товаров на Wildberries и Ozon, и подбор музыки в Яндекс Музыке, и оценка риска мошеннической операции в банковском антифроде. Подробнее про его виды — обучение с учителем, без учителя и с подкреплением — будет в четвёртой главе курса.

Глубокое обучение — подмножество машинного обучения

Идём на уровень глубже. Глубокое обучение — это раздел машинного обучения, где используют нейронные сети из множества слоёв. Чем больше слоёв, тем более сложные закономерности модель способна уловить — отсюда слово «глубокое».

Глубокое обучение особенно хорошо там, где данные сложные и «сырые»: изображения, звук, естественный язык. Именно на нём построены самые заметные сегодня системы:

  • YandexGPT и GigaChat (Сбер) — большие языковые модели, которые отвечают на вопросы и пишут тексты.
  • Распознавание лиц в сервисах вроде FacePay в метро.
  • Перевод в Яндекс Переводчике и распознавание речи у голосового помощника Алисы.

Эти три уровня удобно держать в голове как вложенные круги — от самого широкого к самому узкому:

Уровень Что это Пример под РФ
Искусственный интеллект Вся область «умных» машин Навигатор, антифрод, голосовой помощник
→ Машинное обучение Подход: учиться на данных, а не по правилам Рекомендации на Ozon, оценка риска операции
→ → Глубокое обучение Машинное обучение на многослойных нейросетях YandexGPT, GigaChat, распознавание лиц

Стрелки здесь читаются как «входит в состав». Глубокое обучение — это всегда машинное обучение, а машинное обучение — всегда ИИ. Но обратное неверно: бывает ИИ без обучения вообще.

Data science и статистика — рядом, но не внутри

А вот data science (наука о данных) — это не подмножество ИИ, а соседняя область, которая с ним пересекается. Это работа с данными в целом: их сбор, очистка, анализ и выводы для решений. Data science стоит на трёх опорах — данные, статистика и программирование.

Здесь важна статистика — математический фундамент, который позволяет делать обоснованные выводы из данных и оценивать, насколько им можно доверять. Без статистики не было бы ни машинного обучения, ни честной аналитики: именно она объясняет, что такое вероятность, среднее, ошибка и корреляция.

Чем data science отличается от машинного обучения? Машинное обучение почти всегда строит модель, которая что-то предсказывает или классифицирует. Data science шире: специалист может просто проанализировать данные и сделать вывод для бизнеса, вообще без обучаемой модели. Часто эти задачи переплетаются.

Пример: data science в Яндексе

Когда Яндекс улучшает поисковую выдачу или подбирает рекламу, в дело идёт целый набор инструментов. Сначала аналитики собирают и очищают данные о поведении пользователей — это data science. Дальше на этих данных обучают модели ранжирования — это уже машинное обучение, часто с глубоким обучением внутри. А чтобы понять, стала ли выдача лучше, проводят A/B-тесты и оценивают результат статистическими методами. Одна задача — три области сразу.

Робототехника — «тело» для ИИ

Робототехника — это создание машин, которые действуют в физическом мире: двигаются, берут предметы, ориентируются в пространстве. Если ИИ — это «мозг», то робот — «тело», через которое этот мозг что-то делает руками и колёсами.

Связь с ИИ тесная, но не обязательная в обе стороны. Промышленный манипулятор на конвейере, который повторяет одно и то же движение, — это робототехника почти без ИИ. А вот доставочный ровер Яндекса, который сам объезжает прохожих на тротуаре, или сервисный робот Промобот, который общается с посетителями, — это робототехника плюс ИИ: распознавание окружения, планирование маршрута, понимание речи.

Получается, ИИ может работать без «тела» — чат-бот живёт в облаке, — а робот может работать почти без ИИ. Самое интересное — на их пересечении, где машина и думает, и действует в реальном мире.

Чем ИИ отличается от обычной автоматизации

Есть ещё одно слово, которое путают с ИИ, — автоматизация по правилам. Это когда человек заранее прописывает все шаги: «если пришёл такой запрос — ответь так». Сюда относятся скрипты, макросы, простые чат-боты с кнопками, формулы в таблицах.

Разница принципиальная:

  • Автоматизация по правилам делает ровно то, что прописал человек. Новая, не предусмотренная ситуация ставит её в тупик.
  • ИИ (особенно с машинным обучением) способен обобщать на случаи, которых не было в инструкции, потому что он опирается на закономерности в данных, а не на жёсткий список «если — то».

Поэтому далеко не всё, что называют ИИ в рекламе, действительно им является. Бот, отвечающий заготовленными фразами по кнопкам, — это автоматизация, а не интеллект. Это нормально и часто полезно, просто стоит называть вещи своими именами.

Упражнение: соотнесите продукт с областью

Попробуйте сами определить, к какой области ближе каждый пример: ИИ в целом, машинное обучение (ML), глубокое обучение (DL), data science или робототехника. Иногда подходит сразу несколько — это нормально.

  1. YandexGPT отвечает на ваш вопрос связным текстом.
  2. Аналитик маркетплейса очищает данные о заказах и считает, в каком регионе выше средний чек.
  3. Доставочный ровер Яндекса объезжает пешехода на тротуаре.
  4. Антифрод банка по тысячам прошлых операций оценивает, не мошенническая ли эта оплата.
  5. Простой чат-бот на сайте отвечает по кнопкам заранее заготовленными фразами.

Разбор:

  1. Глубокое обучение (а значит, заодно ML и ИИ): большая языковая модель — это многослойная нейросеть.
  2. Data science и статистика: здесь нет обучаемой модели, есть сбор, очистка данных и выводы.
  3. Робототехника + ИИ: машина действует в физическом мире и при этом распознаёт обстановку и планирует движение.
  4. Машинное обучение: система училась на размеченных примерах прошлых операций отличать норму от мошенничества.
  5. Автоматизация по правилам, а не ИИ: бот делает ровно то, что прописал человек, и не обобщает на новые ситуации.

Проверьте себя

Короткий тест по уроку: выберите ответ и нажмите «Проверить» — увидите счёт и разбор.

Частые вопросы

Машинное обучение и искусственный интеллект — это одно и то же?

Нет. Искусственный интеллект — широкая область, а машинное обучение — один из подходов внутри неё. Любое машинное обучение относится к ИИ, но бывает и ИИ без обучения — например, системы, работающие по заранее заданным правилам.

Чем глубокое обучение отличается от машинного обучения?

Глубокое обучение — это частный случай машинного обучения, в котором используют нейросети из многих слоёв. Оно особенно хорошо справляется со сложными данными: текстом, изображениями, звуком. YandexGPT и GigaChat построены именно на глубоком обучении.

Data science — это часть искусственного интеллекта?

Скорее соседняя область, которая с ИИ пересекается. Data science — это работа с данными в целом: сбор, очистка, анализ и выводы на стыке статистики и программирования. Часть задач решают через машинное обучение, но многое делают и без обучаемых моделей.

Любой робот — это искусственный интеллект?

Нет. Робототехника — это про машины, действующие в физическом мире, и она не обязательно содержит ИИ. Манипулятор, повторяющий одно движение, обходится почти без него. А вот доставочный ровер, который сам ориентируется на улице, — это уже робототехника вместе с ИИ.


В курсе: ← Назад: Как определить искусственный интеллект · Дальше: Философия ИИ: тест Тьюринга и китайская комната →

Авторы курса: Герман Коваленко (основатель ENGRAM) и Сергей Добров.

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении