Этика ИИ, предвзятость и приватность данных¶

Коротко

ИИ не бывает «объективным сам по себе»: он впитывает то, что заложено в данных, и может незаметно переносить чужие перекосы в свои решения. В этом уроке разберём четыре главных этических риска — предвзятость, приватность, непрозрачность и размытую ответственность — и посмотрим, как они выглядят на практике. Затем перейдём к российскому контексту: закону 152-ФЗ о персональных данных, Кодексу этики в сфере ИИ и тому, почему бизнесу важно хранить данные в РФ и держать чувствительную информацию в закрытом контуре.

В прошлом уроке — можно ли предсказать будущее ИИ — мы говорили о том, что технологии трудно предсказать. Но есть вопросы, которые важны уже сегодня, независимо от того, каким будет ИИ завтра. Это вопросы о том, кому он помогает, кого может задеть и кто отвечает за его решения.

Откуда берётся предвзятость¶

Предвзятость (по-английски bias) — это систематический перекос в решениях модели, из-за которого она к одним людям или случаям относится иначе, чем к другим, без честного на то основания. Ключевое слово здесь — «систематический»: речь не о случайной ошибке, а о повторяющемся сдвиге в одну сторону.

Главный источник предвзятости — данные, на которых модель училась. Вспомните мысль из урока про виды машинного обучения: модель не придумывает закономерности из воздуха, она перенимает их из примеров. А значит, перенимает и перекосы.

Перекос может попасть в данные по-разному:

Неполная выборка. Если примеров одной группы много, а другой почти нет, модель хуже работает там, где видела мало. Система распознавания лиц, обученная в основном на одном типе внешности, чаще ошибается на остальных.
Отражение прошлых решений. Учась на исторических данных, модель впитывает и прежнюю несправедливость. Обучите систему отбора резюме на прошлых решениях компании — и она повторит старые предпочтения, даже если их пора пересмотреть.
Кривое измерение. Иногда сам способ сбора искажает картину: в одних районах сигналов собирается больше просто потому, что там плотнее датчики или активнее пользователи.

Опасность в том, что предвзятость незаметна. Программа отвечает уверенно и ровным тоном — и легко принять перекос за объективную истину. Поэтому первый навык здесь — не доверять «нейтральности» автоматического решения по умолчанию, а спрашивать: на каких данных оно построено и кого в них могло не хватить.

Важно

Предвзятость почти никогда не закладывают нарочно. Чаще это побочный эффект данных и удобных упрощений. Именно поэтому её так легко пропустить: никто не писал «дискриминируй» — перекос просочился сам.

Приватность и персональные данные¶

Современный ИИ держится на данных, и значительная их часть — про людей. Здесь в игру вступает приватность — право человека контролировать, какие сведения о нём собирают, хранят и как используют. Чем больше система о нас знает, тем удобнее сервис и тем выше цена утечки.

Особенно чувствительны персональные данные — сведения, по которым человека можно узнать: имя, телефон, геолокация, история покупок, биометрия. По отдельности они безобидны, но в сумме складываются в подробный портрет.

Хороший пример — распознавание лиц. Технология удобна: оплата по лицу на турникете в метро (FacePay), вход без пропуска, поиск пропавших. Но лицо — это биометрия, которую, в отличие от пароля, нельзя сменить после утечки. Поэтому к таким данным нужны особые требования: понятная цель сбора, ограниченный доступ, надёжное хранение и возможность отказаться.

Этичный подход к приватности строится на нескольких простых принципах:

Минимизация. Собирать только то, что нужно для задачи, а не «на всякий случай».
Прозрачность. Человек понимает, какие данные о нём берут и зачем.
Согласие и контроль. У пользователя есть возможность согласиться, отказаться и удалить данные.
Защита. Данные хранятся безопасно, а доступ к ним ограничен.

Прозрачность и объяснимость решений¶

Допустим, ИИ-сервис отказал в кредите, не пропустил платёж или отклонил заявку. Естественный вопрос человека — «почему?». И вот тут возникает сложность: многие современные модели работают как «чёрный ящик».

Объяснимость — это свойство системы давать понятную человеку причину своего решения, а не только сам ответ. Простые методы вроде спам-фильтра объяснить легко: видно, какие слова перевесили. А вот большие нейросети принимают решение через миллионы внутренних весов, и короткой человеческой причины там может просто не быть.

Почему это важно с точки зрения этики:

Без объяснения человек не может оспорить несправедливое решение.
Без объяснения трудно заметить ту самую предвзятость и вовремя её исправить.
Без объяснения сложно доверять системе в чувствительных областях — медицине, финансах, праве.

Поэтому в ответственных сценариях ценят не только точность, но и прозрачность: возможность показать, какие факторы повлияли на вывод. Иногда ради объяснимости осознанно выбирают модель попроще — лучше понятное решение, которое можно проверить, чем чуть более точный, но непрозрачный ответ.

Попробуйте на практике

ENGRAM — это ваш собственный ИИ-ассистент, обученный на ваших документах: он отвечает на вопросы и даёт ссылку на источник, из которого взял ответ, — это и есть объяснимость на практике. Данные при этом хранятся в России и в вашем закрытом контуре. Посмотреть, как это работает, можно на en-gram.ru.

Ответственность: решение остаётся за человеком¶

У этого урока есть стержневая мысль: ИИ — инструмент, а ответственность за последствия несёт человек. Модель не субъект права: она не может отвечать за отказ в услуге или ошибочный диагноз — отвечают те, кто её создал, внедрил и применил.

Отсюда практический принцип: человек в контуре принятия решений. В важных вопросах ИИ выступает помощником, а финальное слово остаётся за специалистом. Вспомните пример из главы про машинное обучение: модель подсказывает врачу, куда посмотреть на снимке, но диагноз ставит врач. Так удобство автоматизации сочетается с человеческой ответственностью.

Это не значит, что ИИ нельзя доверять рутину. Антифрод банка отклоняет подозрительные операции автоматически, и это нормально — цена ошибки невелика и поправима. Но чем серьёзнее последствия для человека, тем важнее, чтобы за решением стоял тот, кто может его объяснить и за него ответить.

Российский контекст: 152-ФЗ и Кодекс этики¶

В России работа с данными и ИИ опирается на несколько ориентиров — закон и добровольные правила.

152-ФЗ — это федеральный закон «О персональных данных», основной документ, который регулирует, как в России можно собирать, хранить и обрабатывать сведения о людях. Если упростить, он требует от компаний понятной цели обработки, согласия человека там, где оно нужно, и бережного отношения к данным. Отдельное практическое требование закона — хранить персональные данные россиян на серверах в РФ. Поэтому серьёзный бизнес размещает базы внутри страны, а не где придётся.

Рядом с законом существует Кодекс этики в сфере ИИ — добровольный свод принципов для российских компаний и разработчиков. Он не заменяет закон, а дополняет его ориентирами: человек важнее технологии, решения должны быть прозрачными, ответственность лежит на людях, а к данным нужно относиться бережно. К Кодексу присоединились многие крупные российские технологические компании и научные организации.

Для бизнеса из этого вытекает понятная инженерная задача — закрытый контур: чувствительные данные не уходят во внешние публичные сервисы, а обрабатываются внутри собственной защищённой среды. Это снижает риск утечки, помогает соблюсти 152-ФЗ и сохраняет контроль над тем, кто и зачем видит информацию.

Пример: внедряем ИИ-помощника в компании по правилам

Допустим, российская компания хочет дать сотрудникам ИИ-ассистента по внутренним документам — регламентам, договорам, базе знаний. Этичный и законный путь выглядит так: данные остаются на серверах в РФ (требование 152-ФЗ), ассистент работает в закрытом контуре и не отправляет документы наружу, в ответах он показывает ссылку на источник (объяснимость), а в спорных случаях финальное решение принимает человек (ответственность). Получается удобно, но без потери контроля над данными и без слепого доверия к «чёрному ящику».

Упражнение¶

Упражнение: найдите источник предвзятости и предложите, как его снизить

Кейс. Сеть пунктов выдачи нанимает сотрудников. Чтобы ускорить отбор, компания обучает ИИ-модель на резюме тех, кого брали на работу за последние годы, — модель должна предсказывать «перспективных» кандидатов. После запуска выясняется: система почти всегда отсеивает соискателей старшего возраста и тех, у кого в резюме нетипичный карьерный путь.

Сначала подумайте сами: откуда здесь взялся перекос и что можно сделать? Потом разверните разбор.

Разбор.

Источник предвзятости. Модель училась на исторических решениях компании. Если раньше брали в основном молодых кандидатов с «классическими» биографиями, модель восприняла это как признак успеха и стала воспроизводить старый перекос. Никто не закладывал дискриминацию намеренно — система просто скопировала прошлое, включая его несправедливость.

Как снизить. Несколько практических шагов:

Убрать или обезличить признаки, которые не относятся к работе напрямую (возраст, пол), и проверить, не «протекают» ли они через косвенные данные.
Дополнить обучающую выборку примерами разных кандидатов, чтобы модель видела не только привычный профиль.
Регулярно проверять решения модели по группам: одинаково ли она относится к разным людям при схожей квалификации.
Оставить человека в контуре: модель лишь ранжирует и подсказывает, а финальное решение по спорным резюме принимает рекрутер.

Главный вывод: «модель сама так решила» — не оправдание. За справедливость отбора отвечает компания, которая её внедрила.

Проверьте себя¶

Короткий тест по уроку: выберите ответ и нажмите «Проверить» — увидите счёт и разбор.

Частые вопросы¶

Что такое предвзятость (bias) в ИИ простыми словами?

Это систематический перекос в решениях модели, из-за которого она относится к одним людям или случаям иначе, чем к другим, без честного основания. Чаще всего перекос приходит из данных: модель перенимает то, что в них заложено, включая прошлую несправедливость и неполноту выборки. Поэтому важно проверять, на каких данных училась система и кого в них могло не хватить.

Зачем хранить данные в России и что требует 152-ФЗ?

152-ФЗ — это закон «О персональных данных», который регулирует сбор и обработку сведений о людях в России. Среди прочего он требует хранить персональные данные россиян на серверах в РФ, иметь понятную цель обработки и согласие там, где оно необходимо. Для бизнеса это означает размещать базы внутри страны и бережно обращаться с личной информацией.

Чем отличается Кодекс этики в сфере ИИ от закона?

Закон обязателен, а Кодекс этики в сфере ИИ — добровольный свод принципов. Закон (например, 152-ФЗ) устанавливает обязательные правила работы с данными, а Кодекс задаёт ориентиры: человек важнее технологии, решения прозрачны, ответственность лежит на людях. Кодекс не заменяет закон, а дополняет его, и к нему присоединились многие крупные российские компании.

Если ИИ принял неверное решение, кто за это отвечает?

Отвечает человек, а не программа: модель — инструмент и юридически ответственность нести не может. За последствия отвечают те, кто систему создал, внедрил и применил. Поэтому в важных вопросах ИИ оставляют в роли помощника, а финальное решение сохраняют за специалистом.

В курсе: ← Назад: Можно ли предсказать будущее ИИ · Дальше: ИИ, работа и общество: что нас ждёт →

Авторы курса: Герман Коваленко (основатель ENGRAM) и Сергей Добров.

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно