Принципиальное новшество в оценке рисков ИИ состоит в том, что LLM модели могут имитировать мыслительный процесс включая и психические отклонения от ожидаемого поведения. Нам придется немного побыть психологами чтобы понять, что делать с этим:
1) Манипуляция логикой и взлом через использование текстовых команд. Психологическая атака на алгоритм может привести к тому, что модель начнет игнорировать правила безопасности.
2) Отравление знаний. Внедрение знаний на этапе обучения, чтобы изменить логику поведения модели. Если мы проспали период начального обучения модели, то скорректировать предвзятую логику модели может не получиться. Или, что более вероятно, мы можем не заметить подмену источников в базе знаний при использовании RAG и получить аналогичный эффект.
3) Кризис доверия из-за отсутствия понимания что внутри. В ВУЗе всех нас учили решать задачи, как перемножить матрицы с десятками параметров. Но понимание принципа не позволяет охватить смыслы произведений матриц размерностью в миллиарды. Подозреваю, что даже разработчики моделей не смогут заранее понять и предсказать все нюансы того, «что может пойти не так», когда обрабатываются такие объемы данных, которые даже сложно представить. Можно ли доверить такой системе единоличное принятие решений? В медицине и ряде отраслей, где от этого напрямую зависит наша жизнь, наверное — нет.
И, на мой взгляд, главная проблема сегодня — человеческий фактор. Низкая цифровая грамотность в эпоху ИИ — это прямой путь к утечкам. Ведь даже для того, чтобы соблюдать правила требований по работе с ИИ, их нужно для начала научиться понимать. Прямой запрет не сработает, ведь для пользователя окно общения с чат-ботом и строка ввода запроса в поисковике идентичны. Тем более, что поисковики сами стали подключать ИИ помощников.
Сегодня каждый работник использует ИИ. И для личных целей, и для рабочих. От таких возможностей просто невозможно отказаться. Этот феномен уже получил название «Теневой ИИ». Публичный чат-бот моментально может составить нужную вам аналитику на основе предоставленной таблицы. А расплатой за такое удобство становится доступность корпоративных данных потенциально всем, ведь как только вы это сделали, то ваши данные попали в обучающую выборку разработчиков ИИ.
И этот риск, на мой взгляд, даже опаснее предыдущих трех вместе взятых. Поэтому, чтобы самая дорогая защита не оказалась бесполезной, жесткий комплаенс использования ИИ должен начинаться с обучения сотрудников основам взаимодействия с ИИ и понимания «как это работает» и базовым знаниям для понимания «как это устроено внутри».