Крупнейшие технологические игроки — Microsoft, Google (контролируемая Alphabet), а также xAI, основанная Илоном Маском, — договорились с американскими структурами о раннем доступе к новым моделям искусственного интеллекта до их публичного релиза. Такая схема будет использоваться для предварительной оценки рисков, связанных с национальной безопасностью, прежде чем системы попадут в открытый доступ.
Что предусматривает новое соглашение
Во вторник Центр по стандартам и инновациям в области ИИ (Center for AI Standards and Innovation, CAISI) при Министерстве торговли США объявил о запуске договорённостей, позволяющих ведомству оценивать модели на более ранней стадии разработки. Под “ранним доступом” в данном случае понимается возможность протестировать и изучить возможности ИИ до того, как разработчики выпустят продукты широкой аудитории.
Цель — не просто формально проверить технологии, а провести исследовательскую работу в рамках безопасности: оценить характеристики моделей и потенциальные угрозы, включая сценарии злоупотребления.
Почему вопрос безопасности ИИ снова оказался в фокусе
Последние месяцы вокруг передовых ИИ-систем усилились обсуждения их возможного влияния на киберугрозы. В частности, появление более продвинутых разработок, среди которых упоминается Mythos от Anthropic, стало причиной обеспокоенности со стороны представителей властей и бизнеса.
Ключевой страх заключается в том, что мощные модели могут быть использованы не только в легальных и полезных целях, но и для ускорения или усложнения атак — например, для подготовки вредоносных действий, повышения эффективности фишинга либо поддержки “инженерии” атак.
Зачем нужна независимая оценка
Директор CAISI Крис Фолл подчеркнул, что независимая “измерительная наука” (independent measurement science) критически важна, чтобы корректно понимать, что именно умеют системы уровня frontier AI — то есть модели, находящиеся на переднем крае технологий.
Под “национальной безопасностью” в этом контексте подразумевается широкий набор рисков: от потенциальных возможностей по масштабированию вредоносной деятельности до утечек данных и непредсказуемости поведения ИИ в чувствительных сценариях.
Как работает CAISI и сколько проверок уже сделано
CAISI позиционируется как ключевой государственный центр, через который проходят проверки моделей ИИ для оценки их параметров и возможных угроз. Сообщается, что к настоящему моменту центр завершил более 40 оценок.
Важно, что часть тестов проводилась на моделях, которые ещё не были доступны широкой публике. Это означает, что ведомство получает возможность анализировать системы “до релиза”, то есть в момент, когда разработчики ещё могут предоставлять необходимые материалы для проверки.
О чём речь с “снятием ограничителей”
В агентстве также пояснили, что разработчики могут передавать в центр версии моделей, в которых убраны защитные механизмы — так называемые safety guardrails. Под этим термином обычно понимают встроенные ограничения, которые должны снижать вероятность опасного использования: например, запреты на генерацию определённых инструкций или снижение вредоносных запросов.
Смысл процедуры в том, что специалисты центра должны увидеть, какие риски проявляются при отсутствии защитных барьеров, чтобы затем оценить, насколько вероятны злоупотребления и какие меры контроля нужны для предотвращения угроз.
Что происходило на прошлой неделе в оборонной сфере
Дополнительный контекст даёт объявление, сделанное неделей ранее. Тогда Пентагон сообщил о соглашениях с семью компаниями, чтобы задействовать их решения на классифицированных сетях Министерства обороны США. Ведомство таким образом стремится расширить круг поставщиков ИИ, задействованных в военных структурах.
Почему это важно
-
Ранний доступ к моделям позволяет оценивать угрозы до того, как технологии станут массовыми.
-
Независимые тесты и “измерительная наука” помогают снизить риск самооценки разработчиков и выявить уязвимости в поведении систем.
-
Использование версий без защитных ограничителей даёт возможность понять пределы контроля и вероятность злоупотреблений.
