Компания OpenAI объявила о запуске GPT-Rosalind — новой модели искусственного интеллекта, нацеленной на поддержку научных исследований в биологии, разработку лекарств и развитие трансляционной медицины. Идея проекта — помочь исследователям быстрее проходить сложные этапы от выбора мишени до практических результатов, где обычные вычисления и работа с данными требуют много времени и экспертного внимания.
Зачем нужна GPT-Rosalind и что в ней «заточено»
GPT-Rosalind создана специально под научные процессы. В отличие от универсальных чат-ботов, модель оптимизируют для рабочих сценариев, где важны не только ответы в текстовом виде, но и применение инструментов и логики исследования. OpenAI подчеркивает, что система совмещает «использование инструментов» с пониманием в нескольких областях сразу — от химии и инженерии белков до геномики.
Отдельно компания обращает внимание на масштаб временных затрат в фармразработке. На практике путь от обнаружения перспективной мишени до получения регуляторного одобрения для нового препарата в Соединенных Штатах часто занимает около 10–15 лет. Именно такие длинные циклы и призвана частично «сжимать» интеллектуальная поддержка на отдельных стадиях.
Доступ к модели: для кого и в каких форматах
На первом этапе GPT-Rosalind будет доступна как исследовательская версия (research preview). Воспользоваться ей можно будет в ChatGPT, в инструментах Codex, а также через API — но только для квалифицированных клиентов, подключаемых через программу OpenAI trusted access.
Кроме того, OpenAI представила Life Sciences research plugin для Codex. Плагин задуман как способ «подключить» модель к более чем 50 научным инструментам и источникам данных. Такой подход обычно помогает связывать генерацию идей и текстов с прикладными вычислениями, анализом и проверяемыми данными, которые используются в лабораторной и исследовательской практике.
Кто участвует в внедрении
OpenAI работает с компаниями и научными организациями, чтобы апробировать GPT-Rosalind в реальных исследовательских цепочках. В числе партнеров названы Amgen (NASDAQ:AMGN), Moderna (NASDAQ:MRNA), Allen Institute и Thermo Fisher Scientific.
Модель получила название в честь Розалинды Франклин (Rosalind Franklin) — ученой, чьи исследования помогли раскрыть структуру ДНК. В контексте проекта это символическая отсылка к тому, как фундаментальные биологические знания становятся основой для прикладных прорывов в науке и медицине.
Как оценивают качество: BixBench и LABBench2
Производительность GPT-Rosalind проверяли на нескольких тестовых наборах. На BixBench — бенчмарке, ориентированном на биоинформатику и анализ данных — модель показала 0.751 pass rate. Этот показатель в таких тестах обычно отражает долю корректных прохождений заданий в рамках методик, связанных с обработкой биологических данных.
На LABBench2, который оценивает выполнение исследовательских задач (включая поиск информации в литературе и проектирование протоколов), модель обошла GPT-5.4 в 6 случаях из 11. Для понимания контекста: протоколы в биомедицинских исследованиях — это детальные пошаговые инструкции, и ошибки здесь могут иметь серьезные последствия, поэтому качество «практической» генерации текста критично.
Партнерство с Dyno Therapeutics: предсказание «РНК → функция»
Отдельный эксперимент проводился в сотрудничестве с Dyno Therapeutics. В этой оценке GPT-Rosalind анализировала задачу прогнозирования функции по РНК-последовательности (RNA sequence-to-function prediction), используя последовательности, которые не были опубликованы.
Как заявлено, лучшие из десяти (best-of-ten) представленных моделью вариантов ранжировались выше 95-го процентиля по сравнению с человеческими экспертами на задаче предсказания и примерно на уровне 84-го процентиля на задаче генерации последовательностей. Проще говоря, модель показывала результаты, которые статистически опережали значительную часть профессиональных оценок, хотя итоговая точность зависит от типа подзадачи.
Условия запуска: trusted access и требования к компаниям
Запуск GPT-Rosalind будет организован через структуру trusted-access для квалифицированных клиентов Enterprise в США. Это означает, что доступ предоставляется не «всем подряд», а организациям, которые соответствуют требованиям по контролю рисков и управлению безопасностью.
Согласно заявлению компании, пользователи должны вести научные исследования с общественной пользой, а также поддерживать механизмы governance и safety oversight — то есть внутренние контуры управления и надзора за безопасностью и корректностью применения технологий.
