Как ИИ меняет будущее медицины

НачалоО спикереИстория развития ИИ в биологииИИ в области биомедициныРазработка и вывод лекарстваЗаключение

Исполнительный вице-президент по науке и технологиям Zephyr AI Андрей Чурсов расскажет о том, как развивался ИИ в сфере биомедицины, какое будущее ждёт медицинские сервисы на базе искусственного интеллекта и как ИИ поможет в разработке лекарств.

Изначально Андрей учился в МФТИ и изучал анализ данных и машинное обучение в Школе анализа данных Яндекса, которую окончил в 2009 году. Затем в Яндексе разрабатывал алгоритмы для улучшения поиска. Спустя какое-то время ему предложили сменить фокус деятельности и заниматься биомедициной. По мнению спикера, фундаментальное техническое образование и понимание математики, статистики, а также умение анализировать данные и программировать помогают решать задачи в области биологии и медицины.

Андрей уехал в Германию получать докторскую степень по биоинформатике и вычислительной биологии в Техническом университете Мюнхена.

Разработки в области ИИ начались в середине XX века: в 1950 году был придуман тест Тьюринга, а в 1956-м Джон Маккарти придумал термин «искусственный интеллект». Дальше были широко обсуждаемые события: например, победа Deep Blue над Гарри Каспаровым в шахматном матче и создание системы Watson.

Однако глобальных прорывов, связанных в ИИ, в области биологии и медицины не было. Машинное обучение и ИИ пытались применить для разработки систем диагностики бактериальных инфекций и общих заболеваний, но глобально ИИ в клинической практике не распространялся. Это происходило потому, что отсутствовал большой массив данных для тренировки различных моделей. Также не было технологий, которые позволяли бы заглянуть внутрь клетки и качественно изучить её строение.

За все функции организма отвечает геномный код, который зашит в молекуле ДНК. В 1977 году Фредерик Сэнгер смог извлечь и начать расшифровывать молекулу ДНК из клетки. Но в инструмент загружалась одна очень длинная молекула ДНК. Расшифровка одного генома человека занимала десять лет, стоила $3 млрд и требовала нескольких сотен инструментов и научных сотрудников для работы с ними.

В 2007–2008 гг. на рынок поступили новые поколения приборов. До начала расшифровки в них молекула ДНК разрезалась на миллионы маленьких кусочков, которые затем загружались в один инструмент.

Инструмент мог расшифровать одновременно миллионы фрагментов ДНК, поэтому процесс стал занимать всего две недели. Теперь для расшифровки генома требовался один инструмент и научный сотрудник, который умел им оперировать.

В результате за пару лет стоимость расшифровки генома упала на несколько порядков, до $5–10 тыс. С 2008–2009 гг. генерация новых данных начала экспоненциально расти, потому что все учёные стали использовать их для исследования клетки и различных заболеваний.

Исходя из числа данных и количества участников исследования можно сделать вывод, что в области биотехнологий и фармацевтики может быть сгенерирован достаточно большой общий объём данных.

Число данных. Один прогон инструмента для расшифровки генома генерирует на выходе около 500 ГБ данных, которые представляют собой единственный датапойнт. Именно поэтому фармацевтические компании пытаются оптимизировать процессы и расшифровывать только часть генома, которая, по их мнению, была бы важна для решения конкретной задачи. Когда они внутри генома сужают спектр, который пытаются расшифровывать, вариация данных на выходе оказывается в диапазоне от 500 МБ до 20 ГБ.

Число участников исследований. В клиническом исследовании вакцины против COVID-19 от Pfizer участвовало более 40 тыс. человек. Но это скорее исключение. Если брать усреднённые числа, можно сказать, что в первой стадии клинических исследований участвуют несколько десятков человек, во второй — пара сотен, в третьей — до нескольких тысяч.

При этом полученные данные имеют свои особенности:

  • Разреженность. Датапойнтов мало, в итоге данные выглядят разреженными. Это влияет на то, какие методы используются для анализа данных.
  • Приватность и этичность. Данные связаны со здоровьем человека, поэтому об их чувствительности заботятся регуляторные органы, которые занимаются выдачей разрешений на применение различных систем в клинической практике. За последние десять лет количество новых геномных данных продолжает экспоненциально увеличиваться и растёт скорость их генерации.

Количество систем с ИИ, которые поступили на рынок в области биомедицины, за последние шесть лет выросло и составило около 700. Но на конец 2023 года ни одна из поступивших систем не содержит в себе генеративных моделей или больших языковых моделей. Ожидается, что такие системы появятся в будущем.

Посмотрим, как искусственный интеллект развивался в области биомедицины за последние десять лет и какого рода приложения вышли на рынок.

ИИ в области биомедицины в 2010–2023 гг. Новая волна развития искусственного интеллекта началась примерно в 2011–2012 гг.

В 2011 году Apple выпустила голосового помощника Siri, в 2012 году AlexNet выиграл конкурс по классификации изображений ImageNet. Это пробудило интерес к ИИ во всех сферах. В 2012–2014 гг. появляются первые компании, бизнес-модель которых основана на применении искусственного интеллекта для дизайна и разработки новых лекарственных препаратов.

Технологические достижения применяются в биологии и медицине с достаточно большой задержкой. Например, первая система, которая диагностирует заболевания по анализу изображения, поступила на рынок только через пять лет после победы AlexNet в конкурсе ImageNet.

Все технологические прорывы в различных областях, например в сфере обработки естественного языка или компьютерного зрения, так или иначе находят применение в биомедицине. Например, создание чат-ботов или голосовых помощников переходит в итоге в разработку анализа историй болезни пациентов и помощь по уходу за пациентами. Разработки в системах компьютерного зрения используются для создания систем диагностики заболеваний по медицинским изображениям. Научные применения моделирования микромира, такие как исследования в области физики элементарных частиц, находят применение в дизайне и разработке новых лекарственных препаратов.

Если вы уже понимаете инженерно-технологические аспекты одного из этих направлений, то легко можете переключить свои навыки для того, чтобы продуктивно решать биомедицинские задачи и двигать науку и медицину вперёд.

В конце 2023 года разработка и вывод одного нового лекарственного препарата на рынок занимает в среднем 12–14 лет и стоит примерно $2,3 млрд. С каждым годом стоимость продолжает расти.

Стадии разработки лекарственного препарата.

  1. Поиск мишени. Мишень — то, что отвечает за появление и развитие заболевания. С помощью лекарственного препарата компания, которая занимается его разработкой, будет пытаться атаковать мишень.

    ИИ применяется для анализа текстов научных статей, патентов и историй болезни, чтобы идентифицировать новую мишень.

  2. Создание (дизайн) препарата. Это очень объёмная, а также самая сложная и рискованная стадия, потому что на ней происходит скрининг и анализ сотен тысяч различных химических соединений.

    ИИ начинает применяться для дизайна молекулы с заранее заданными свойствами и прогнозирования потенциальной токсичности новой молекулы в организме человека.

  3. Доклинические исследования. На этой стадии мы синтезируем препараты и исследуем их эффективность и токсичность на животных — например, на мышах и крысах. Кандидаты, которые успешно прошли это испытание, переходят в клинические исследования на людях.

  4. Первая фаза клинических исследований. На небольшой когорте пациентов исследуется токсичность и потенциальные нежелательные эффекты препарата.

  5. Вторая фаза клинических исследований. Исследуется эффективность этого препарата на когорте пациентов побольше.

  6. Третья фаза клинических исследований. На когорте пациентов от нескольких сотен до нескольких тысяч сравниваем эффективность нового препарата против стандартных методов лечения, которые в данный момент используются в клинической практике. Смотрим, какой из них наиболее действенный.

    На клинической стадии (пункты 4–6 выше) ИИ применяется для:

    • Оптимизации клинических исследований
    • Поиска пациентов, для которых новый препарат будет наиболее эффективен
    • Поиска и рекомендации пациенту клинического исследования, которое проводится в момент его обращения к врачу. Это нужно, если человеку не помогают существующие на рынке методы решения

  7. Регистрация. Если все три фазы клинических исследований прошли успешно, можно регистрировать препарат в регуляторных органах и начинать его коммерциализацию.

    После регистрации препарата ИИ применяется для выбора оптимальных методов лечения. Например, для комбинирования различных препаратов или расширения спектра использования уже имеющихся препаратов, когда за счёт анализа исторических и клинических данных получается найти новую когорту пациентов, которым тоже поможет препарат.

  8. Четвёртая фаза клинических исследований. Исследуем долгосрочные эффекты препарата на функции организма, например долгосрочную токсичность.

    С помощью ИИ хотелось бы сократить время разработки лекарственных препаратов с 12–14 до 4–5 лет. ИИ начинает применяться на каждой стадии, но это только начало его распространения в биомедицине. Также, по оценкам агентств, размер рынка ИИ в биомедицине в 2021 году составлял $11 млрд, а к 2030 году должен вырасти до $190 млрд — это важный финансовый компонент.

Действия, которые могут помочь уменьшить длительность этапов разработки лекарств:

  • Разработка персонализированных методов лечения. На сегодняшний день, если у разных фармацевтических компаний есть препараты с похожими механизмами действия, врач не знает, какой из них будет наиболее эффективным для конкретного пациента. Можно использовать ИИ для того, чтобы подбирать для него наиболее оптимальный метод лечения на основании генетического профиля пациента. Этим занимается Zephyr AI.
  • Генерация синтетических данных для тренировки и оптимизации моделей. Поскольку датапойнтов мало, данных может быть недостаточно для тренировки очень перспективных моделей. Именно поэтому генерация новых данных, которые могли бы имитировать вероятностное распределение как в реальной жизни, очень поможет с тренировкой новых моделей для решения разных задач.
  • Разработка и использование цифровых двойников. Цифровые двойники — виртуальные системы, которые могут хорошо симулировать процессы живых систем.
  • Проведение виртуальных клинических исследований на основании исторических данных из клинической практики. На основании анализа имеющихся данных, которые получены из клинической практики либо от страховой компании, мы можем моделировать оптимальный выбор новых методов лечения для конкретных людей и увеличить спектр применимости существующих препаратов.

Хочется отметить несколько моментов:

  • Техническому человеку можно прийти в биомедицину, даже не имея изначально биологического образования. Однако наличие биологического образования сильно облегчает дальнейшее развитие в этой области
  • Экспоненциальный рост количества биомедицинских данных будет только ускоряться
  • Эра ИИ в биомедицине только начинается
  • Проектирование и разработка новых лекарств с помощью ИИ — одно из наиболее привлекательных применений

Системы диагностики не избавят людей от заболеваний, с которыми нужно продолжать бороться. Для этого, а также чтобы жить дольше и счастливее, нужны новые лекарственные препараты. Проектирование и разработка новых лекарственных препаратов — одно из наиболее перспективных применений ИИ.

Поделитесь увиденным

Скопировать ссылку
ТелеграмВКонтакте