Искусственные нейронные сети предсказывают возраст пациента по анализу крови
Дата публикации: 24.05.2016
Группа ученых из США и России, в которую вошел аспирант, сотрудник кафедры информационных систем Университета ИТМО (Санкт-Петербург) Евгений Путин, обучила глубокие нейронные сети определять возраст человека по анализу крови. На основе разработанного алгоритма создан веб-сервис Aging.ai. Он позволяет самостоятельно узнать свой возраст, введя результаты биохимического теста. Возможно, в дальнейшем будет добавлена функция отслеживания состояния организма, которая сделает мониторинг здоровья более наглядным и увлекательным. Результаты исследования опубликованы в журнале Aging.
Кровь может многое рассказать о человеке, его образе жизни, питании, даже о характере. Биохимический анализ крови может помочь обнаружить проблему прежде, чем она станет патологией. Анализ биомедицинских данных – именно та область, в которой алгоритмы машинного обучения сейчас применяются особенно активно.
Веб-сервис Aging.ai – это побочный продукт масштабного научного исследования процессов старения, призванный наглядно показать общественности, насколько важно регулярно сдавать анализ крови.
«У нашей работы две цели, – рассказывает главный разработчик системы машинного обучения, сотрудник Международной научной лаборатории "Компьютерные технологии" Университета ИТМО Евгений Путин, – Во-первых, это превращение процесса сдачи анализа крови в своего рода игру. Если это будет востребовано, в перспективе мы бы хотели добавить в сервис дополнительный функционал, чтобы каждый человек мог легко отслеживать изменения биохимических параметров. Во-вторых, это демонстрация того, что по самому простому и распространенному типу лабораторных тестов, биохимии, можно успешно предсказывать человеческий возраст. Это еще на один шаг приближает нас к персонализированной медицине будущего».
Курс на персонализацию медицина взяла сравнительно недавно, но в контексте бурного развития генной инженерии это направление очень актуально. Более того, мы всё больше уходим в сторону упредительной терапии, основанной на предсказании и заблаговременном предотвращении заболеваний.
Исследуя механизмы старения, ученые планируют расширить область обучения нейронных сетей. Сами по себе биохимические маркеры не дают информации о потенциальных заболеваниях, но в купе с эпигенетическими, транскриптомными, биометрическими данными способны стать основой доступных «умных» приложений, которые, как будильник, будут предупреждать о развитии патологий, болезней и вовремя подсказывать нам, на что следует обратить внимание.
Результаты работы нейросетей по выделению маркеров старения могут дать фармацевтическим кампаниям информацию о том, в каком направлении двигаться, чтобы создать препараты для замедления процесса старения.
«Сейчас нет четкого объяснения, почему мы стареем, – говорит Евгений Путин. – Существует мнение, что старение – это болезнь. Ученые находят множество подтверждений тому, что мы можем жить гораздо дольше».
Глубокое машинное обучение позволит разрабатывать более эффективные лекарства и в разы сократить сроки их создания, поскольку многие экспериментальные стадии можно будет проработать с использованием математического моделирования. Сейчас же синтез и испытания лекарств в среднем занимают 10-20 лет.
Год назад появился веб-сервис для предсказания возраста по фото How-Old.net. Как раз он и вдохновил ученых на создание новой системы: оба подхода имеют один и тот же математический аппарат.
«Биохимический тест содержит в себе гораздо меньше информации о возрасте человека в отличие от портретных фотографий, ведь уже сейчас есть технологии определения эмоций, морщинок, фонем по движению губ, не говоря уже о поле и возрасте. Поэтому мы считаем большим успехом высокую точность полученных нами результатов. Она обеспечена главным образом тем, что мы использовали глубокие нейронные сети, которые в данной задаче оказались более эффективны по сравнению с другими алгоритмами машинного обучения», – отмечает разработчик.
Обрабатывая результаты тестов крови, ученые выделили пять наиболее значимых биологических маркеров: альбумин, глюкозу, мочевину, алкаин и эритроциты. В веб-сервисе представлено больше – десять. При таком количестве биомаркеров нейронные сети определяют возраст с точностью 70%. Увеличив количество параметров до 41, исследователи достигли 83,5% точности.
Ученые независимо обучили 21 нейронную сеть с различной топологической структурой, а затем объединили их в одну общую модель. Исследователи показали, что такое количество сетей полностью обеспечивает имеющуюся точность, и увеличить ее можно только за счет расширения объема данных или количества параметров.
Исследования инициированы компанией Insilico Medicine (Университет Джона Хопкинса, Балтимор, США). Это ведущая компания в области разработки искусственного интеллекта для решения задач, связанных со старением. Ее цель – увеличить продолжительность жизни человека.
Данные лабораторных анализов для обучения нейронных сетей были предоставлены крупнейшей независимой диагностической лабораторией в Восточной Европе ИНВИТРО. Так, на обучение нейросетей потребовалось 56 тысяч образцов и еще 6 200 – на тестирование.
Сотрудники Лаборатории компьютерных технологий Университета ИТМО вовлечены в международное сотрудничество как в области искусственного интеллекта, так и биоинформатики. Для повышения профессионализма студентов и аспирантов на базе лаборатории создан кружок по машинному обучению, в рамках которого регулярно проводятся мастер-классы и тренировки по решению прикладных задач с Kaggle.
Статья: «Deep biomarkers of human aging: Application of deep neural networks to biomarker development», Evgeny Putin et al. Aging, May 18, 2016.
Тамара Беседина,
Отдел по научным коммуникациям Университета ИТМО