Глибокі біомаркери старіння людини: Застосування глибоких нейронних мереж для розвитку біомаркерів

Євген Путін

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

2 Лабораторія комп’ютерних технологій, Університет ІТМО, Санкт-Петербург 197101, Росія

Поліна Мамошина

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

3 Фонд досліджень біогеронтології, Оксфорд, Великобританія

Олександр Аліпер

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

Михайло Корзінкін

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

Олексій Москалєв

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

4 Школа системної біології, Університет Джорджа Мейсона (GMU), Ферфакс, штат Вірджинія 22030, США

Олексій Колосов

5 Invitro Laboratory, Ltd, Москва 125047, Росія

Олександр Островський

5 Invitro Laboratory, Ltd, Москва 125047, Росія

Чарльз Кантор

6 Кафедра біомедичної інженерії, Бостонський університет, Бостон, Массачусетс 02215, США

Ян Війг

7 Відділ генетики Медичного коледжу імені Альберта Ейнштейна, Бронкс, Нью-Йорк 10461, США

Олексій Жаворонков

1 Pharma.AI Department, Insilico Medicine, Inc, Балтимор, MD 21218, США

3 Фонд досліджень біогеронтології, Оксфорд, Великобританія

Пов’язані дані

Анотація

ВСТУП

Однак більшість з цих біомаркерів не є репрезентативними для стану здоров’я всього організму або окремих систем, і їх не легко виміряти або націлити за допомогою відомих втручань. Загальний біохімічний тест крові - один з найпростіших тестів, що використовується лікарями для вивчення стану здоров’я пацієнтів. Хоча деякі маркери біохімії крові мають дуже різну природу, є чутливими показниками різних станів, таких як запалення та навіть алкоголізм, і схвалені для клінічного застосування [13, 14].

Методи машинного навчання (ML), такі як машини з підтримкою векторів (SVM), зазвичай використовуються при розробці біомаркерів [15], а швидке збільшення розмічених даних забезпечує глибокі нейронні мережі (DNN). Методи, засновані на глибоких архітектурах, перевершили класичні підходи не тільки в аналізі зображень, але й у вирішенні широкого кола проблем геноміки, транскриптоміки та протеоміки [16].

У цьому дослідженні ми застосовуємо методику глибокого навчання для прогнозування хронологічного віку людини, яка використовує безліч DNN, складених в ансамбль і підготовлених до десятків тисяч зразків біохімії крові пацієнтів, які проходять регулярні фізичні обстеження. Потім ми використовуємо спеціальну реалізацію техніки важливості перестановки (PFI) [17], щоб оцінити відносну важливість кожного маркера біохімії крові для точності ансамблю. Ми також проаналізували продуктивність та точність 40 архітектур DNN, оптимізованих за допомогою різноманітних оптимізаторів, визначили найкращі DNN та відібрали 21 DNN, які сукупно забезпечували вищу точність та R 2 як ансамбль, ніж найкращий DNN в ансамблі.

РЕЗУЛЬТАТИ

Для проведення цього дослідження ми отримали набір із 62 419 анонімних записів біохімії крові, де кожен запис складається з віку людини, статі та 46 стандартизованих маркерів крові завдяки співпраці з однією з найбільших лабораторних мереж Росії, Invitro Laboratory, Ltd. Ми прагнули отримати дані з достатньо здорового населення. Хоча ми не мали доступу до записів пацієнтів, ми відбирали лише аналізи крові з рутинних перевірок стану здоров'я, уникаючи очевидних джерел нездорових пацієнтів, таких як лікарні, а за допомогою статистичного аналізу пропускали аналізи крові з викидами.

Узагальнений конвеєр проекту зображений на рисунку Рисунок 1. 1. По-перше, ми попередньо обробили набір даних аналізу крові, виключивши високо упереджені маркери з контрольних діапазонів, нормалізуючи їх для тренування DNN та видаливши викиди (детальніше див. Методи). Отриманий набір даних був розділений на навчальний та тестовий набори, що складалися з 56 177 та 6242 зразків, відповідно. Тоді 40 різних DNN пройшли навчання на 56177 зразках крові.

застосування

Лабораторні набори біохімічних даних крові були нормалізовані та очищені від викидів та деяких аномальних маркерів. Для прогнозування біологічного віку в ансамблі на основі моделі ElasticNet було об’єднано 21 різні DNN з різними параметрами. Для біологічного прогнозування статі навчали одиноких DNN.

Оскільки ми розглядали вікове прогнозування людини як проблему регресії, ми використовували дві метрики для оцінки ефективності методу: стандартний коефіцієнт детермінації (R 2) та ε-прогнозування (епсилон-прогнозування) точності (детальніше див. Методи). При використанні точності прогнозування епсилон, зразок вважається правильно розпізнаним, якщо передбачуваний вік знаходиться в межах [справжній вік -ε; справжній вік + ε], де ε контролює рівень визначеності у передбаченні. Отже, якщо ε = 0, то це проста точність класифікації. У цьому дослідженні ми розглянули ε = 10. Ключовою перевагою використання точності прогнозування епсилону є те, що він дозволяє проводити когортний аналіз без фіксованого вікового діапазону (наприклад, 10-20, 20-30).

Найкращий одиночний DNN, виконаний з 0,80 R 2 і 82% протягом 10-річного періоду точності прогнозування епсилону (Рисунок 2A & B). Поодинокі DNN перевершували інші моделі ML, такі як k-Найближчі сусіди, Підтримка Vector Machine, Випадкові ліси, Машина для підсилення градієнта тощо (Рисунок 3 & B).

(A) Співвідношення між фактичним та прогнозованим значеннями віку за найкращими DNN в ансамблі. (B) Біологічний віковий графік точності прогнозування епсилону для кращого DNN. (C.) Біологічний віковий маркер Важливість, проведений за методом FPI. (D) Співвідношення між фактичними та передбачуваними віковими значеннями у цілому ансамблі на основі моделі ElasticNet. (Е) Біологічний вік епсилон-прогноз точності графік для ансамблю. (F) Теплова карта для коефіцієнтів кореляції Пірсона між 40 DNN. Кольори шкали шкали вказують на знак і величину коефіцієнта кореляції Пірсона між прогнозами DNN.

DNN порівнювали з методами 7 ML: GBM (машина для підвищення градієнта), RF (випадкові ліси), DT (дерева прийняття рішень), LR (лінійна регресія), kNN (k-найближчі сусіди), ElasticNet, SVM (машини, що підтримують вектор). (A) GBM показує вищий 0,72 R 2 серед моделей ML для прогнозування біологічного віку. (B) Усі моделі ML мають порівнянний високий R 2 для біологічного прогнозування статі.

Для подальшого збільшення коефіцієнта детермінації та точності прогнозів ми об'єднали ці одиничні DNN в ансамбль на основі методу складеного узагальнення (Stacking) [18]. Складання є методом, який підходить для деяких моделей ML для прогнозування інших моделей, у нашому випадку для прогнозів DNN. Вибір моделі проводили із 10-кратним перехресним підтвердженням та зі стратегією випадкового пошуку для пошуку найкращих гіперпараметрів для розглянутих моделей. Експерименти з моделями штабелювання показали (Малюнок 4A & B), що найкращою моделлю ML була ElasticNet.

(A) Модель ElasticNet має вищу точність прогнозування епсилону серед моделей укладання. (B) ElasticNet - найкраща модель для укладання з точки зору статистики R 2. (C.) Середня стратегія заповнення має вищу точність прогнозування епсилону, ніж інші стратегії. Середня стратегія наповнення показує 64,5% точності епсилону протягом 10 років. (D) Середня стратегія наповнення краща з точки зору статистики R 2.

Для успішного об'єднання прогнозів DNN у модель ансамблю укладання, прогнози DNN повинні наближатись до цільової змінної та відрізнятися один від одного або бути менш корельованими. Щоб досягти цього, DNN слід тренувати з різними гіперпараметрами, різними за кількістю шарів, кількістю нейронів у кожному шарі, функціями активації, методами регуляризації тощо. Ми дослідили 40 DNN, кожен унікальний з точки зору гіперпараметрів. Кореляції Пірсона цих DNN представлені на тепловій карті на малюнку Рисунок 2F, 2F, демонструючи високий ступінь подібності серед багатьох мереж щодо прогнозів (r наближається до 1), але також деякі основні відмінності.

Щоб визначити, скільки з цих навчених DNN було необхідно для побудови моделі ансамблю Stacking, ми виконали ітераційний процес додавання вектора прогнозів кожного DNN до ансамблю. Були використані дві ітераційні стратегії: додавання прогнозів за рахунок зменшення R 2 кожної мережі, тобто додавання кращих мереж, які враховують R 2 найраніше в ансамблі, та збільшення кореляції між DNN, тобто додавання спочатку менш корельованих мереж. Результати цього аналізу представлені на малюнку S2. Обидві стратегії показали, що в ансамблі потрібно не більше 21 DNN. Ансамбль, отриманий в результаті розрізнення кореляцій DNN та упорядкування додавання DNN в ансамбль, продемонстрував R 2 = 0,82 та 83,5% протягом 10-річного періоду точності прогнозування епсилону (Рисунок 2D & E).

Ми порівняли наш глибоко навчений провісник з кількома опублікованими маркерами епігенетики та транскриптоміки людського віку. На диво, незважаючи на той факт, що ми використовували лише дані біохімії крові з 41 значенням для кожного пацієнта, наш біомаркер перевершував біомаркери транскриптоміки крові, представлені Петерсом та співавторами з R 2 = 0,6 для найкращої моделі [8]. Через природу даних епігенетичні маркери демонструють сильнішу кореляцію з хронологічним віком, з R 2 = 0,93 для годинника метилювання Горвата і R 2 = 0,89 для годин метилювання Hannum et [6, 7].

Важливість маркера

Для того, щоб проаналізувати важливість маркерів тесту крові за допомогою нейронних мереж, необхідні деякі підходи до функції обгортки (вибір). Ми використали модифікацію методу важливості перестановки (PFI) (докладніше див. Методи). Застосовуючи цей метод, отримуємо список, відсортований за значимістю маркерів через DNN. Ця техніка має дві переваги: ​​1) вона є нативною та простою для інтерпретації та 2) як інші методи обгортки вона покладається на продуктивність DNN, яка в цьому випадку краща за інші моделі ML, завдяки чому створюються більш надійні та значущі функції. Аналіз важливості маркера методом PFI, результати якого представлені на малюнку Рисунок 2C, 2C, виявляє п'ять важливих маркерів: альбумін, глюкоза, лужна фосфатаза, сечовина та еритроцити.

Найкращі можливості

Ми також провели так званий аналіз основних характеристик, який відповідає, як буде зменшуватися ефективність одного DNN із зменшенням кількості маркерів, що використовуються в моделі. Для вибору меншої кількості маркерів для навчання DNN використовується відсортований список усіх балів PFI. Результати цього аналізу як для R 2, так і для точності прогнозування епсилону представлені на малюнку 5A & B. Для 10 найкращих функцій PFI DNN отримав R 2 = 0,63 та 70% прогнозування точності епсилону за 10 років. На практиці той факт, що це зниження продуктивності було настільки незначним, підтверджує 10 найкращих маркерів, отриманих PFI, як надійні та надійні функції для прогнозування віку.