Поглиблене навчання при виявленні переломів: огляд розповіді

Статті

Повна стаття
Цифри та дані
Список літератури
Цитати
Метрики
Ліцензування
Передруки та дозволи
PDF

Анотація

Штучний інтелект (ШІ) - загальний термін, який передбачає використання комп’ютера для моделювання інтелектуальної поведінки з мінімальним втручанням людини. ШІ, особливо глибоке навчання, нещодавно досяг значних успіхів у завданнях сприйняття, що дозволяє машинам краще представляти та інтерпретувати складні дані. Глибоке навчання - це підмножина ШІ, представлена комбінацією штучних шарів нейронів. За останні роки глибоке навчання набрало великих темпів. У галузі ортопедії та травматології були проведені деякі дослідження з використанням глибокого навчання для виявлення переломів на рентгенограмах. Дослідження глибокого вивчення для виявлення та класифікації переломів на комп’ютерній томографії (КТ) ще більш обмежені. У цьому оглядовому огляді ми даємо короткий огляд технологій глибокого навчання: ми (1) описуємо способи, яким глибоке навчання дотепер застосовувалось для виявлення переломів на рентгенограмах та обстеженнях на КТ; (2) обговорити, яку цінність глибоке навчання пропонує цій галузі; і нарешті (3) прокоментуйте майбутні напрямки цієї технології.

Попит на послуги радіології, наприклад, магнітно-резонансну томографію (МРТ), комп’ютерну томографію (КТ) та рентгенограми, різко зріс за останні роки (Kim and MacKinnon 2018). У Великобританії кількість обстежень на КТ зросла на 33% між 2013 і 2016 роками (Факультет клінічної рентгенології, Клінічна радіологія, перепис робочої сили Великобританії за 2016 рік). У Нідерландах було проведено понад 1,7 млн обстежень на КТ у всіх лікарнях (Національний інститут охорони здоров’я та навколишнього середовища 2016 р.). Цей попит значно зросте у найближчі роки, що призведе до значного напруження робочої сили. З іншого боку, не вистачає рентгенологів через відставання у наборі кадрів та велику кількість рентгенологів, що наближається до виходу на пенсію. Крім того, аналіз медичних зображень часто може бути складним та трудомістким процесом. Штучний інтелект (ШІ) має потенціал для вирішення цих проблем (Кім та Маккіннон, 2018).

ШІ - загальний термін, який передбачає використання комп’ютера для моделювання інтелектуальної поведінки з мінімальним втручанням людини (Hamet and Tremblay 2017). Крім того, ШІ, особливо глибоке навчання, нещодавно зробив значні успіхи у сприйнятті даних візуалізації, що дозволяє машинам краще представляти та інтерпретувати складні дані (Хосні та ін., 2018).

Глибоке навчання - це підмножина ШІ, представлена комбінацією штучних шарів нейронів. Кожен шар містить ряд одиниць, де кожна одиниця є спрощеним поданням нейронної клітини, натхненною її структурою в мозку людини (McCulloch and Pitts 1943). Сьогодні алгоритми глибокого навчання здатні відповідати і навіть перевершувати людей у спеціальних додатках (Mnih et al. 2015, Moravčík et al. 2017). Глибоке навчання перетворило сферу інформаційних технологій, відкривши масштабні рішення, керовані даними, для вирішення проблем, які колись були трудомісткими.

За останні роки глибоке навчання набрало великих обертів (Adams et al. 2019). Недавні дослідження показали, що глибоке навчання має можливість виконувати складну інтерпретацію на рівні медичних працівників (Gulshan et al. 2016, Esteva et al. 2017, Lakhani and Sundaram 2017, Lee et al. 2017, Olczak et al. 2017, Ting et al. 2017, Tang et al. 2018). У галузі ортопедичної травматології було проведено ряд досліджень з використанням глибокого вивчення на рентгенограмах для виявлення переломів (Brett et al. 2009, Olczak et al. 2017, Chung et al. 2018, Kim and MacKinnon 2018, Lindsey et al. 2018, Adams et al. 2019, Urakawa et al. 2019). Однак досліджень, що проводять глибоке вивчення переломів на КТ, недостатньо (Tomita et al., 2018).

У цьому оглядовому огляді ми даємо короткий огляд технологій глибокого навчання; (2) описати способи застосування глибокого навчання для виявлення переломів на рентгенограмах та обстеженнях на КТ; (3) обговорити, яку цінність глибоке навчання пропонує цій галузі; і, нарешті, (4) прокоментуйте майбутні напрямки цієї технології.

Технологія штучного інтелекту

Глибоке навчання (DL) - це сімейство методів, яке є частиною широкого поля машинного навчання та ще більш широкого поля штучного інтелекту (рис. 1). Ці алгоритми об’єднані ідеєю навчання з даних, а не слідування чітко визначеним інструкціям. Цей рівень абстракції робить алгоритми глибокого навчання придатними для вирішення різноманітних проблем у ряді кількісних полів (LeCun et al. 2015).

Опубліковано в Інтернеті:

Рисунок 1. Візуалізація підродини штучного інтелекту.

Deep Learning показав надзвичайну ефективність у вирішенні завдань семантичної обробки зображень. Кірешан та ін. (2012) продемонстрували, що DL може перевершити людей у 2 рази при розпізнаванні дорожніх знаків. Томпсон та ін. (2014) показали, що DL суттєво перевершила існуючі найсучасніші методи оцінки пози людини. Chen et al. (2015) оцінив потенціал DL у застосуванні для автономного водіння. ImageNet (Руссаковський та ін., 2015) продемонстрували, що DL можна успішно застосовувати до різних завдань, що стосуються конкретних зображень, і отримувати найсучасніші показники. Після успіху DL в галузі комп'ютерного зору, область медичної візуалізації почала застосовувати ці методи для вирішення власних проблем, таких як, наприклад, класифікація медичних зображень (Gao et al. 2017, Yang et al. 2018, Tran et al. 2019 ), сегментація медичного зображення (Cha et al. 2016, Dou et al. 2017, Roth et al. 2018) та зменшення шуму (Chen et al. 2017, Wolterink et al. 2017). Через високу абстрактність алгоритмів DL немає необхідності змінювати методологію при переході від проблеми в одному полі в інше поле. Більше того, використовуючи цей так званий підхід до трансферного навчання, алгоритми DL можуть отримати користь від попередніх успіхів, навіть якщо модель вирішувала іншу проблему (Yang et al., 2018).

Суттєвий шар DL складається з ряду нейронів, які певною мірою імітують активність нейронної клітини (рис. 2). Кожен нейрон у шарі має власну вагу w для кожного вхідного з'єднання та значення зміщення b, де кожен вага w представляє силу для конкретного з'єднання, а значення зміщення b дозволяє нам зміщувати функцію активації разом із зваженою сумою входи в нейрон, контролюючи значення, при якому спрацьовує функція активації. Іншими словами, кожен ваговий коефіцієнт w визначає, наскільки вплив відповідний вхід буде мати на вихід нейрону та зміщення b, що дозволяє моделі краще відповідати даним. Для того, щоб створити вихід для нейрона і внести нелінійність рішення нейрона, одна з функцій активації, g, застосовується до виходу нейрона z.

Опубліковано в Інтернеті:

Рисунок 2. Візуалізація моделі штучного нейрона. Де A1 – AN - це входи, W1 – WN - ваги для вхідних зв’язків з нейроном, b - значення зміщення, z - вихід з нейрона.

Виявлення та класифікація переломів на рентгенограмах та КТ-зображеннях з високою чутливістю та специфічністю може допомогти або навіть замінити автоматизовану систему DL з високою точністю. Враховуючи кілька тисяч зображень, ми можемо вирішити кілька проблем з DL. Використовуючи такі моделі, як VGG16 (Simonyan and Zisisserman 2015), Inception V3 (Szegedy et al. 2015) та Xception (Chollet 2016), ми можемо класифікувати зображення, наприклад, щоб виявити, чи є перелом, або навіть розрізнити перелом типи. Враховуючи анотації або мітки обмежувального поля для регіонів, що цікавлять, ми можемо навчити такі моделі, як ResNet (He et al. 2016), U-net (Ronneberger et al. 2015), Mask-RCNN (He et al. 2017), Швидше RCNN (Ren et al. 2015) для виявлення переломів та сегментації. Згадані архітектури DL широко використовуються у спільноті DL і продемонстрували свою ефективність у вирішенні таких завдань (Ruhan et al. 2017, Li et al. 2018, Couteaux et al. 2019, Li et al. 2019, Lian et al. 2019, Чжу та ін. 2019).

Застосування ШІ при виявленні переломів

Подібне дослідження Chung et al. (2018) ставив за мету оцінити здатність глибокого навчання виявляти та класифікувати переломи проксимальних відділів плечової кістки за допомогою простої рентгенографії плеча АР. Результати мережі CNN порівнювали з оцінкою спеціалістів (лікарі загальної практики, хірурги-ортопеди та рентгенологи). Їх загальний набір даних містив 1891 простий рентгенограмний апарат AP, і вони використовували попередньо навчену модель ResNet-152, яка була точно налаштована на їхні проксимальні набори даних про перелом плечової кістки. Тренований CNN продемонстрував високу ефективність у розрізненні нормальних плечей від переломів проксимальної плечової кістки. Крім того, були знайдені перспективні результати для класифікації типу переломів на основі звичайних рентгенограм плечей АР. CNN демонстрував вищі показники, ніж загальних лікарів та хірургів-ортопедів загального профілю, і подібні показники у плечових спеціалізованих ортопедів. Це вказує на можливість автоматизованої діагностики та класифікації переломів проксимального відділу плечової кістки та інших переломів або ортопедичних захворювань, діагностованих з точністю за допомогою звичайних рентгенограм (Chung et al., 2018).

Значення глибокого навчання в рентгенології/ортопедичній травматології

Як видно з прикладів глибокого навчання в рентгенології, описаних вище, існують потенційні переваги для розробки та інтеграції систем глибокого навчання у повсякденній практиці, як у виявленні переломів, так і в задачах щодо характеристики переломів (рис. 3). Загалом, використання глибокого навчання як доповнення до стандартних практик рентгенології може покращити швидкість та точність діагностичного тестування, одночасно зменшуючи робочу силу внаслідок розвантаження людських рентгенологів із трудомістких завдань. Поряд з цим, системи глибокого навчання піддаються деяким підводним колам людської діагностики, таким як дисперсія між споживачами та між ними. Глибоке навчання, яке застосовується в академічних дослідженнях, може принаймні співпадати, а іноді і перевищувати ефективність людини при виявленні та класифікації переломів на звичайних рентгенограмах та КТ.