Виклики в клінічній обробці природних мов для автоматизованої нормалізації розладів

Додати до Менділі

Основні моменти

Нормалізація розладів у клінічному тексті має широке застосування.

Клінічні нормалізатори повинні мати спеціальне форматування, жаргонізм та неоднозначні скорочення.

Лексика розладів багатіша на клінічний текст, ніж біомедичні тези.

Нормалізація з попарним навчанням ранжуванню обробляє багатий словниковий запас.

Подальші вдосконалення нормалізації вимагають вдосконаленого розпізнавання іменованих сутностей.

Анотація

Передумови

Визначення ключових змінних, таких як розлади в клінічних переказах в електронних медичних картах, має широке застосування в клінічній практиці та біомедичних дослідженнях. Попередні дослідження продемонстрували зниження ефективності розпізнавання розладів із назвою сутності (NER) та нормалізації (або обґрунтування) у клінічних оповіданнях, ніж у біомедичних публікаціях. У цій роботі ми прагнемо виявити причину такої різниці в ефективності та представити загальні рішення.

Методи

Ми використовуємо властивості закриття для порівняння багатства словникового запасу в клінічному оповідальному тексті з біомедичними публікаціями. Ми підходимо як до NER розладів, так і до нормалізації, використовуючи методології машинного навчання. Наша методологія NER базується на умовно-випадкових полях з лінійним ланцюжком із розширеним функціональним підходом, і ми вводимо декілька вдосконалень для покращення лексичних знань системи NER. Наш метод нормалізації - ніколи раніше не застосовувався до клінічних даних - використовує попарне навчання для ранжування для автоматичного вивчення варіації термінів безпосередньо з навчальних даних.

Результати

Ми виявили, що, хоча розмір загального словника схожий між клінічними наративними та біомедичними публікаціями, клінічний наратив використовує більш багату термінологію для опису розладів, ніж публікації. Ми застосовуємо нашу систему, DNorm-C, для виявлення згадувань про розлади та в клінічних переказах з нещодавнього завдання e-Health ShARe/CLEF. Для NER (лише строгий інтервал) наша система досягає точності = 0,797, відкликання = 0,713, f-оцінки = 0,753. Для завдання нормалізації (строгий інтервал + концепція) воно досягає точності = 0,712, відкликання = 0,637, f-балу = 0,672. Поліпшення, описані в цій статті, збільшують коефіцієнт NER f на 0,039 та коефіцієнт нормалізації f на 0,036. Ми також описуємо версію NER з високим викликом, яка збільшує виклик нормалізації до 0,744, хоча і зі зниженою точністю.

Обговорення

Ми проводимо аналіз помилок, демонструючи, що помилок NER перевищує кількість помилок нормалізації більш ніж на 4: 1. Вважається, що скорочення та абревіатури є частими причинами помилок, крім згадувань анотатори не змогли визначити в межах контрольованого словникового запасу.

Висновок

Згадування розладів у тексті з клінічних розповідей використовують багатий словниковий запас, що призводить до великих термінів варіації, що, на нашу думку, є однією з основних причин зниження ефективності клінічного оповідання. Ми показуємо, що попарне навчання ранжуванню забезпечує високу ефективність у цьому контексті, і вводимо кілька лексичних удосконалень - узагальнених для інших клінічних завдань NER - які покращують здатність системи NER справлятися з цією варіацією. DNorm-C - це високоефективна система з відкритим кодом для розладів у клінічному тексті та перспективний крок до NER та методів нормалізації, які піддаються навчанню для широкого кола доменів та суб’єктів. (DNorm-C - це програмне забезпечення з відкритим вихідним кодом, і воно доступне з навченою моделлю на демонстраційному веб-сайті DNorm: http://www.ncbi.nlm.nih.gov/CBBresearch/Lu/Demo/tmTools/#DNorm.)

Графічний реферат

Завантажити: Завантажити зображення з високою роздільною здатністю (150 КБ)
Завантажити: Завантажте повнорозмірне зображення

Попередній стаття у випуску Далі стаття у випуску