Як використовувати криві навчання для діагностики ефективності моделі машинного навчання

Останнє оновлення 6 серпня 2019 року

Крива навчання - це графік модельної ефективності навчання протягом досвіду чи часу.

Криві навчання - це широко використовуваний діагностичний інструмент у машинному навчанні для алгоритмів, які поступово навчаються на основі навчального набору даних. Модель може бути оцінена на наборі даних тренувань та на базі даних перевірки, що триває, після кожного оновлення під час навчання, а графіки вимірюваних результатів можуть бути створені для відображення кривих навчання.

Перегляд кривих навчання моделей під час навчання може бути використаний для діагностики проблем із навчанням, таких як модель недостатньої чи надмірної підготовки, а також чи є набори даних про навчання та перевірку належними.

У цій публікації ви дізнаєтеся про криві навчання та про те, як їх можна використовувати для діагностики поведінки на навчання та узагальнення моделей машинного навчання, на прикладах графіків, що показують загальні проблеми навчання.

Прочитавши цю публікацію, ви дізнаєтесь:

  • Криві навчання - це графіки, які показують зміни у навчальних показниках з часом з точки зору досвіду.
  • Криві вивчення характеристик моделі на поїзді та валідаційні набори даних можуть бути використані для діагностики недооформленої, перенапруженої чи добре підібраної моделі.
  • Криві навчання продуктивності моделі можуть бути використані для діагностики, чи не є набори даних про поїзд чи перевірку відносно репрезентативними для проблеми.

Почніть свій проект з моєю новою книгою «Краще глибоке навчання», включаючи покрокові підручники та файли вихідного коду Python для всіх прикладів.

Давайте розпочнемо.

ефективності

Ніжний вступ до кривих навчання для діагностики продуктивності моделі глибокого навчання
Фото Майка Сазерленда, деякі права захищено.

Огляд

Цей підручник розділений на три частини; вони є:

  1. Криві навчання
  2. Діагностування поведінки моделі
  3. Діагностика нерепрезентативних наборів даних

Криві навчання в машинному навчанні

Як правило, крива навчання - це графік, який показує час або досвід на осі x та навчання або вдосконалення на осі y.

Криві навчання (LC) вважаються ефективними інструментами для моніторингу результатів праці робітників, які піддаються новим завданням. LC забезпечують математичне відображення процесу навчання, який відбувається при повторенні завдань.

Наприклад, якщо ви вивчали музичний інструмент, ваші навички роботи з інструментом могли б оцінюватись і призначати числову оцінку щотижня протягом одного року. Графік балів за 52 тижні - це крива навчання, яка показує, як ваше вивчення інструменту змінювалось з часом.

  • Крива навчання: Лінійний графік навчання (вісь y) над досвідом (вісь x).

Криві навчання широко використовуються в машинному навчанні для алгоритмів, які навчаються (оптимізують свої внутрішні параметри) з часом поступово, наприклад, для глибокого навчання нейронних мереж.

Показник, що використовується для оцінки навчання, може бути максимізуючим, тобто кращі оцінки (більші цифри) вказують на більше навчання. Прикладом може бути точність класифікації.

Більш поширеним є використання оцінки, яка зводить до мінімуму, наприклад, втрата або помилка, завдяки чому кращі оцінки (менші цифри) вказують на більший рівень навчання, а значення 0,0 означає, що навчальний набір даних вивчений досконало і помилок не було.

Під час навчання моделі машинного навчання можна оцінити поточний стан моделі на кожному кроці навчального алгоритму. Це можна оцінити на наборі даних тренінгу, щоб дати уявлення про те, наскільки добре модель "навчається". Його також можна оцінити на наборі даних перевірки, що не є частиною навчального набору даних. Оцінка набору даних перевірки дає уявлення про те, наскільки модель "узагальнює".

  • Тренуй крива навчання: Крива навчання, розрахована на основі навчального набору даних, що дає уявлення про те, наскільки добре навчається модель.
  • Крива підтвердження навчання: Крива навчання, розрахована на основі набору даних перевірки, який дає змогу зрозуміти, наскільки модель узагальнює.

Загальноприйнятим є створення кривих подвійного навчання для моделі машинного навчання під час навчання як на базах даних навчання, так і на основі перевірки.

У деяких випадках також загальноприйнятим є створення кривих навчання для кількох метрик, наприклад, у випадку задач класифікаційного прогнозуючого моделювання, де модель може бути оптимізована відповідно до перехресних ентропійних втрат, а ефективність моделі оцінюється за допомогою точності класифікації. У цьому випадку створюються дві графіки, одна для кривих навчання кожної метрики, і кожна ділянка може показувати дві криві навчання, по одній для кожного набору даних про поїзд та перевірку.

  • Криві оптимізації навчання: Криві навчання, розраховані на метриці, за допомогою якої оптимізуються параметри моделі, наприклад втрата.
  • Криві навчання ефективності: Криві навчання, розраховані на метриці, за якою буде оцінено та обрано модель, наприклад точність.

Тепер, коли ми знайомі з використанням кривих навчання в машинному навчанні, давайте розглянемо деякі загальні форми, що спостерігаються на графіках кривих навчання.

Хочете отримати кращих результатів із глибоким навчанням?

Пройдіть мій безкоштовний 7-денний курс збою електронної пошти зараз (із зразком коду).

Клацніть, щоб зареєструватися, а також отримати безкоштовну версію курсу у форматі PDF для електронних книг.

Діагностування поведінки моделі

Форму та динаміку кривої навчання можна використовувати для діагностики поведінки моделі машинного навчання і, в свою чергу, можливо, запропонувати тип змін конфігурації, які можуть бути зроблені для поліпшення навчання та/або продуктивності.

Існує три загальні динаміки, які ви, мабуть, спостерігатимете в процесі навчання; вони є:

  • Underfit.
  • Надмірне.
  • Добре підходить.

Ми детальніше розглянемо кожен із прикладів. У прикладах передбачається, що ми розглядаємо мінімізуючу метрику, що означає, що менші відносні оцінки на осі y вказують на більше або краще навчання.

Криві навчання недостатнього рівня

Underfitting відноситься до моделі, яка не може вивчити навчальний набір даних.

Недостатнє оснащення відбувається, коли модель не може отримати достатньо низьке значення похибки на навчальному наборі.

Модель недостатнього рівня можна визначити лише з кривої навчання, пов’язаної з втратою тренувань.

Він може показувати рівну лінію або шумні значення відносно великих втрат, що вказує на те, що модель взагалі не змогла вивчити навчальний набір даних.

Приклад цього наведено нижче і є загальним, коли модель не має відповідної потужності для складності набору даних.

Приклад тренувальної кривої навчання, що показує модель недостатнього рівня, яка не має достатнього потенціалу

Модель недоліків також може бути ідентифікована за втратою тренувань, яка зменшується і продовжує зменшуватися в кінці сюжету.

Це вказує на те, що модель здатна до подальшого навчання та можливих подальших удосконалень, а також що навчальний процес був передчасно зупинений.

Приклад тренувальної кривої навчання, що показує модель недостатнього рівня, яка вимагає подальшого навчання

Діаграма кривих навчання показує недостатню придатність, якщо:

  • Втрата тренувань залишається незмінною незалежно від тренування.
  • Втрати від тренувань продовжують зменшуватися до кінця тренувань.

Надлишкові криві навчання

Надмірне оснащення відноситься до моделі, яка занадто добре засвоїла навчальний набір даних, включаючи статистичний шум або випадкові коливання в навчальному наборі даних.

підгонка більш гнучкої моделі вимагає оцінки більшої кількості параметрів. Ці більш складні моделі можуть призвести до явища, відомого як переобладнання даних, що, по суті, означає, що вони занадто уважно стежать за помилками або шумом.

Проблема переобладнання полягає в тому, що чим більше спеціалізується модель на навчальних даних, тим менш вдало вона може узагальнювати на нові дані, що призводить до збільшення помилки узагальнення. Це збільшення похибки узагальнення можна виміряти за результатами роботи моделі на базі даних перевірки.

Це приклад переобладнання даних, […]. Це небажана ситуація, оскільки отримана відповідність не дасть точних оцінок реакції на нові спостереження, які не були частиною вихідного набору навчальних даних.

Це часто трапляється, якщо модель має більше можливостей, ніж потрібно для вирішення проблеми, і, в свою чергу, занадто велику гнучкість. Це також може статися, якщо модель тренується занадто довго.

Діаграма кривих навчання показує переоснащення, якщо:

  • Сюжет про втрату тренувань продовжує зменшуватися із досвідом.
  • Графік валідаційних втрат зменшується до точки і починає знову збільшуватися.

Точка перегину при валідаційній втраті може бути точкою, на якій навчання може бути припинено, оскільки досвід після цього моменту показує динаміку переобладнання.

Наведений нижче приклад демонструє випадок переобладнання.

Приклад кривих навчання поїздів та перевірки, що показують модель перенапруги

Криві хорошого навчання

Хороша відповідність є метою алгоритму навчання і існує між моделлю надмірності та недостатності.

Хороша відповідність визначається за допомогою втрат на навчання та перевірку, які зменшуються до точки стабільності з мінімальним розривом між двома кінцевими значеннями втрат.

Втрати моделі майже завжди будуть нижчими для набору навчальних даних, ніж набір даних перевірки. Це означає, що слід очікувати певного розриву між поїздами та кривими навчання втрат на підтвердження. Цей розрив називають "розривом узагальнення".

Графік кривих навчання добре підходить, якщо:

  • Сюжет про втрату тренувань зменшується до точки стабільності.
  • Графік валідаційних втрат зменшується до точки стабільності та має невеликий розрив із втратою тренувань.

Подальше тренування гарної форми, швидше за все, призведе до перенапруги.

Наведений нижче приклад графіку демонструє випадок гарної підгонки.

Приклад навчальних кривих навчання та перевірки, які демонструють хорошу підгонку

Діагностика нерепрезентативних наборів даних

Криві навчання також можна використовувати для діагностики властивостей набору даних та того, чи є він відносно репрезентативним.

Нерепрезентативний набір даних означає набір даних, який може не охоплювати статистичні характеристики щодо іншого набору даних, отриманого з того ж домену, наприклад, між поїздом та набором даних перевірки. Це зазвичай може статися, якщо кількість зразків у наборі даних є замалою щодо іншого набору даних.

Є два найпоширеніші випадки, які можна було спостерігати; вони є:

  • Набір навчальних даних є відносно нерепрезентативним.
  • Набір даних перевірки є відносно нерепрезентативним.

Нерепрезентативний набір даних про поїзд

Нерепрезентативний набір навчальних даних означає, що набір навчальних даних не надає достатньої інформації для вивчення проблеми щодо набору даних перевірки, що використовується для його оцінки.

Це може статися, якщо навчальний набір даних має занадто мало прикладів порівняно з набором даних перевірки.

Цю ситуацію можна визначити за кривою навчання для втрати тренувань, яка демонструє поліпшення, і аналогічно кривою навчання для валідації втрат, яка демонструє поліпшення, але між обома кривими залишається великий розрив.

Приклад кривих навчання навчання та перевірки, що показують набір навчальних даних, який може бути занадто малим щодо набору даних перевірки

Нерепрезентативний набір даних перевірки

Нерепрезентативний набір даних перевірки означає, що набір даних перевірки не надає достатньої інформації для оцінки здатності моделі узагальнювати.

Це може статися, якщо набір даних перевірки має занадто мало прикладів у порівнянні з навчальним набором даних.

Цей випадок можна визначити за кривою навчання для втрати тренувань, яка виглядає як придатна (або інша відповідність), і кривою навчання для втрати від перевірки, яка показує галасливі рухи навколо втрати тренування.

Приклад кривих навчання навчання та перевірки, що показують набір даних перевірки, який може бути занадто малим щодо набору навчальних даних

Це також може бути ідентифіковано за валідаційними втратами, які є меншими, ніж втрати від навчання. У цьому випадку це вказує на те, що для набору даних перевірки може бути простіше передбачити модель, ніж набір навчальних даних.

Приклад кривих навчання навчання та перевірки, що показують набір даних перевірки, який легше передбачити, ніж набір навчальних даних

Подальше читання

Цей розділ містить більше ресурсів з даної теми, якщо ви хочете заглибитися.

Книги

Папери

Дописи

Статті

Резюме

У цьому дописі ви відкрили криві навчання та те, як їх можна використовувати для діагностики поведінки навчання та узагальнення моделей машинного навчання.

Зокрема, ви дізналися:

  • Криві навчання - це графіки, які показують зміни у навчальних показниках з часом з точки зору досвіду.
  • Криві вивчення характеристик моделі на поїзді та валідаційні набори даних можуть бути використані для діагностики недооформленої, перенапруженої чи добре підібраної моделі.
  • Криві навчання продуктивності моделі можуть бути використані для діагностики, чи не є набори даних про поїзд чи перевірку відносно репрезентативними для проблеми.

У вас є які-небудь питання?
Задавайте свої запитання в коментарях нижче, і я зроблю все можливе, щоб відповісти.

Розробити сьогодні кращі моделі глибокого навчання!

Тренуйтеся швидше, зменшуйте перевантаження та ансамблі

. лише кількома рядками коду python

Дізнайтеся, як у моїй новій електронній книзі:
Краще глибоке навчання

Це забезпечує навчальні посібники для самостійного вивчення на такі теми:
зниження ваги, нормалізація партії, вибування, укладання моделей та багато іншого.