Як встановити ваги класів для незбалансованих класів у Keras?

Я знаю, що в Keras є можливість зі словником параметрів class_weights при установці, але я не міг знайти жодного прикладу. Хтось такий люб'язний надати його?

ваги

До речі, у цьому випадку відповідним практичним завданням є просто зважування класу меншини пропорційно його недопредставленню?

8 відповідей 8

Якщо ви говорите про звичайний випадок, коли ваша мережа видає лише один вихід, тоді ваше припущення правильне. Для того, щоб змусити ваш алгоритм обробляти кожен екземпляр клас 1 як 50 примірників клас 0 ти мусиш:

Визначте словник зі своїми мітками та пов'язаними з ними вагами

Надайте словник як параметр:

EDIT: "обробляти кожен екземпляр клас 1 як 50 примірників клас 0"означає, що у вашій функції втрат ви присвоюєте цим екземплярам більш високе значення. Отже, втрата стає середньозваженою, де вага кожної вибірки визначається клас_важ та відповідний клас.

клас_важ: Необов’язковий словник, що відображає індекси класів (цілі числа) у значення ваги (плаваюче), що використовується для зважування функції втрат (лише під час навчання).

Ви можете просто реалізувати class_weight із sklearn:

Спочатку імпортуємо модуль

Для розрахунку ваги класу виконайте наступне

По-третє, і нарешті, додайте його до фітингу моделі

Увага: Я відредагував цю публікацію та змінив назву змінної з class_weight на class_weights щоб не перезаписувати імпортований модуль. Відповідно налаштуйте, копіюючи код із коментарів.

Я використовую таке правило для class_weight:

math.log згладжує ваги для дуже незбалансованих класів! Це повертає:

class_weight - це нормально, але, як сказав @Aalok, це не спрацює, якщо ви однокласові кодуючі багатозначні класи. У цьому випадку використовуйте sample_weight:

sample_weight: необов'язковий масив тієї ж довжини, що і x, що містить ваги, що застосовуються до втрат моделі для кожного зразка. У разі тимчасових даних ви можете передати 2D-масив з фігурою (зразки, довжина_послідовності), щоб застосувати різну вагу до кожного кроку часу кожного зразка. У цьому випадку слід обов’язково вказати sample_weight_mode = "temporal" у compile () .

sample_weights використовується для надайте вагу для кожної навчальної вибірки. Це означає, що ви повинні передавати 1D-масив із такою ж кількістю елементів, що і ваші навчальні зразки (із зазначенням ваги для кожного з цих зразків).

class_weights використовується для забезпечення вага або упередження для кожного вихідного класу. Це означає, що ви повинні передавати вагу для кожного класу, який ви намагаєтеся класифікувати.

sample_weight повинен отримати масив numpy, оскільки його форма буде оцінена.