CrossEntropyLoss¶

Цей критерій поєднує nn.LogSoftmax () та nn.NLLLoss () в одному єдиному класі.

crossentropyloss

Це корисно при навчанні задачі класифікації з класами C. Якщо передбачено, необов’язковою вагою аргументу повинен бути 1D тензор, що присвоює вагу кожному з класів. Це особливо корисно, коли у вас незбалансований навчальний набір.

Очікується, що вхідні дані містять необроблені, ненормалізовані оцінки для кожного класу.

Втрату можна описати як:

або у випадку вказаного аргументу ваги:

Втрати усереднюються за спостереженнями для кожної міні-партії. Якщо вказано аргумент ваги, це середньозважене значення:

Також може використовуватися для входів більшого розміру, таких як 2D-зображення, шляхом введення розміру (minibatch, C, d 1, d 2, ..., d K) (minibatch, C, d_1, d_2,. D_K) (міні-партія, C, d 1, d 2, ..., d K) з K ≥ 1 K \ geq 1 K ≥ 1, де KKK - кількість розмірів та ціль відповідної форми (див. нижче) ).

вага (Тензор, необов’язково) - ручний коефіцієнт масштабування, присвоєний кожному класу. Якщо дано, має бути тензор розміром С

середній_розмір (bool, необов’язково) - застаріле (див. скорочення). За замовчуванням втрати усереднюються по кожному елементу втрат у партії. Зверніть увагу, що для деяких втрат у вибірці є кілька елементів. Якщо для поля size_average встановлено значення False, натомість втрати підсумовуються для кожної міні-партії. Ігнорується, коли зменшення - False. За замовчуванням: True

ignore_index (int, необов’язково) - Вказує цільове значення, яке ігнорується і не сприяє введенню градієнта. Коли size_average має значення True, втрати усереднюються за неігнорованими цілями.

зменшити (bool, необов’язково) - застаріле (див. скорочення). За замовчуванням втрати усереднюються або підсумовуються за спостереженнями для кожної міні-партії залежно від середнього розміру. Коли зменшення має значення False, замість цього повертає втрату на елемент пакета та ігнорує size_average. За замовчуванням: True

скорочення (рядок, необов’язково) - Вказує зменшення, яке застосовуватиметься до виводу: 'none' | 'означає' | 'сума'. 'none': зменшення не застосовуватиметься, 'mean': береться зважене середнє значення результату, 'sum': результат буде підсумовано. Примітка: розмір_середнє та зменшення перебувають у процесі припинення, а тим часом, зазначення будь-якого з цих двох аргументів замінить зменшення. За замовчуванням: 'означає'