Слої аддонов TensorFlow: нормалізація веса

Обзор

Цей блок продемонструє, як використати рівень нормалізації веси і як він може покращити ходімість.

Проста репараметризація для прискорення навчання глибоких нейронних сетей:

Тим Салиманс, Дидерик П. Кінгма (2016)

Путь змін параметрів весів таким чином ми покращуємо умови завдання оптимізації та прискорення ходовості стохастичного градієнтного пропускання. Наша повторна параметризація базується на пакетній нормалізації, але не вводить жодних залежностей між пропозиціями в міні-пакетах. Це означає, що наш метод також може бути успішно застосований до повторного моделювання, таким як LSTM, і до чутливого до шуму додатків, таким як глибоке навчання із підтримкою або генеральними моделями, для яких пакетна нормалізація менше підходить. Хоча наш метод намного проще, він усе забезпечує більшу частину прискорення повної пакетної нормалізації. Крім того, вичислювальні запити нашого методу нижче, що дозволяє виконати більше шагів за оптимізацією за цей час.

аддонов

Настроить

Построить модели

Завантажити дані

Моделі поездов

Якщо не зазначено інше, вміст цієї сторінки ліцензується за ліцензією Creative Commons Attribution 4.0, а зразки коду - за ліцензією Apache 2.0. Докладніше див. У Політиці сайту розробників Google. Java є зареєстрованою торговою маркою Oracle та/або її афілійованих осіб.