Інженери попередньо навчають комп’ютери ШІ, щоб зробити їх ще потужнішими

У 2016 році суперкомп’ютер переміг чемпіона світу в Go - складна настільна гра. Як? Використовуючи навчання підкріплення, тип штучного інтелекту, за допомогою якого комп’ютери тренуються після програмування за допомогою простих інструкцій. Комп’ютери вчаться на своїх помилках і, крок за кроком, стають надзвичайно потужними.

Основним недоліком навчання підкріплення є те, що його не можна використовувати в деяких реальних програмах. Це тому, що в процесі навчання самі комп’ютери спочатку пробують майже все і все, перш ніж врешті-решт спотикаються на правильному шляху. Цей початковий етап спроб і помилок може бути проблематичним для певних застосувань, таких як системи контролю клімату, де різкі коливання температури не допускаються.

Вивчення посібника водія перед запуском двигуна

Інженери CSEM розробили підхід, який долає цю проблему. Вони показали, що спочатку комп'ютери можна навчити надзвичайно спрощеним теоретичним моделям, перш ніж налаштовувати їх на навчання в реальних системах. Це означає, що коли комп’ютери запускають процес машинного навчання на реальних системах, вони можуть спиратися на те, що дізналися раніше на моделях. Тому комп’ютери можуть швидко вийти на правильний шлях, не проходячи періоду екстремальних коливань. Дослідження інженерів щойно були опубліковані в IEEE Transactions on Neural Networks and Learning Systems.

"Це все одно, що вивчити посібник водія перед тим, як запустити машину", - говорить П'єр-Жан Але, керівник досліджень розумних енергетичних систем в CSEM і співавтор дослідження. "На цьому етапі попередньої підготовки комп’ютери створюють базу знань, на якій можуть спиратись, щоб не полетіти сліпо, коли шукають правильну відповідь"

Скорочення споживання енергії більш ніж на 20%

Інженери випробували свій підхід до системи опалення, вентиляції та кондиціонування (HVAC) для складної 100-кімнатної будівлі за допомогою триступеневого процесу. Спочатку вони навчили комп’ютер на «віртуальній моделі», побудованій із простих рівнянь, що приблизно описували поведінку будівлі. Потім вони подавали фактичні дані будівлі (температуру, тривалість роботи жалюзі, погодні умови тощо) у комп’ютер, щоб зробити навчання більш точним. Нарешті, вони дозволили комп’ютеру запустити алгоритми навчання, щоб знайти найкращий спосіб управління системою HVAC. Широкі програми

Це відкриття може відкрити нові горизонти для машинного навчання, розширивши його застосування до програм, де великі коливання робочих параметрів матимуть значні фінансові витрати або витрати на безпеку.