CatBoost: алгоритм машинного навчання Яндекса доступний безкоштовно

Машинне навчання допомагає приймати рішення, аналізуючи дані, і може бути використано в багатьох різних сферах, включаючи вибір музики та розпізнавання обличчя. Яндекс, одна з провідних російських технологічних компаній, представила свій вдосконалений алгоритм машинного навчання CatBoost, який безкоштовно доступний для розробників по всьому світу.

catboost

"Це перша російська технологія машинного навчання, яка є відкритим джерелом", - сказав Михайло Біленко, керівник відділу машинного інтелекту та досліджень Яндекса.

Яке відношення мають до цього коти?

CatBoost - це не звичайний "кіт". Насправді це означає "категоричне посилення": алгоритм працює не тільки з цифрами, але і з багатьма іншими "категоріями" даних, таких як аудіо, текст або зображення, включаючи історичні дані.

"CatBoost базується на підвищенні градієнта - технології машинного навчання, яка дуже добре працює з даними з різних джерел", - сказала Анна-Вероніка Дорогуш, керівник відділу розробки систем машинного навчання в Яндексі.

Наприклад, алгоритм чудово підходить для прогнозування погоди, де важливо проаналізувати поєднання історичних даних, моделей погоди та метеорологічних даних. Яндекс вже використовує CatBoost як частину своєї служби прогнозування погоди для підвищення точності.

Внесок у машинне навчання

На думку Яндекса, алгоритм виявився ефективним у різних галузях, включаючи банківську та виробничу. CatBoost допоміг одному клієнту поліпшити якість сталі.

"Більшість алгоритмів машинного навчання працюють лише з числовими даними, такими як зріст, вага або температура", - пояснив Дорогуш. Інші дані, такі як типи хмар або будівель, повинні були бути «перекладені» в цифри, перш ніж розробники могли їх використовувати. Але іноді інформація втрачається в процесі, і це впливає на кінцевий результат.

"Ми зробили CatBoost відкритим джерелом, щоб надати вченим у всьому світі простий і точний прилад", - сказав Біленко. "Це наш внесок у розвиток машинного навчання".