Послідовна модель мішка слів для класифікації людських дій - ScienceDirect

Останнім часом підходи, що використовують просторово-часові особливості для формування моделей "мішок слів" (BoWs), досягли великого успіху завдяки своїй простоті та ефективності. Але вони все ще відчувають труднощі, коли розрізняють дії з високою міжвизначністю. Основна причина полягає в тому, що вони описують дії за допомогою невпорядкованого пакета особливостей, а також ігнорують інформацію про просторову та часову структуру візуальних слів. Для того, щоб покращити класифікаційні показники, ми представляємо новий підхід, який називається послідовна сумка слів. Він фіксує тимчасову послідовну структуру, сегментуючи всю дію на піддії. Тим часом ми приділяємо більше уваги розрізнювальним частинам дії, класифікуючи окремі дії, які потім використовуються для голосування за кінцевий результат. Для оцінки нашого методу проводяться великі експерименти на складних наборах даних та реальних сценах. Конкретно, ми порівнюємо наші результати з деякими сучасними підходами до класифікації та підтверджуємо переваги нашого підходу для розрізнення подібних дій. Результати показують, що наш підхід надійний і перевершує більшість існуючих підходів до класифікації, заснованих на BoW, особливо на складних наборах даних з інтерактивною діяльністю, захаращеним фоном та неоднозначностями дій між класами.

Попередній стаття у випуску Далі стаття у випуску

Ключові слова

Професор Хонг Лю отримав ступінь доктора філософії ступінь механічної електроніки та автоматики в 1996 р., а також професором в Школі EE&CS, Пекінський університет (ПКУ), Китай. Професор Лю був обраний кандидатом з провідних китайських інновацій за підтримки «Національного плану підтримки талантів високого рівня» з 2013 року. Він також є директором Відкритої лабораторії з питань взаємодії людських роботів, ПКУ, його наукові галузі включають комп'ютерний зір та робототехніку, обробка зображень та розпізнавання зразків. Доктор Лю опублікував понад 150 статей та отримав Національну премію аерокосмічної галузі Китаю, Премію Ву Веньцзюнь за штучний інтелект, Премію викладання в галузі досконалості та кандидатів у десятку видатних професорів ФКУ. Він є членом IEEE, віце-президентом Китайської асоціації штучного інтелекту (CAAI) та заступником голови Товариства інтелектуальної робототехніки CAAI. Він був основним доповідачем, співголовою, засіданням сесій або членом ПК багатьох важливих міжнародних конференцій, таких як IEEE/RSJ IROS, IEEE ROBIO, IEEE SMC та IIHMSP, нещодавно також є рецензентами багатьох міжнародних журналів, таких як Pattern Розпізнавання, IEEE Trans. з обробки сигналів та IEEE Trans. на PAMI.

Хао Тан отримав B.E. ступінь електроніки та інформаційної інженерії у 2013 р. і працює над здобуттям ступеня магістра в Школі електроніки та обчислювальної техніки Пекінського університету, Китай. Його поточні наукові інтереси - класифікація зображень, розпізнавання жестів рукою, розпізнавання статі, отримання зображень, розпізнавання дій та глибоке навчання. Він опублікував декілька статей у мультимедійній конференції ACM (MM), Міжнародній конференції з обробки зображень (ICIP) IEEE та Міжнародній спільній конференції зі штучного інтелекту (IJCAI).

Вей Сяо отримав ступінь доктора філософії з інформатики та технологій в Університеті Цінхуа, Китай. В даний час він працює докторантом з питань взаємодії людини і робота (HRI) у Пекінському університеті, Китай. Його наукові інтереси включають комп'ютерний зір та HRI. Він опублікував кілька статей у Міжнародній конференції IEEE з мультисенсорного злиття та інтеграції для інтелектуальних систем та мультимедійної конференції ACM (MM).

Зії Го отримав її B.E. ступінь в галузі цифрових медіа-технологій у 2014 році і працює над здобуттям ступеня магістра в Школі програмного забезпечення та мікроелектроніки Пекінського університету, Китай. Її наукові інтереси включають інтерактивні медіа-технології, дизайн взаємодії та розпізнавання людських дій.

Лу Тянь отримала ступінь магістра з інформатики та технологій в лабораторії взаємодії людини і робота (HRI), Пекінський університет, Шеньчжень, Китай. Її науковий інтерес в основному стосується визнання людських дій. Опублікувала статті в Міжнародній конференції з обробки зображень IEEE (ICIP).

Юань Гао отримав B.E. ступінь інтелектуальної науки та техніки в Університеті Ксідіан у 2012 році. Потім він здобув ступінь магістра наук В 2015 році він здобув ступінь доктора комп’ютерних технологій у Пекінському університеті. На даний час він працює над здобуттям ступеня доктора в Університеті Крістіана-Альбрехтса в Кіль, Німеччина. Сфера наукових інтересів - виявлення об’єктів, 3D-реконструкція, вираз обличчя та розпізнавання статі. Він публікував статті в Міжнародній конференції з обробки зображень IEEE (ICIP).

Експертна оцінка під відповідальністю Чунцинського технологічного університету.