До оцінки дієти за допомогою відеокамер для мобільних телефонів

Микола Чен

1 кафедра комп'ютерних наук, Університет Іллінойсу, Урбана, штат Іллінойс, 61801 США;

допомогою

Юн Янг Лі

1 кафедра комп'ютерних наук, Університет Іллінойсу, Урбана, штат Іллінойс, 61801 США;

Моріс Раб

1 кафедра комп'ютерних наук, Університет Іллінойсу, Урбана, штат Іллінойс, 61801 США;

Брюс Шатц

2 Департамент медичної інформатики, Університет Іллінойсу, Урбана, Іллінойс 61801 США

Анотація

Надійна дієтична оцінка є складним, але важливим завданням для визначення загального стану здоров'я. Існуючі зусилля проводяться вручну, вимагають значних зусиль і схильні до недооцінки та неправильного представлення споживання їжі. Ми пропонуємо використовувати мобільні телефони, щоб зробити цей процес швидшим, простішим та автоматичнішим. Користуючись мобільними телефонами із вбудованими відеокамерами, люди роблять короткі відео своїх страв; Потім наше програмне забезпечення автоматично аналізує відео, щоб розпізнати страви та оцінити калорії. Попередні експерименти на 20 типових стравах з місцевої їдальні дають багатообіцяючі результати. Наш підхід доповнює існуючі методи оцінки дієти, щоб допомогти людям краще управляти своїм харчуванням, щоб запобігти ожирінню та іншим захворюванням, пов'язаним з дієтою.

Вступ

Дієтична оцінка - це комплексна оцінка споживання їжею людиною. Це постійний процес, який вимірює історію споживання їжі та поживних речовин. Точна дієтична оцінка дає цінну інформацію про потенційні проблеми зі здоров’ям людини, такі як недоїдання та - більш поширене в сучасну епоху - ожиріння. Повні дієтичні дані є надзвичайно важливими для людей, щоб створити персоналізовані режими харчування, щоб поліпшити свої харчові звички для профілактики таких проблем зі здоров'ям.

Існують різні методи, які допомагають оцінити дієту. Фотоденники популярні серед людей, які намагаються схуднути. Люди їдять фотографії своїх страв і роблять записи про кожну страву перед їжею. На жаль, щоденник фотографій показує лише те, що було з’їдено, але не і його харчову цінність.

Популярні також програми для підрахунку калорій. Люди бачать конкретні страви в базі даних програмного забезпечення, щоб отримати оцінку вмісту поживних речовин. Хоча обширна база даних забезпечує більшу точність, навігація по ній створює психічний тягар для користувача. Ми їли свіжі помідори чи консервовані помідори? Такий скрупульозний підхід може швидко стати нудним і демотивує всіх, крім найбільш рішучих користувачів, оскільки такий вибір робить незначну різницю в калоріях.

Проведення оцінки дієти за допомогою цифрових фотографій їжі стає популярним. Повсюдність мобільних телефонів з камерами робить фотозйомку легкою та доступною. Станом на грудень 2009 року лише в США налічувалося понад 285 мільйонів мобільних телефонів [1]. Використовуючи це, в Японії віртуальна дружина Metaboinfo [2] має команду дієтологів вручну аналізуючи фотографії страв з мобільних телефонів, щоб забезпечити миттєву оцінку калорій для своїх користувачів. Існуючі дослідження [3,4] намагаються використати автоматизовані комп’ютерні методи зору для розпізнавання їжі за своїми фотографіями для сприяння оцінці калорій. Хоча багатообіцяюча, продуктивність була обмеженою, оптимістично працюючи з точністю 25 - 58%. Варіації, спричинені багатьма факторами (наприклад, відстань та умови освітлення), роблять окремі фотографії страв поганими кандидатами на надійну обробку зображень. Наші початкові спроби розпізнавання їжі підтверджують це обмеження, виконуючи показники з точністю менше 25% із фотографіями, зробленими з висоти пташиного польоту.

Наступним природним кроком є ​​використання відеокамер для мобільних телефонів для отримання кращих зображень для автоматичної обробки зображень. Відео забезпечують багатоперспективне уявлення про їжу, що дозволяє нам більш надійно визначити, що є на тарілці. Зйомка відео страви простіша і не більш трудомістка, ніж зйомка однієї фотографії, оскільки користувач позбавлений необхідності складати „ідеальний” кадр. Користувач просто знімає панорамне відео страви, а наше програмне забезпечення потім вибирає з відео кількість кадрів-кандидатів.

Крім того, він більш стійкий до багатьох факторів навколишнього середовища, які можуть негативно вплинути на якість фотографій. Перехід на підхід на основі відео покращив нашу точність до 95%. Зростаюче поширення мобільних телефонів з високоякісними відеокамерами робить наш підхід легко застосовним.

Наша мета - багатоступінчасті підхід до технологічної, точної та надійної оцінки дієти. Такий підхід доповнить такі методи, як програмне забезпечення для підрахунку калорій, попередньо відфільтрувавши непотрібні предмети, які користувач повинен знайти. Першим етапом такого підходу було б надійне використання відео для ідентифікації споживаних продуктів. На майбутніх етапах буде вироблено ряд особливостей зображення, які є яскравими показниками харчових характеристик страви: їжа з великою кількістю «текстури зображення» (просторова варіація інтенсивності пікселів) може вказувати на клітковину; їжа, яка «блищить», може вказувати на високий вміст жиру і, отже, більше калорій, ніж більш рідка їжа, яка «блищить» менше. Такі особливості можуть дозволити безпосередню оцінку калорій.

У цій роботі ми демонструємо доцільність першого етапу: визначення страв за відео, щоб допомогти в оцінці калорій.

Методологія

Наш підхід - це техніка узгодження зразків. Спочатку ми створюємо базу даних навчальних зображень страв, анотованих їх калоріями. Якщо нам представлено невідоме зображення, наша система знаходить найкраще відповідні зображення із навчального набору. Потім анотовані калорії з цих найбільш відповідних зображень використовуються як оцінки калорій цього зображення.

Зйомка відео

Ми зняли відео 20 різноманітних страв у кафе Bevier, кафетерії кампусу, яким керує Департамент харчових наук та харчування людини в Університеті Іллінойсу. Bevier створив ідеальне середовище для нашої роботи. Страви можна порівняти з багатьма домашніми стравами та стравами, що подаються у сімейних ресторанах. Існуюча робота [3] використовує методи комп’ютерного зору на стравах швидкого харчування, але, наскільки нам відомо, наша спроба є першою в аналізі типових страв ресторанів, які, як правило, мають більше різноманітності, ніж фаст-фуд.

Ми отримали доступ до всіх рецептів Бев’є, що дозволило нам розрахувати за інгредієнтами харчову цінність кожної страви. Відео страв було знято з роздільною здатністю 640 x 480 пікселів; типова роздільна здатність, доступна для більшості відеокамер для мобільних телефонів, таких як Apple iPhone та Google Nexus.

У наших оцінках посуд ставили на горизонтальну вертушку з чорною скатертиною. Відеокамера була встановлена ​​на штативі і нахилена під кутом, щоб захопити весь посуд. На практиці ми передбачаємо, що користувач буде обертати тарілку вручну, сидячи за столом.

Харчові товари виглядають дуже різними з різних сторін. Наприклад, вид паніні зверху вниз не відображає вміст, затиснутий між ними. З іншого боку, 360-градусний вигляд поза віссю захоплює більш репрезентативний вигляд страви. Ми обертали поворотний стіл вручну і отримали 360-градусний вигляд страви. Кожне відео триває близько 20 секунд. На малюнку 1 зображено зразок.