Оцінка використання енергії процесу на ПК (x86)

Я намагаюся придумати евристику, щоб оцінити, скільки енергії (скажімо, в джоулях) процес або нитка витратили між двома часовими точками. Це на ПК (Linux/x86), а не на мобільному, тому статистика буде використана для порівняння відносної енергоефективності обчислень, які займають подібний час настінного годинника.

забезпечення

Ідея полягає в тому, щоб зібрати або взяти вибірку апаратних статистичних даних, таких як лічильник циклів, стани п/с або динамічна частота, доступ до шини тощо, і запропонувати розумну формулу для використання енергії між вимірами. Я запитую, чи можливо це і як може виглядати ця формула.

Деякі проблеми, які приходять на розум: 1) Правильний облік перемикання контексту на інші процеси (або потоки).

2) Правильний облік енергії, що використовується поза процесором. Якщо ми припускаємо незначне введення-виведення, це означає переважно оперативну пам'ять. Як сума розподілу та/або схема доступу впливає на споживання енергії? (Тобто, якщо припустити, що у мене є спосіб виміряти динамічне розподіл пам’яті для початку, наприклад, із модифікованим розподільником.)

3) Використання процесорного часу як оцінки обмежується грубим і часто неправильним обліком, лише використанням енергії центрального процесора, і передбачає фіксовані тактові частоти. Він включає, але погано враховує час, витрачений на очікування в оперативній пам'яті.

5 відповідей 5

Можливо, ви зможете отримати показник енергоспоживання вашого процесу, але він буде правильним лише окремо. Наприклад, якщо ви виконували два процеси паралельно, навряд чи ви зможете підібрати пряму лінію з хорошою точністю.

Це досить важко зробити на вбудованих платформах із повним проривом кожної напруги, не кажучи вже про ПК, де вашою єдиною точкою даних є потужність від розетки. Що потрібно буде виміряти та врахувати:

  • Базове навантаження не таке вже й базове. Простій системи протягом багатьох секунд перебуває у стані глибшого сну, ніж той, що не працює. Ви вимірюєте "глибокий" сон або просто без діла? Як ви знаєте, що ви вимірюєте?
  • Навантаження не завжди є лінійною. Змінна напруга: деякі компоненти зміщують напругу вгору/вниз залежно від навантаження та частоти. Температура: в ці дні може йти в будь-який бік (не тільки тепловий втеча).
  • Блоки живлення не однаково ефективні при всіх навантаженнях. Якщо ви вимірюєте вихідну потужність, вам слід це пам’ятати. Наприклад, це може бути на 50% ефективніше нижче 100 Вт, 90% від 100-300 Вт і до 80% 300 Вт+.
  • Додаткові процеси не обов'язково додаватимуть лінійно. Наприклад, коли DDR не працює, його базове навантаження збільшується, але додаткові процеси не погіршать цього. Це ще більш непередбачувано з кількома ядрами та змінними частотами.

Основним способом вимірювання є очевидний спосіб: записати кількість ват в режимі очікування, записати кількість ват, що використовуються, відняти. Ви можете спробувати працювати з 50% робочим циклом, 25%, 75% тощо, щоб намалювати гарний графік (лінійний чи інший). Це покаже будь-яку нелінійність. На жаль, ефективність перетворення проти навантаження як для регулятора ЦП, так і для блоку живлення буде основною причиною. Ви не можете багато чого зробити, щоб усунути це, не маючи версії для розробки материнської плати, з якою ви граєте (навряд чи), або якщо вам пощастить мати блок живлення з графіком ефективності проти навантаження.

Однак важливо усвідомити, що ці точки даних правильні лише окремо. Ви можете досить добре моделювати, як ці речі підсумовуватимуться в системі, але слід пам’ятати, що це найкраще наближення. Подумайте про це як про еквівалент перегляду деякого коду C для аудіокодека та оцінки того, як швидко він буде працювати. Ви можете отримати хорошу загальну ідею, але сподівайтесь бути надзвичайно неточними, якщо виміряти їх у реальності.

Редагувати - трохи розширивши, оскільки вищезазначене насправді не відповідає, як ви можете це зробити.

Вимірювання енергоспоживання: отримайте собі точний вимірювач потужності. Як я вже згадував, якщо у вас немає способу пробити окремі рейки напруги та виміряти струм, єдине вимірювання, яке ви можете зробити, це на виході. Крім того, якщо у вас є доступ до стану моніторингу стану здоров’я на материнській платі та з поточними (підсилювачами) звітами (рідко), це може забезпечити хорошу точність та швидкий час реагування.

Отже, виміряйте базову потужність - виберіть будь-яку ситуацію, яку ви вважаєте "базовою". Запустіть тест і виміряйте "пік". Віднімаємо, готово. Так, це досить очевидно. Якщо у вас є щось, де різниця настільки мала, що вона втрачається через шум, ви можете спробувати виміряти споживання енергії з часом (наприклад, кВт-год). Спробуйте виміряти годину на холостому ходу проти години, коли ваш процес закінчується, і подивіться загальну різницю енергій. Повторіть аналогічно для всіх типів тесту, які ви хочете виконати.

Ви отримаєте помітні різниці в потужності для важких користувачів процесорів, DDR та GPU. Ви можете помітити різницю між алгоритмами L1 та L2 проти DDR (DDR використовує набагато більше енергії), якщо ви обережно зауважте, що алгоритми, обмежені L1/L2, працюють швидше - вам потрібно враховувати енергію, що використовується на "завдання" не постійне живлення. Ви, мабуть, не помітите доступу до жорсткого диска (це насправді лише вата-два і загублене через шум у ПК), крім досягнення продуктивності. Однією додатковою точкою даних, яку варто записати, є те, наскільки збільшується "базове" навантаження, якщо у вас є завдання прокидатися кожні 100 мс або близько того, використовуючи 1% процесора. В основному так виглядає простой без глибокого сну. (Це хак, а 100 мс - це здогадка)

Пам'ятайте, що 1% може відрізнятися від 1% в інший час, якщо у вас CPU з увімкненими політиками зміни частоти.

Останнє велике зауваження: звичайно, це енергія, яку ви повинні вимірювати, точно так само, як ви назвали запитання. Дуже легко зробити помилку, порівнявши енергоспоживання одного завдання проти іншого, і зробити висновок, що одне з них дорожче. якщо ви забудете про відносну ефективність їх роботи. Наприклад, це завжди трапляється з журналістами з поганими технологіями, наприклад, порівняння жорсткого диска та SSD.

На вбудованих платформах з поточним моніторингом на багатьох рейках я проводив вимірювання до наноуль за інструкцією. Поки що важко врахувати використання енергії за допомогою потоку/процесу, оскільки існує багато навантаження, яке розділяється багатьма завданнями, і воно може збільшуватися/зменшуватися за межами часового зрізу. На ПК я не впевнений, що вам вдасться отримати настільки дрібну фракцію, як це:)