Capstone

Остаточний розбирач

disassembler

Побудова та програмування за допомогою “дієтичного” двигуна

Ця документація представляє, як побудувати Capstone для архітектури X86, щоб мінімізувати бібліотеки для цілей вбудування.

Пізніше частина представляє API, пов’язані з цією функцією, і рекомендує області, на які слід звернути увагу програмістам у своєму коді.

1. Побудова “дієтичного” двигуна

Як правило, ми використовуємо Capstone для звичайних застосувань, де вага бібліотеки насправді не має значення. Дійсно, станом на версію 2.1-RC1, весь двигун займає лише 1,9 МБ, включаючи всі архітектури, і цей розмір не викликає проблем у більшості людей.

Однак бувають випадки, коли ми хочемо вбудувати Capstone у спеціальні середовища, такі як драйвер ядра ОС або прошивка, де його розмір повинен бути якомога меншим через обмеження простору. Хоча ми завжди можемо зібрати лише вибрані архітектури, щоб зробити бібліотеки більш компактними, ми все одно хочемо їх зменшити.

До цього об'єкта, починаючи з версії 2.1, Capstone підтримує режим дієти, в якому видаляються деякі некритичні дані, що робить розмір двигуна принаймні на 40% меншим.

За замовчуванням Capstone будується у стандартному режимі. Для побудови дієтичного двигуна виконайте: (демонстрація на системах * nix)


Якщо ми будуємо лише вибрані архітектури, двигун ще менше. Знайдіть нижче розмір для кожної окремої архітектури, складеної в режимі дієти.

Бібліотека архітектури Стандартний двійковий двійковий файл “Дієта” Зменшений розмір
Рука libcapstone.a
libcapstone.dylib
730 КБ
599 КБ
603 КБ
491 КБ
18%
19%
Arm64 libcapstone.a
libcapstone.dylib
519 КБ
398 КБ
386 КБ
273 КБ
26%
32%
Міпи libcapstone.a
libcapstone.dylib
206 КБ
164 КБ
136 КБ
95 КБ
34%
43%
PowerPC libcapstone.a
libcapstone.dylib
140 КБ
103 КБ
69 КБ
50 КБ
51%
52%
X86 libcapstone.a
libcapstone.dylib
809 КБ
728 КБ
486 КБ
452 КБ
40%
38%
Поєднайте всі арки libcapstone.a
libcapstone.dylib
2,3 МБ
1,9 МБ
1,6 МБ
1,3 МБ
31%
32%


(Вищі статистичні дані були зібрані станом на версію 2.1-RC1, побудовану на Mac OSX 10.9.1 з clang-500.2.79)

2. Програмування з “дієтичним” двигуном

2.1 Невідповідні поля даних з двигуном “дієти”

Щоб значно зменшити об'єм двигуна, слід пожертвувати деякими внутрішніми даними. Зокрема, наступні поля даних у структурі cs_insn стають неактуальними.

Поле даних Значення Замінено на
@mnemonic Мнемоніка навчання @id
@op_str Рядок інструкцій операнда @ деталь-> операнди
@ detail-> regs_read
@ detail-> regs_read_count
Реєстри, які неявно читаються за інструкцією Ні
@ detail-> regs_write
@ detail-> regs_write_count
Реєстри, неявно написані за інструкцією Ні
@ деталь-> групи
@ деталь-> рахунок_груп
Навчання семантичним групам належить Ні


Хоча ці відомості відсутні, на щастя, ми все ще можемо опрацювати важливу інформацію з рештою полів даних структури cs_insn.

@mnemonic

Без мнемонічної інформації ми можемо покладатися на поле @id структури cs_insn.

Наприклад, інструкція “ДОДАТИ EAX, EBX” матиме @id як X86_INS_ADD.

@op_str

Без рядка операнда ми все ще можемо витягти еквівалентну інформацію з операндів @ detail->, що містить усі подробиці про операнди інструкції.

Наприклад, інструкція “ДОДАТИ EAX, EBX” матиме 2 операнди типу реєстру X86_OP_REG, з ідентифікаторами регістрів X86_REG_EAX та X86_REG_EBX.

Крім того, усі деталі в залежних від архітектури структурах, таких як cs_arm, cs_arm64, cs_mips, cs_ppc & cs_x86, все ще доступні нам для опрацювання всієї необхідної інформації, навіть без відсутніх полів.

2.2 Нерелевантні API з “дієтичним” механізмом

Хоча більшість API Capstone все ще функціонують абсолютно однаково, через ці відсутні поля даних, наступні API стають неактуальними.

cs_reg_name ()

Отримавши ідентифікатор реєстру (наприклад, X86_REG_EAX), ми більше не можемо отримати його ім’я реєстру.

cs_insn_name ()

Отримавши ідентифікатор інструкції (наприклад, X86_INS_SUB), ми більше не можемо отримати її назву.

cs_insn_group ()

Ми більше не маємо інформації про групу, тому ми не можемо перевірити, чи належить інструкція до певної групи.

cs_reg_read ()

Ми більше не маємо інформації про регістри, які неявно читаються інструкціями, тому ми не можемо сказати, чи читає інструкція певний регістр.

cs_write_read ()

Ми більше не маємо інформації про регістри, які неявно зчитуються інструкціями, тому ми не можемо визначити, чи змінює інструкція певний регістр.


Під неактуальним, ми маємо на увазі, що вищевказані API повертатимуть невизначене значення. Тому програмістів попереджають не використовувати ці API в дієтичному режимі.

2.3 Перевірка двигуна на стан “дієти”

Capstone дозволяє нам перевірити, чи движок був складений в дієтичному режимі cs_support () API, як показано нижче - зразок коду на C.


За допомогою Python ми можемо або перевірити режим дієти за допомогою функції cs_support модуля Capstone, як показано нижче.


Або ми також можемо використовувати дієта геттер класу Cs з тією ж метою, як показано нижче.