Колмогоров-Смирнов Тест на придатність

Тест Колмогорова-Смірнова (K-S) базується на емпіричній функції розподілу (ECDF). Дано Nзамовляв точки даних Y1, Y2,. YN, ECDF визначається як

    \ [E_ = n (i)/N \]

де n (i) - кількість балів менше Yi та Yi впорядковуються від найменшого до найбільшого значення. Це покрокова функція, яка збільшується на 1 /N за значенням кожної впорядкованої точки даних.

придатність

Графік нижче - графік емпіричної функції розподілу з нормальною кумулятивною функцією розподілу для 100 нормальних випадкових чисел. Тест K-S заснований на максимальній відстані між цими двома кривими.

Кілька тестів на придатність, таких як тест Андерсона-Дарлінга та тест Крамера Фон-Мізеса, є вдосконаленням тесту K-S. Оскільки ці вдосконалені тести, як правило, вважаються більш потужними, ніж оригінальний тест K-S, багато аналітиків віддають їм перевагу. Крім того, перевага для тесту K-S в тому, що критичні значення не залежать від основного розподілу, не є такою перевагою, як здається спочатку. Це пов’язано з обмеженням 3 вище (тобто параметри розподілу, як правило, невідомі, і їх слід оцінювати за даними). Отже, на практиці критичні значення для тесту K-S повинні визначатися моделюванням, як і для тестів Андерсона-Дарлінга та Крамера Фон-Мізеса (та пов'язаних з ними).

Існує багато непараметричних та надійних методів, які не засновані на сильних припущеннях щодо розподілу. Під непараметричною ми маємо на увазі техніку, таку як тест на знаки, яка не базується на конкретному припущенні про розподіл. Під надійною, ми маємо на увазі статистичну техніку, яка добре працює за широкого кола припущень про розподіл. Однак методи, засновані на конкретних розподільчих припущеннях, загалом є більш потужними, ніж ці непараметричні та надійні методи. Під владою ми маємо на увазі здатність виявляти різницю, коли ця різниця існує насправді. Тому, якщо припущення щодо розподілу можна підтвердити, параметричні методи, як правило, є кращими.