R-квадрат вимірює частку варіації вашої залежної змінної (Y), поясненої вашими незалежними змінними (X) для моделі лінійної регресії. Скоригований R-квадрат коригує статистику на основі кількості незалежних змінних у моделі. 14 лютого 2019 р.
Порівняння. R-квадрат залишатиметься незмінним, коли додаватиметься більше предикторів, навіть якщо вони не мають суттєвого внеску. Це може дати помилково оптимістичне уявлення про модель. Скоригований R-квадрат є більш консервативним і зменшуватиметься, якщо додаткові змінні не сприятимуть пояснювальній силі моделі.
Загалом, із збільшенням розміру вибірки різниця між очікуваним скоригованим r-квадратом і очікуваним r-квадратом наближається до нуля; теоретично це тому, що очікуваний r-квадрат стає менш зміщеним. стандартна помилка скоригованого r-квадрату зменшуватиметься, наближаючись до нуля в межі.
R 2 завжди збільшується, коли ви додаєте предиктор до моделі, навіть якщо реального вдосконалення моделі немає. Скориговане значення R 2 включає кількість предикторів у моделі, щоб допомогти вам вибрати правильну модель.
Скоригований R-квадрат допомагає запобігти переобладнанню, включаючи штраф за кількість предикторів у моделі. На відміну від R-квадрату, який завжди збільшується з додатковими предикторами, Скоригований R-квадрат може зменшитися, якщо нові предиктори не покращать суттєво модель.
R2 має тенденцію оптимістично оцінювати підгонку лінійної регресії. Він завжди збільшується в міру того, як кількість ефектів включено в модель. Скоригований R2 намагається виправити це завищення. Скоригований R2 може зменшитися якщо конкретний ефект не покращує модель.
Однак, на відміну від r в квадраті, скоригований r у квадраті може бути негативним, що означає, що ваша модель гірша за просте середнє значення змінної результату.Від’ємний скоригований r у квадраті вказує на те, що ваша модель не має прогностичного значення, і вам слід або видалити деякі предиктори, або спробувати іншу модель.