Большой коммерческий банк заказал маркетинговое исследование по выявлению эффекта "премирования" (калькулятор, набор.. Большой коммерческий банк заказал маркетинговое исследование по выявлению эффекта "премирования" (калькулятор, набор ручек и др.) Как стимула для открытия счета в банке. Для проверки случайным образом было отобрано 200 "премируемых" посетителей и 200 "непремиёваних" .В результате выяснилось, что 89% посетителей, которым предлагалась премия, и 79% посетителей, которым не предлагалась премия, открыли счет в банке в течение 6 месяцев. Используя эти данные, проверить гипотезу о том, что доля "премируемых" посетителей, которые открыли счет в банке, статистически существенно отличается от удельного веса "непремиёваних" посетителей, которые открыли счет в банке. Уровень значимости принять равным α = 0,05.
Теперь вычислим ожидаемые частоты для каждой ячейки по формуле: E = (Общее количество посетителей в строке * Общее количество посетителей в столбце) / Общее количество посетителей
Для ячейки Pr(открыли счет | премируемые) = (178+22) / 400 = 0.5 Для ячейки Pr(открыли счет | не премируемые) = (158+42) / 400 = 0.4
Число степеней свободы df = (число строк - 1) * (число столбцов - 1) = 1
По таблице критических значений для критерия хи-квадрат определим критическое значение при уровне значимости α = 0.05 для 1 степени свободы: χ^2(0.05, 1) ≈ 3.84
Так как полученное значение статистики хи-квадрат (2.5) меньше критического значения (3.84), то нет оснований отвергнуть нулевую гипотезу. Таким образом, на уровне значимости α = 0.05 нет статистически значимого различия между долей "премируемых" и "непремируемых" посетителей, которые открыли счет в банке.
Для проверки данной гипотезы будем использовать критерий хи-квадрат.
Сначала составим таблицу сопряженности:
Открыли счетНе открыли счетИтогоПремируемые17822200Не премируемые15842200Итого33664400Теперь вычислим ожидаемые частоты для каждой ячейки по формуле:
E = (Общее количество посетителей в строке * Общее количество посетителей в столбце) / Общее количество посетителей
Для ячейки Pr(открыли счет | премируемые) = (178+22) / 400 = 0.5
Для ячейки Pr(открыли счет | не премируемые) = (158+42) / 400 = 0.4
E(премируемые, открыли счет) = 200 336 / 400 = 168
E(премируемые, не открыли счет) = 200 64 / 400 = 32
E(не премируемые, открыли счет) = 200 336 / 400 = 168
E(не премируемые, не открыли счет) = 200 64 / 400 = 32
Теперь вычислим значение статистики хи-квадрат:
χ^2 = Σ((O - E)^2 / E) = ((178 - 168)^2 / 168) + ((22-32)^2 / 32) + ((158-168)^2 / 168) + ((42-32)^2 / 32) = 2.5
Число степеней свободы df = (число строк - 1) * (число столбцов - 1) = 1
По таблице критических значений для критерия хи-квадрат определим критическое значение при уровне значимости α = 0.05 для 1 степени свободы: χ^2(0.05, 1) ≈ 3.84
Так как полученное значение статистики хи-квадрат (2.5) меньше критического значения (3.84), то нет оснований отвергнуть нулевую гипотезу. Таким образом, на уровне значимости α = 0.05 нет статистически значимого различия между долей "премируемых" и "непремируемых" посетителей, которые открыли счет в банке.