6  Сенімділік интервалдары және гипотезаны тексеру

Жоспар

  1. Сенiмдiк аралықтары
  2. Сенiмдiк аралықтары бар гипотезаны тексеру
  3. P-мәнi
  4. Бір және екi жақты гипотеза тесттерi

Орталық шектi теорема

  • Егер \(X\) күту \(\mu\) және стандартты ауытқу \(\sigma\) болатын кездейсоқ айнымалы болса және бұл айнымалының \(n\) бақылаулары болса, онда үлгі орташасының таралуы
  • \(\bar{X} \sim N(\textrm{ mean } = \mu, \textrm{ sd } = \frac{\sigma}{\sqrt{n}})\)
  • Көптеген үлгі статистикасы қалыпты таралған.
  • үлгі орташа мәні, \(\bar{X}\)
  • үлгі пропорциялары, \(\bar{P}\)
  • үлгі орташа мәндерінің айырмашылығы, \(\bar{X_1} - \bar{X_2}\)
  • үлгі пропорцияларының айырмашылығы, \(\bar{P_1} - \bar{P_2}\)

Нүктелік бағалау және аралық бағалау

  • Нүктелік бағалау - бұл жай ғана бір сан
  • Мысалы, біз Астанадан келген 100 ер адамның салмағын өлшедік. Орташа салмағы 75 килограмм болды. 75 килограмм - Астанадағы барлық ер адамдардың орташа салмағының нүктелік бағалауы.
  • Интервалдық бағалау, сіз болжағандай, мәндер аралығы.
  • Мысалы, 75 килограммның орнына 75 +/- 5 килограммды алуға болады: [70, 80]
  • Біздің аралықта нақты популяциялық орташа мәннің болуы қаншалықты ықтимал?

Орташа мәннен қашықтық

  • Бізде стандартты қалыпты айнымалы бар, \(Z\sim N(0, 1)\)
  • Орташа мәннен 1 стандартты ауытқу шегінде қанша бақылау бар.

\[ P(-1<Z<1) \approx 68.3\% \]

Орташа мәннен қашықтық

  • \(Z\sim N(0, 1)\) үшін орташа мәннен 2 стандартты ауытқу шегінде қанша бақылау бар?

    \[ P(-2 < Z < 2) \approx 95.4\% \]

Орташа мәннен қашықтық

  • 95% ықтималдықпен үлестірімнің центріне жету үшін қанша стандартты ауытқу «жүру» керек?

\[\begin{align*} P(-z < Z < z) = 95\% \\ 1 - P(Z > z \cup Z < -z ) = 95\% \\ 1 - P(Z > z) - P(Z < - z) = 95\% \\ 2*P(Z < - z) = 5\% \\ P(Z < - z) = 2.5\% \\ \end{align*}\]

  • Мұны кодты пайдаланып есептеуге болады.
qnorm(0.025, mean = 0, sd = 1) %>% abs()
[1] 1.959964

Мысал

  • Зерттеуші бос жұмыс орындарына 200 доллар тұратын жалған түйіндемелер жіберді.

  • Түйіндемелер бірдей, бірақ жартысы «ер», ал жартысы «әйел».

  • Ерлерге 23 рет, әйелдерге 8 рет қоңырау шалынды.

  • Біздің деректеріміз ерлердің әйелдерге қарағанда «шақыру» алу ықтималдығы жоғары екенін білдіре ме?

  • Шақырудың «ықтималдылығы» нені білдіреді? Бір түсіндірме - популяцияның үлесі: егер бізде барлық еңбекке қабілетті ерлер мен әйелдер туралы деректер болса,

  • Бізде екі үлгі пропорциясы бар. CLT арқасында біз олардың айырмашылығы қалыпты түрде бөлінгенін білеміз.

  • Стандартты қате \(3,5%\) деп есептейік

  • Яғни, біз “орташа” бойынша \(3,5%\)-қа ауытқып отырмыз

  • Нүктелік бағалау екі популяция арасындағы шынайы айырмашылыққа тең болуы екіталай. Бірақ аралықты алсақ ше?

Бізде не бар?

  • Нүктелік бағалау: \(\Delta p= \hat{p}_{male} - \hat{p}_{female} = 15%\)
  • Байланысты айнымалы қалыпты түрде таралған: \(\Delta P \sim N(\textrm{ true difference }, 3,5%)\)
  • Біз не білеміз?
  • Барлық нүктелік бағалаулардың 95%-ы шынайы орталықтан (true difference) 1,96 стандартты ауытқу шегінде болады
  • Яғни, егер біз 15% ,96*3,5%$ аралығын құрсақ, онда 95% ықтималдықпен шынайы айырмашылық болады.

  • \(\hat{p} = 15%, SE_{\hat{P}} = 3.5%\) - нүктелік бағалау және стандартты қате
  • \(z^*_{95\%} = \textrm{ qnorm(0.025, 0, 1) %>% abs() } = 1.96\) - қашықтық
  • 95% CI: \(\hat{p} \pm z^{*}\times SE = 15% \pm 1.96*3.5\% = (8.14, 21.86)\) - интервал
  • Түсіндірме: Барлық бағалаулардың 95%-ы шын параметрден 1.96 стандартты ауытқу шегінде екенін білеміз
  • \((8.14, 21.86)\) интервалында нақты айырмашылық бар екеніне 95% сенімдіміз
  • Нәтижелерді былай жеткізе аламыз:
  • Әйел мен ер адамды шақыру ықтималдығы арасындағы нақты айырмашылықты \(8.14%\) деп бағалаймыз 95% сенімділік деңгейінде \(21,86%\) дейін

Сенiмдiлiк аралығының жалпы формуласы

  • Популяцияның орташа мәнi үшiн сенiмдiлiк аралығы: iрiктеменiң орташа мәнiне плюс немесе минус қате шегi \[CI_{\alpha}: \bar{x} \pm z^*\times SE = \bar{x} \pm z^{*}\times \frac{\sigma}{\sqrt{n}}\]

  • \(\bar{x}, \sigma, n\) мәндері iрiктеменiң негiзiнде есептеледi

  • бiз тек \(z^{*}\) мәндерiн iрiктейміз. Әдетте, деңгейлер: \(90\%\), \(95\%\) немесе \(99\%\) болады.

Сенiмдiлiк деңгейi z-мағына
90% 1.645
95% 1.96
99% 2.576

7 Гипотезаны тексеру

Мысал

  • Досыңыз спортшы студент-студенттердің басқа студенттерге қарағанда оқуда жақсы нәтиже көрсеткенін айтады делік.
  • Сіз спортпен шұғылданатын 100 кездейсоқ студенттен сауалнама алып, олардың орташа GPA көрсеткіші 3,4 ұпай екенін анықтадыңыз.
  • Алдыңғы зерттеулерден сіз Қазақстандағы орташа GPA көрсеткіші 3,3 ұпай, ал стандартты ауытқу көрсеткіші 0,3 ұпай екенін білесіз.
  • Сіздің деректеріңіз спортпен шұғылданатын студенттердің оқуда орташа көрсеткіші жақсы екенін дәлелдей ме?

Формализм

  • Енгізілген деректерді формальды етейік: кездейсоқ студенттің GPA көрсеткішін беретін \(X\) кездейсоқ айнымалысы бар. Оның таралуы белгісіз: \(X \sim Any(\mu, \sigma)\)
  • Біз 100 кездейсоқ спортшы студент-студенттерді алып, олардың орташа GPA көрсеткішін есептейміз. Бұл тағы бір кездейсоқ айнымалы, оны \(\bar{X}\) деп белгілейміз. Орталық шекті теоремадан \(\bar{X} \sim N(\mu_{sport}, \frac{\sigma}{\sqrt{n}})\) екенін білеміз.
  • \(\mu_{sport}\) - белгісіз, бірақ біз болжауға болады
  • Мысалы, егер досымыз дұрыс айтса және “спортшылар” жақсы оқитын болса, олардың орташа бағасы ұлттық орташадан жоғары болуы керек.
  • \(\mu_{sport} > 3.3\)
  • Егер досымыз қателессе және “спортшылар” ұлттық орташадан жақсы болмаса, онда олардың орташа бағасы басқалардың орташа бағасымен бірдей болуы керек.
  • \(\mu_{sport} = 3.3\)
  • Қай тұжырымның сенімдірек екенін қалай тексеруге болады?

Гипотезалар

  • Нөлдік гипотеза - \(H_{0}\) - айнымалылар арасында ешқандай байланыс жоқ (спорт GPA-да ешқандай рөл атқармайды).
  • Мысалы, айыпталушы кінәлі ЕМЕС; студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетпейді.
  • Балама гипотеза - \(H_{A}\) - Айнымалылар арасында байланыс бар (спорттық қатысу GPA-ға әсер етеді).
  • Айыпталушы кінәлі; студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетеді.

Гипотезаны тексеру

  • Гипотезалар бір-бірін жоққа шығаратын және жалпы алғанда толық болуы керек.
  • Айыпталушы кінәлі емес (\(H_{0}\)) немесе кінәлі (\(H_{A}\)) - ортаңғы жол жоқ.
  • Студент-спортшылар жалпы студенттерге қарағанда академиялық тұрғыдан жақсы нәтиже көрсетпейді (\(H_{0}\)) НЕМЕСЕ олар академиялық тұрғыдан жақсы нәтиже көрсетеді (\(H_{A}\))
  • Негізгі идея: \(H_{0}\) әрқашан басқаша дәлелденгенге дейін шындық деп есептеледі (\(H_{A}\)).
  • Мысалы, айыпталушы кінәсінің сенімді дәлелі болғанға дейін әрқашан әдепкі бойынша кінәлі емес (кінәсіздік презумпциясы).
  • Студент-спортшылар жалпы студенттерге қарағанда жақсы нәтиже көрсетпейді, олардың жоғары өнімділігінің сенімді дәлелі болғанға дейін.

Гипотезаны тексеру: Тұжырымдамалық

  • Деректерді талдау - бұл скептицизм: «дәлелдеу ауыртпалығы тұжырымдаманы жасаушыда».
  • Нөлдік гипотеза байланыстардың болмауы туралы, яғни ол скептицизм. Жалпы идея - бізде сенімді дәлелдер болғанша бәріне (байланыстардың болуына) күмәндануымыз керек.

Гипотезаны қалай тексеруге болады?

  1. Нөлдік гипотезаның ақиқат екенін есептеңіз.
  2. Нөлдік гипотезаның ақиқат екенін ескере отырып, деректердің қаншалықты ықтимал екенін сұраңыз.
  3. Егер деректер екіталай болса, біз нөлдік гипотезаны балама пайдасына қабылдамаймыз.
  4. Егер деректер ықтимал болса, біз нөлдік гипотезаны қабылдамаймыз (яғни, біз қазіргі күйінде қаламыз).

Мысал

  • “Спортшыларға” оралайық. Бізде:

  • Үлгі орташасы: \(\bar{x} = 3.4\)

  • Стандартты ауытқу: \(\sigma = 0.3\)

  • Ал үлгі өлшемі: \(n = 100\)

  • Нөлдік гипотеза (\(H_0\)) дұрыс деп есептейік. Бұл нені білдіреді?

  • \(X_{sport}\) \(N(\mu_{sport} = 3.3, \sigma_{sport} = 0.3)\) үлестіріміне ие

  • Демек, 100 бақылаудың орташа мәні, \(\overline{X}_{sport} \sim N(3.3, SE = \frac{0.3}{10})\)

  • Енді осы шарт бойынша үлгі орташасын \(3.4\) немесе одан жоғары ( \(P(\overline{X}_{sport} \geq 3.4\)) ) бақылау ықтималдығы қандай екенін сұрайық.

P-мәні

  • p-мәні - нөлдік гипотеза ақиқат болған жағдайда, “біздікі сияқты” деректерді бақылау ықтималдығы.

\[ P(\bar{X} > 3.4|H_{0} \textrm{ is TRUE}) \\ P(\bar{X} > 3.4)| H_{0}: \bar{X} \sim N(\mu = 3.3, SE = 0.03) \\ \]

  • Бұл z-мәні \(3.33\)-тан үлкен жағдайға ұқсас

\[ z = \frac{\bar{x} - \mu}{SE} = \frac{3.4 - 3.3}{0.03} \approx 3.33 \\ P(Z > 3.33) \approx 0.0004\% \]

Графикалық түрде

Warning: Removed 60 rows containing missing values or values outside the scale range
(`geom_area()`).

Түсіндіру

  • p-мәні - нөлдік гипотеза (\(H_{0}\)) дұрыс болған жағдайда «деректердің» ықтималдығы.
  • Егер p-мәні белгілі бір маңыздылық деңгейінен (\(\alpha\)) аз болса, біздікі сияқты «деректерді» бақылау өте ықтимал емес деп айтамыз, сондықтан \(H_{0}\) қабылдамаймыз.
  • Егер p-мәні \(\mathbf{\alpha}\)-тан үлкен болса, біздікі сияқты мәндерді бақылау өте ықтимал деп айтамыз, сондықтан \(H_{0}\) қабылдамаймыз.

Шешім қалай қабылданады

Warning: Removed 60 rows containing missing values or values outside the scale range
(`geom_area()`).

  • Біздің p-мәніміз өте аз: бақыланатын үлгі орташасы «спортшылар» басқалар сияқты оқиды деп есептесек, өте ықтимал емес.
  • Біз \(H_{0}\) қабылдамаймыз. Егер «спортшылар» бірдей болса, онда 100 студент үшін орташа мәннің 3,4 немесе одан жоғары болу ықтималдығы 0,04% құрайды.
  • 3.3 гипотетикалық орташасы мен 3.4 үлгілік орташасы арасындағы айырмашылықты кездейсоқтыққа жатқызуға болмайды.

p-мәні және сенімділік аралығы

  • “Спортшыларымызға” оралайық
  • Бізде: \(\bar{x} = 3.4, \sigma = 0.3, n = 100\)
  • Біз 95% сенімділік аралығын құра аламыз.

\[ \bar{x} \pm z^{*}_{95\%}\times\frac{\sigma}{\sqrt{n}} = 3.4 \pm 1.96\times\frac{0.3}{10} = \\ 3.4 \pm 1.96\times0.03\approx (3.34, 3.45) \]

p-мәні және сенімділік аралығы

  • Жарайды, бізде \((3.34, 3.45)\) аралығы бар. Ол бізге не айта алады?

  • Бұл студент-спортшылардың орташа академиялық көрсеткіштері жақсы деген гипотезаны растай ма?

  • \(H_{0}: \mu = 3.3\); \(H_{A}: \mu > 3.3\)

  • \(\mu = 3.3 \notin (3.34, 3.45) \implies H_{0} \textrm{ rejected }\)

  • Біздің сенімділік аралығымызда гипотезаланған орташа мән жоқ. Және ол тек 5% жағдайда ғана қате.

1- және 2-құйрықты тесттер

  • Жоғарыдағы мысалда бізді “спортшылар орташа студенттерден жақсырақ” деген гипотеза қызықтырды: \(\mu_{sport} > \mu_{all}\).
  • Бірақ егер біз жалпы сұрақ қойсақ ше: «Спортшылар кәдімгі студенттерге ұқсамайды»: \(\mu_{sport} \neq \mu_{all}\)
  • Мұны екі сценарий ретінде көрсетуге болады: олар жақсырақ немесе нашар: \(\mu_{sport} > \mu_{all}\) немесе \(\mu_{sport} < \mu_{all}\)
  • Мұндай гипотезаларды тексеру екі жақты тест деп аталады
  • Екі жақты гипотеза үшін p-мәні әдетте бір жақты гипотезадан екі есе үлкен болады, себебі біз екі оқиғаның ықтималдықтарын («жақсырақ» және «нашар») қарастырамыз

Мысал

  • Жалпы мағынасы: \(\textrm{p-value} = P("Data"|\textrm{Null Hypothesis True})\)

  • Нөлдік гипотеза: \(\mu_{sport} = 3.3\)

  • Бір жақты балама гипотеза: \(\mu_{sport} > 3.3 \implies \textrm{p-value} = P(\overline{X} > 3.4|H_{0})\)

  • 2 жақты балама гипотеза: \(\mu_{sport} \neq 3.3 \implies \textrm{p-value} = P(\overline{X} > 3.4 \textrm{ OR } \overline{X} < 3.2 | H_{0})\)

Үлгі орташасы үшін гипотезаны тексеру. Жалпы алгоритм

  1. Гипотезаларды көрсетіңіз
  • \(H_{0}: \mu = \textrm{ null value }\)
  • \(H_{A}: \mu < \textrm{ or } > \textrm{ or } \neq \textrm{ null value }\)
  1. Үлгі орташасын есептеңіз: \(\overline{x}\)
  2. \(H_{0}\) берілген үлестірімді анықтаңыз. Үлгі орташасы үшін z-мәнін есептейміз және біздікінен үлкен орташа мәнді байқау ықтималдығын анықтаймыз.
  • \(z = \frac{\overline{x} - \mu_{0}}{SE_{0}}, SE_{0} = \frac{sd}{\sqrt{n}}, P(Z > |z||H_{0}) = p\_value\)
  1. p-мәнін маңыздылық деңгейімен салыстырыңыз
  • Егер \(p\_value < \alpha\) болса, \(H_{0}\) қабылданбаса, деректер \(H_{A}\)-ға қатты қолдау көрсетеді
  • Егер \(p\_value > \alpha\) болса, \(H_{0}\) қабылданбаса, деректер \(H_{A}\)-ға қатты қолдау көрсетпейді

Мысал

  • Бір зерттеуші өзінің әріптестерінің қаншалықты оқығанын тексеруді шешті. Ол кездейсоқ $100 студенттерді сауалнамаға тартты, ал оқудың орташа уақыты аптасына \(10,3\) сағатты құрады. - Алдыңғы зерттеулерден студент Қазақстандағы орташа студент аптасына 9,8 сағат оқитынын, стандартты ауытқуы 2 сағат екенін біледі.
  • Оқушының сыныптастары Қазақстандағы оқушыларға қарағанда орташа есеппен көбірек оқиды деген гипотезаны тексеріңіз. 0,01 маңыздылық деңгейін пайдаланыңыз.

\[ H_{0}: \mu_{uni} = 9.8 = \mu_{kz}\\ H_{A}: \mu_{uni} > 9.8 = \mu_{kz} \]

Мысал

  • \(H_{0}\) дұрыс делік, онда кездейсоқ сыныптас типтік оқушыдан еш айырмашылығы жоқ: \(X_{uni} \sim X_{kz} \sim N(\mu_{kz} = 9.8, \sigma_{kz} = 2)\)

  • Егер солай болса, онда мұндай 100 студенттің орташа саны \(\overline{X}_{uni} \sim N(\mu = 9.8, SE = \frac{sd}{\sqrt{n}} = \frac{2}{\sqrt{100}} = 0.2)\) ретінде бөлінеді

  • Біз \(\overline{X} = 10.3\) байқаймыз және бұл бақылаудың біздің күтуімізден қаншалықты алыс екенін есептей аламыз: \(z = \frac{10.3 - 9.8}{0.2} = 2.5\)

  • Енді ықтималдықтарды есептей аламыз: \(P(\overline{X} > 10.3|H_{0}: \overline{X} \sim N(\mu = 9.8, SE = 0.2)) = P(Z > 2.5|H_{0}) \approx 0.006 < \alpha = 0.01\)

  • \(p\_value < \alpha\), сондықтан \(H_{0}\) мәнін \(H_{A}\) мәніне ауыстырамыз.

1- және 2-құйрықты тесттер

  • Жоғарыдағы мысалда біз 1-құйрықты тест жүргіздік: \(\mu_{uni} > \mu_{kz}\), бұл белгілі бір университеттегі студенттердің орташа есеппен Қазақстандағы студенттерге қарағанда көбірек оқитынын көрсетеді.
  • Енді университеттегі студенттер Қазақстандағы студенттер сияқты жақсы оқымайтынын айтатын \(\mu_{uni} \neq \mu_{KZ}\) 2-құйрықты гипотезаны тексергіміз келеді делік.

2-құйрықты тест

\[ P(Z < -2.5 \textrm{ OR } Z > 2.5| H_{0} \textrm{ is true}) = \\ P(\overline{X} < 9.3 \textrm{ OR } \overline{X} > 10.3| H_{0} \textrm{ is true}) \\ \approx 2 \times 0.006 = 0.012 > 0.01 = \alpha \]

  • Бұл жағдайда біз \(H_{0}\)-ты ҚАРСЫ АЛМАЙМЫЗ: деректер университет студенттерінің орташа есеппен \(99%\) сенімділік деңгейінде Қазақстандағы студенттерге қарағанда көбірек НЕМЕСЕ аз оқитынын нақты дәлелдемейді.
  • Егер \(H_{0}\) дұрыс болса, онда үлгінің орташа мәні \(1,2%\) олардың күтуінен (үлестіру орталығынан) екі \(2,5\) стандартты ауытқу шегінде болар еді.

8 Басқа бағалаулар үшін статистикалық қорытынды

Кездейсоқ айнымалылар қалыпты таралған

  • Үлгі орташа мәндері \(\overline{X} \sim N\)
  • Үлгі орташа мәндері арасындағы айырмашылық \(\overline{X_1} - \overline{X_2} \sim N\)
  • Үлгі пропорциясы \(\hat{P} \sim N\)
  • Үлгі пропорциялары арасындағы айырмашылық \(\hat{P_1} - \hat{P_2} \sim N\)

Жалпы тәсіл

  • Қалыптыға жақын бағалаулар үшін сенімділік аралығы \[\textrm{нүктелік бағалау} \pm z^{*} \times SE\]

  • Гипотезаны тексеру \[z = \frac{\textrm{нүктелік бағалау - null}}{SE} \\ \textrm{p-мәні} = P(Z > z) \textrm{, егер 1 жақты гипотеза болса} \\ \textrm{p-мәні} = P(Z > z) + P(Z < z) \textrm{, егер 2 жақты болса гипотеза} \]

Стандартты қате

  • Ең қиыны - стандартты қатені, \(SE\), табу, себебі ол бағалау түріне байланысты
  • мысалы, үлгінің стандартты қателігі орташа: \(SE(\overline{X}) = \frac{\sigma}{\sqrt{N}}\)
  • бірақ үлгі пропорциясы үшін: \(SE(\hat{P}) = \sqrt{\frac{p_0*(1-p_0)}{N}}\)
  • Қазірше \(SE\) белгілі деп есептейміз.

Стандартты қате II

  • Еске сала кетейік, стандартты қате - бұл үлгі статистикаңыздың стандартты ауытқуы (орташа мән, пропорция және т.б.)
  • Айталық, сізде \(X \sim Any(\mu, \sigma)\) айнымалысы бар делік
  • Сіз осы айнымалының \(n\) бақылауларын аласыз - бұл сіздің үлгіңіз.
  • Содан кейін сіз үлгі үшін статистиканы есептейсіз, мысалы, орташа \(\overline{X}\)
  • Үлгі статистикаңыздың стандартты ауытқуы стандартты қателік болып табылады.

Мысал

Сіздің ойыңызша, 2017 жылы Германия халқының қанша пайызы мигранттардан тұрды?

  1. 15%
  2. 20%
  3. 25%

Мысал

Дұрыс жауап

  1. БҰҰ-ның кейбір есебіне сәйкес 15%

Мысал

Енді біз кездейсоқ 400 оқушыдан сауалнама жүргіздік деп елестетіп көріңіз, олардың 150-і немесе 37,5%-ы дұрыс жауап берді. Үлгі үлесінің стандартты қателігі 2,4% құрайды. Бұл деректер студенттердің Германияны орташа есеппен, айталық, 0,01 маңыздылық деңгейіндегі тиын лақтырудан гөрі жақсы түсінетінін дәлелдей ме?

Кішкене математика (таңдау)

  • \(\hat{P}_n = \frac{Y}{n}\) - \(n\) сынақтарындағы «табыстар» үлесі

  • шынайы, бірақ белгісіз популяция үлесінің бағасы \(p_{true}\)

  • Гипотезаларды тексерген кезде, біз популяцияның шынайы үлесі қандай да бір гипотетикалық мәнге \(p_{true} = p_{0}\) тең деп есептейміз және бұл қаншалықты ықтимал екенін білгіміз келеді.

  • Табыстар саны биномдық айнымалы екенін көруге болады: \(Y \sim Bi(p_0, n)\), бұл \(E[Y] = p_{0}n\) және \(var(Y) = p_{0}(1-p_{0})n\) дегенді білдіреді.

Тағы математика (таңдау)

  • \(\hat{P}_n\) \[ үлгі пропорциясының күтілетін мәні қандай? E[\hat{P}_n] = E\big[\frac{Y}{n}\big] = \frac{1}{n}E[Y]=\frac{p_0n}{n} = p_0 \]
  • Дисперсия туралы не деуге болады? \[ var(\hat{P}_n) = var\big( \frac{Y}{n} \big) = \frac{1}{n^2}var(Y) = \frac{p_0(1-p_0)n}{n^2} = \frac{p_0(1-p_0)}{n} \]

(таңдау)

  • \(\hat{P}_n\) \[ sd(\hat{P}_n) = \sqrt{\frac{p_{0}(1-p_{0})}{n}} стандартты қатесі \]
  • Мен сізге мысалдағы стандартты қате \(2.4\%\) екенін айттым, бәрі сәйкес келеді \[ sd(\hat{P}_n) = \sqrt{\frac{0.33(1-0.33)}{400}} \approx 0.024 \]

Мысал

Мысалға оралайық, біз 400 кездейсоқ студенттен сауалнама алынды, оның 150-і немесе 37,5%-ы дұрыс жауап берді. Іріктеме үлесінің стандартты қателігі 2,4%-ды құрады. Бұл деректер студенттердің Германияны орташа есеппен, айталық, 0,01 маңыздылық деңгейіндегі тиын лақтырудан гөрі жақсы түсінетінін дәлелдей ме?

Шешімі

  1. Гипотезалар

\[ H_{0}: p_{uni} = 0.33 = p_{0} \\ H_{A}: p_{uni} > 0.33 = p_{0} \]

  1. Нүктелік бағалау: \(\hat{p} = 0.375\)

  2. z-статистикасын және p-мәнін есептеңіз

\[ z = \frac{\hat{p} - p_0}{SE} = \frac{0.375 - 0.333}{0.024} = \frac{0.042}{0.024} = 1.75 \\ \textrm{p-value} = P(Z > 1.75|H_0) \approx 0.04\% > 0.01 = \alpha \implies \textrm{ҚАБЫЛДАМАҢЫЗ } H_0 \]

pnorm(1.75, mean = 0, sd = 1, lower.tail = FALSE)
[1] 0.04005916

Соңғы қадам

  1. Деректер орташа студенттің Германияны кездейсоқтықтан гөрі жақсы түсінетінін толық дәлелдемейді.

Енді R-де де солай.

  • prop.test() функциясы шын пропорцияның қандай да бір мәнге (сіз ұсынған мәнге) тең екендігі туралы гипотезаны тексереді.
test <- prop.test(150, n = 400, p = 0.33,
alternative = "greater",
conf.level = 0.99)
test

    1-sample proportions test with continuity correction

data:  150 out of 400, null probability 0.33
X-squared = 3.4628, df = 1, p-value = 0.03138
alternative hypothesis: true p is greater than 0.33
99 percent confidence interval:
 0.3195126 1.0000000
sample estimates:
    p 
0.375 
test$p.value < 0.01
[1] FALSE
  • Біз не істейміз? Қабылданбаңыз!

Біз параметрлермен ойнай аламыз.

another_test <- prop.test(150, n = 400, p = 0.33,
alternative = "two.sided",
conf.level = 0.95)
another_test

    1-sample proportions test with continuity correction

data:  150 out of 400, null probability 0.33
X-squared = 3.4628, df = 1, p-value = 0.06276
alternative hypothesis: true p is not equal to 0.33
95 percent confidence interval:
 0.3277503 0.4246901
sample estimates:
    p 
0.375 

Екі пропорция

  • \(\hat{P}_1\) және \(\hat{P}_2\) - екі үлгі үшін екі пропорция, \(n_1, n_2\)
  • \(\hat{P}_1 = 0.23\) және \(\hat{P}_2 = 0.08\)
  • \(n_1 = 100\) және \(n_2 = 100\)
  • \(\Delta \hat{P} = \hat{P}_1 - \hat{P}_2\) жаңа айнымалысын енгізіңіз
  • Оның күтуін есептеңіз

\[ E[\Delta \hat{P}] = E[\hat{P}_1 - \hat{P}_2] = \]

\[ E[\hat{P}_1] - E[\hat{P}_2] = p_1 - p_2 \]

Дисперсия

\[\begin{align*} var(\Delta \hat{P}) = var(\hat{P}_1 - \hat{P}_2) = \\ var(\hat{P}_1) + var(\hat{P}_2) = \frac{p_1(1 - p_1)}{n_1} + \frac{p_2(1 - p_2)}{n_2} \\ sd(\Delta \hat{P}) = \sqrt{\frac{p_1(1 - p_1)}{n_1} + \frac{p_2(1 - p_2)}{n_2}} \end{align*}\]

Біріктірілген дисперсия

  • Біздің нөлдік гипотезамыз \(H_0 болсын: \hat{P}_1 = \hat{P}_2\)
  • \(H_0-мен бірдей нәрсе не: \Delta\hat{P} = 0\)

Бұл сондай-ақ \(p_1 = p_2\) дегенді білдіреді, бұл пропорциялардың екеуін де \(p_0\) деп белгілейік. Демек, \(\Delta \hat{P}\) дисперсиясы

\[\begin{align*} var(\Delta \hat{P}) = \frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}\\ sd(\Delta \hat{P}) = SE = \sqrt{\frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}} \\ \textrm{where } p_0 = \frac{n_1p_1 + n_2p_2}{n_1 + n_2} \end{align*}\]

Енді барлығын бірге

\[ H_0: \Delta\hat{P} = 0 \]

\[ H_A: \Delta\hat{P} \neq 0 \]

\[ \Delta\hat{P} \sim N(0, \sqrt{\frac{p_0(1-p_0)}{n_1} + \frac{p_0(1-p_0)}{n_2}}) \]

Санайық

\[\begin{align*} p_0 = \frac{p_1+p_2}{2} = \frac{0.23 + 0.08}{2} = 0.155 \\ sd(\Delta \hat{P}) = \sqrt{\frac{2(0.155)(1 - 0.155)}{100}} \approx 0.05 \\ z = \frac{0.15 - 0}{0.05} = 3 \\ P(Z > |3|) \approx 0.02 \end{align*}\]

Ал енді R-де

two_prop_test <-
  prop.test(c(23, 8), c(100, 100))
two_prop_test

    2-sample test for equality of proportions with continuity correction

data:  c(23, 8) out of c(100, 100)
X-squared = 7.4823, df = 1, p-value = 0.006231
alternative hypothesis: two.sided
95 percent confidence interval:
 0.0418647 0.2581353
sample estimates:
prop 1 prop 2 
  0.23   0.08 

2-мысал

Бізде кездейсоқ таңдалған 5000 орта мектеп оқушысының үлгісі және олардың ҰБТ нәтижелері бар. Іріктемедегі 2465 ұлдың орташа бағасы 70,5%, ал қыздардың орташа бағасы 72,3% құрайды. Ұлдар мен қыздардың орташа мәндерінің айырмашылығының стандартты қателігі 0,9% құрайды. Бұл деректер қыздардың ҰБТ-да 0,05 маңыздылық деңгейінде ұлдарға қарағанда жақсы нәтиже көрсететініне сенімді дәлел бола ма?

2-мысал

  1. Гипотезалар

\[ H_{0}: \mu_{girls} = \mu_{boys} \]

\[ H_{A}: \mu_{girls} > \mu_{boys} \]

\[ \textrm{null value} = \mu_{girls} - \mu_{boys} = 0 \]

  1. Нүктелік бағалау \[ \overline{x}_{girls} - \overline{x}_{boys} = 72.3 - 70.5 = 1.8 \]

  2. z-статистикалық және p-мәні \[ z = \frac{1.8}{0.9} = 2 \\ \]

\[ \textrm{ p-мәні } = P(Z > 2|H_0) \approx 0.02 < \alpha = 0.05 \implies \textrm{бас тартамыз } H_0 \]

  1. Деректер ҰБТ-ның орташа ұпайы қыздардың ұлдарға қарағанда жоғары екенін сенімді түрде дәлелдейді.

Қателер

Шындық\Шешім Бас тартпаймыз \(H_{0}\) бас тартамыз \(H_{0}\)
\(H_{0}\) шын OK I типті қате
\(H_{A}\) шын II типті қате. OK
  • I типті қате: \(H_{0}\) шын мәнінде дұрыс болған кезде \(H_{0}\) қабылданбайды. Жалған оң
  • II типті қате: \(H_{A}\) шын болған кезде \(H_{0}\) қабылданбайды. Жалған теріс.

Мысалдар

  • Сотта сіз қылмыс жасамадыңыз (\(H_0\)) немесе жасадыңыз (\(H_A\)).
  • I типті қате: “Кінәсізді жазалаңыз”, \(H_{0}\) дұрыс, бірақ біз оны қате түрде жоққа шығарамыз: сіз ештеңе істемедіңіз, бірақ кінәлі деп танылдыңыз.
  • II типті қате: “Құтылып кету”, \(H_{A}\) дұрыс, бірақ \(H_{0}\) қабылданбады: сіз қылмыс жасадыңыз, бірақ кінәсіз деп танылып, босатылдыңыз.
  • II типті қатенің ықтималдығын қалай азайтуға болады? Және бұл I типті қатенің ықтималдығына қалай әсер етеді?
  • II типті қатенің ықтималдығын азайту үшін біз көбірек адамдарды жазалауымыз керек. Біз тым қатал бола аламыз және қылмыстың кез келген белгісін жеткілікті дәлел ретінде қабылдай аламыз.
  • Дегенмен, қаталдықты арттыру арқылы біз көбірек кінәсіз адамдарды жазалау қаупін тудырамыз, ал I типті қатенің ықтималдығы артады.

p-мәндері мен қателіктер қалай байланысты?

Шындық\Шешім Бас тартпаймыз \(H_{0}\) Бас тартамыз \(H_{0}\)
\(H_{0}\) шын \(1 - \alpha\) I типті қате, \(\alpha\)
\(H_{A}\) шын II типті қате, \(\beta\) \(1 - \beta\)
  • \(\alpha\) - маңыздылық деңгейі (significance level)

  • Сенiмдiлiк деңгейi = \(1 - \alpha\)