가설을 테스트하는 중요한 프로세스에서 추론 통계 목표는 샘플 데이터를 사용하여 결론을 도출에 대한 전체 인구입니다. 테스트 프로세스에서 유의도 수준과 p-값을 사용하여 테스트 결과가 통계적으로 유의한지 여부를 결정합니다.
결과가 통계적으로 유의미한 것에 대해 항상 듣습니다. 그러나 유의 수준,P 값 및 통계적 유의성은 실제로 무엇을 나타 냅니까? 왜 우리는 심지어 통계에서 가설 테스트를 사용할 필요가 있습니까?,
이 게시물에서이 모든 질문에 답합니다. 그래프와 개념을 사용하여보다 직관적 인 설명을 제공하기 위해 가설 테스트가 어떻게 기능하는지 설명합니다. 이것은 당신이 당신의 통계 결과를 이해로 이동하는 데 도움이됩니다.
가설 테스트 예제 시나리오
시작하려면 예제를 사용하여 가설 테스트를 사용해야하는 이유를 설명하겠습니다.
연구원은 공부하고 연료에 지출 가족이 원한을 결정하는 경우에는 매달 비용은 변경 이후 작년 때 평균$260 습니다., 연구원은 25 가족의 무작위 표본을 채취하여 올해 월별 비용을 통계 소프트웨어에 입력합니다. 당신은 CSV 데이터 파일을 다운로드 할 수 있습니다:FuelsCosts. 아래는 올해의 설명 통계입니다.
우리는 빌드에서 이 예제에 응답하는 연구 과제와 방법을 보여 가설검정 작동합니다.
설명 통계를 혼자 하지 않습니다 질문에 대답
연구원이 수집되는 임의의 샘플을 발견하는 올해의 샘플을 의미(330.6)는 더 이상 작년의 의미(260). 왜 가설 테스트를 전혀 수행합니까?, 우리는 올해의 평균이 70 달러로 더 높다는 것을 알 수 있습니다! 그게 다르지 않니?유감스럽게도 전체 모집단 대신 샘플을 분석하고 있기 때문에 상황이 생각만큼 명확하지 않습니다. 전체 모집단에서 데이터를 수집하는 것이 일반적으로 불가능하기 때문에 샘플로 작업 할 때 큰 이점이 있습니다. 그러나 관리 가능한 샘플로 작업하기위한 절충안은 샘플 오류를 설명해야한다는 것입니다.
샘플링 오류는 샘플 통계와 모집단 매개 변수 사이의 간격입니다., 우리의 예를 들어,샘플 통계는 330.6 인 샘플 평균입니다. 모집단 매개 변수는 전체 모집단의 평균 인 μ 또는 mu 입니다. 불행히도 모집단 매개 변수의 값은 알 수 없을뿐만 아니라 일반적으로 알 수 없습니다.
우리는 330.6 의 샘플 평균을 얻었다. 그러나 샘플링 오류로 인해 모집단의 평균이 260 에 불과할 수 있다고 생각할 수 있습니다. 연구원이 다른 무작위 샘플을 그린 경우 다음 샘플 평균은 260 에 가까울 수 있습니다. 샘플 평균 만 보면서이 가능성을 평가하는 것은 불가능합니다., 가설 테스트는 우리가 대표 샘플을 기반으로 전체 인구에 대한 결론을 도출 할 수있는 추론 통계의 한 형태입니다. 모집단 평균이 260 인 경우 우리의 표본 평균을 얻을 가능성을 결정하기 위해 가설 검정을 사용해야합니다.,
배경 정보:차이점을 설명과 추정 및 인구 통계,매개 변수 샘플을 추론 통계
샘플링 분포는지 여부를 결정의 샘플을 의미하지 않
그것은 매우 가능성이 모든 샘플을 의미를 동일 인구는 것을 의미하기 때문에의 샘플에 오류가 있습니다. 우리의 경우,330.6 의 표본 평균은 연료 지출에 대한 인구 평균과 거의 같지 않습니다.,
경우 우리는 얻을 수 있는 상당수의 임의 샘플을 계산하고 샘플을 의미가 각 샘플을,우리가 관찰하는 넓은 스펙트럼의 샘플을 의미한다. 우리는 심지어이 과정에서 샘플 수단의 분포를 그래프로 나타낼 수있을 것입니다.
이러한 유형의 분포를 샘플링 분포라고합니다. 동일한 모집단에서 동일한 크기의 많은 무작위 샘플을 그려 샘플링 분포를 얻습니다. 도대체 왜 우리가 이것을 할 것인가?,샘플링 분포를 사용하면 샘플 통계를 얻을 가능성을 결정할 수 있으며 가설 테스트를 수행하는 데 매우 중요하기 때문입니다.
운 좋게도 수많은 무작위 샘플을 수집하는 데 어려움을 겪지 않아도됩니다! T-분포,샘플 크기 및 샘플의 변동성을 사용하여 샘플링 분포를 추정 할 수 있습니다.
우리는 올해 평균 연료 지출(330.6)이 작년(260)과 다른지 알아 내고 싶습니다., 이 질문에 대답하기 위해,우리는 그래프 샘플링 분포에 기반한 가정이라는 것을 의미한 연료 비용에 대한 전체 인구는 변하지 않고 여전히 260. 통계에서 우리는 이러한 효과 부족 또는 변화가없는 귀무 가설이라고 부릅니다. 우리는 귀무 가설 값을 우리의 관찰 된 표본 값에 대한 비교의 기초로 사용합니다.
샘플링 분포와 t-분포는 확률 분포의 유형입니다. 확률 분포에 대해 자세히 알아보십시오!,
그래프의 샘플을 의미의 컨텍스트에서 샘플링 분포
아래 그래프 표시하는 샘플을 의미가 더 가능성이 적은 경우 인구 평균 260. 우리는이 분포에 우리의 샘플 평균을 배치 할 수 있습니다. 이 더 큰 맥락은 귀무 가설이 참인 경우 샘플 평균이 얼마나 가능성이 있는지를 알 수 있도록 도와줍니다(μ=260).
그래프 표시된 분포의 샘플을 의미한다. 플롯은 이것이 진정한 모집단 평균이라고 가정하기 때문에 가장 가능성있는 값은 260 에 가깝습니다., 그러나 무작위 샘플링 오류가 주어지면 167 에서 352 까지의 샘플 수단을 관찰하는 것은 놀라운 일이 아닙니다. 는 경우 평균 인구는 여전히 260,우리의 관찰 샘플균(330.6)지 않을 가능성이 가장 높은 값을 가지고 있지만,그것은 완전히 믿기 어려운 중 하나.
역할의 가설 검정
샘플링 분포를 보여줍니다 우리는 우리가 비교적 가능성을 구하의 샘플 330.6 경우 인구 평균 260. 우리의 표본 평균은 인구 평균이 260 이라는 개념을 거부 할 가능성이 너무 낮습니까?
통계에서 우리는 이것을 귀무 가설을 거부한다고 부릅니다., 우리의 예를 위해 null 을 거부하면 샘플 평균(330.6)과 260 의 차이가 통계적으로 유의합니다. 다시 말해,샘플 데이터는 인구 평균이 260 과 같지 않다는 가설을 선호합니다.
그러나 샘플링 분포도를 다시 살펴보십시오. 이 결론을 결정적으로 이끌어 낼 수있는 곡선에 특별한 위치가 없다는 것을 알 수 있습니다. 귀무 가설 값에서 더 멀리 떨어져있는 표본 수단을 관찰 할 가능성이 일관된 감소 만 있습니다. 샘플 평균이 충분히 멀리 떨어져 있다고 결정하는 곳은 어디입니까?,
이 질문에 대답하려면 더 많은 도구가 필요합니다-가설 테스트! 가설 테스트 절차는 우리 샘플의 특이성을 확률로 정량화 한 다음이를 증거 표준과 비교합니다. 이 과정을 통해 증거의 강도에 대한 객관적인 결정을 내릴 수 있습니다.이 결정을 내리는 데 필요한 도구를 그래프 유의 수준과 p 값에 추가하려고합니다!
이러한 도구할 수 있는 테스트는 이러한 두 가지 가설:
- Null 가설:인구 뜻과 같은 null 이 가설을 의미(260).,
- 대체 가설:모집단 평균은 귀무 가설 평균(260)과 같지 않습니다.
관련 게시물:가설 테스트 개요
유의 수준(알파)이란 무엇입니까?
알파 또는 α 라고도 알려진 유의 수준은 연구자가 연구 전에 설정하는 증거 표준입니다. 전체 모집단에 대한 귀무 가설을 거부하기 전에 표본 증거가 귀무 가설과 얼마나 강하게 모순되어야 하는지를 정의합니다. 증거의 강도는 사실 인 귀무 가설을 거부 할 확률에 의해 정의됩니다., 즉,효과가 없을 때 효과가 있다고 말할 확률입니다.
예를 들어 0.05 의 유의 수준은 효과가 존재하지 않을 때 효과가 존재한다고 결정하는 5%의 위험을 의미합니다.
유의 수준이 낮 으면 귀무 가설을 거부 할 수 있으려면 더 강한 표본 증거가 필요합니다. 예를 들어,0.01 유의 수준에서 통계적으로 유의하기 위해서는 0.05 유의 수준보다 더 실질적인 증거가 필요합니다. 그러나 가설 테스트에는 절충점이 있습니다., 유의 수준이 낮을수록 존재하는 차이를 감지하기 위해 가설 검정의 힘이 감소합니다.
이러한 유형의 질문의 기술적 특성은 머리를 회전시킬 수 있습니다. 그림은 삶에 이러한 아이디어를 가져올 수 있습니다!유의 수준에 대한보다 개념적 접근법을 배우려면 유의 수준 이해에 대한 내 게시물을 참조하십시오.
그래프 중요성 수준으로 중요한 지역
에서 확률 분포,유의 수준을 정의하는 방법까지 샘플 가치에서 수 있어야 합니다 null 값을하기 전에 우리를 거부할 수 있습 null 입니다., 의 비율의 곡선 아래 부분의 면적은 dvd 플레이어 및 프리미엄 케이블 채널을 같는 확률 샘플 가치에 빠지게됩니다 그 지역의 경우에는 null 을 가설이 올바른 것입니다.
0.05 의 유의 수준을 나타내려면 null 값에서 가장 먼 분포의 5%를 음영 처리합니다.
두 음영지역에서는 그래프는이 같은 거리에서 중앙의 값은 null 이 가설입니다. 각 지역은 0.025 의 확률을 가지며,이는 우리가 원하는 총 0.05 에 합산됩니다. 이러한 음영 영역은 두 꼬리 가설 검정의 임계 영역이라고합니다.,
임계 영역은 귀무 가설을 거부하는 것을 보증 할만큼 충분히 가능성이있는 샘플 값을 정의합니다. 귀무 가설이 정확하고 모집단 평균이 260 이면,이 모집단의 무작위 표본(n=25)은 임계 영역에서 5%의 시간에 해당하는 수단을 갖습니다.
우리의 샘플 평균은 임계 영역에 빠지기 때문에 0.05 수준에서 통계적으로 유의합니다.
관련 게시물:한쪽과 두 꼬리 테스트는 설명했
비교 중요성 수준
의 다시 이 가설을 테스트를 사용하여 다른 일반적인 의미의 수준은 0 입니다.,01 비교 방법을 보려면.
이번에는 두 가지의 음영 지역을 같이 우리의 새로운 의미의 수준 0.01. 우리 샘플의 평균은 임계 영역에 해당하지 않습니다. 결과적으로 우리는 귀무 가설을 거부하지 못합니다. 우리는 동일한 정확한 샘플 데이터,샘플 평균과 귀무 가설 값 사이의 차이는 동일하지만 테스트 결과는 다릅니다.
무슨 일이 일어 났습니까? 더 낮은 유의 수준을 지정함으로써 샘플 증거에 대해 더 높은 막대를 설정합니다., 그래프에서 알 수 있듯이 유의 수준이 낮 으면 임계 영역이 널 값에서 더 멀리 이동합니다. 결과적으로 유의 수준이 낮 으면 통계적으로 유의할 수있는보다 극단적 인 표본 수단이 필요합니다.
연구를 수행하기 전에 유의도 수준을 설정해야합니다. 당신은 중요한 결과를 산출하는 연구 후에 수준을 선택하는 유혹을 원하지 않습니다. 두 가지 유의 수준을 비교 한 유일한 이유는 효과를 설명하고 다른 결과를 설명하는 것이 었습니다.,
우리가 만든 1 샘플 t-테스트의 그래픽 버전을 사용하면 p 값을 평가하지 않고 통계적 유의성을 결정할 수 있습니다. 일반적으로 p 값을 유의 수준과 비교하여이 결정을 내릴 필요가 있습니다.
관련 게시물:Excel 에서 t 테스트를 수행하는 방법에 대한 단계별 지침
P 값은 무엇입니까?
p 값은 귀무 가설이 정확하다면 샘플에서 관찰 된 효과만큼 적어도 극단적 인 효과를 가질 확률입니다.
P 값에 대한이 꼬불 꼬불 한 기술적 정의는 머리를 회전시킬 수 있습니다., 그것을 그래프로 보자!먼저 샘플에 존재하는 효과를 계산해야합니다. 효과는 샘플 값과 널 값 사이의 거리입니다:330.6-260=70.6. 다음으로,그늘이 지구의 양쪽에 분포가 적어도 멀리 70.6 에서 null(260 +/- 70.6). 이 프로세스는 샘플 평균을 적어도 우리의 샘플 평균만큼 극단적 인 것으로 관찰 할 확률을 그래프로 나타냅니다.
두 음영 영역의 총 확률은 0.03112 입니다., 는 경우 null 을 가설 값(260)은 사실이고 당신은 그린 많은 무작위 샘플을,당신이 기대하는 샘플을 의미하는 가을에 음영이 지역에 대해 3.1%의 시간입니다. 즉,null 이 true 인 경우 적어도 70.6 시간의 약 3.1%만큼 큰 샘플 효과를 관찰하게됩니다. 즉,P 값입니다!
P 값과 유의도 수준을 함께 사용하여
p 값이 알파 수준보다 작거나 같으면 귀무 가설을 거부합니다.
P 값 결과는 우리의 그래픽 표현과 일치합니다. 0.03112 의 p 값은 0.05 의 알파 수준에서 유의하지만 0 은 아닙니다.,01. 다시 말하지만,실제로,당신은 실험 전에 하나의 중요성 수준을 선택하고 그것을 고수하십시오!
0.05 의 유의 수준을 사용하면 샘플 효과가 통계적으로 유의합니다. 우리의 데이터는 인구 평균이 260 과 같지 않다는 대체 가설을 뒷받침합니다. 우리는 작년 이후로 평균 연료 지출이 증가했다고 결론을 내릴 수 있습니다.
p 값은 매우 자주 실제로 사실 인 귀무 가설을 거부 할 확률로 잘못 해석됩니다. 이 해석은 잘못되었습니다! 이유를 이해하려면 내 게시물:P-값을 올바르게 해석하는 방법을 읽으십시오.,
에 대한 토론을 통계적으로 유의한 결과
가설을 테스트할지 여부를 결정한 샘플 데이터를 제공하는 충분한 증거를 거부하 null 가설에 대한 전체 인구입니다. 이 테스트를 수행하기 위해 프로시저는 샘플 통계를 널 값과 비교하여 충분히 희귀한지 여부를 결정합니다. “충분히 희귀”에서 정의된 가설을 테스트하여
- 다고 가정하면 null 이 가설이 진실—그래프 센터에는 null 값입니다.
- 중요도(알파)수준-널 값에서 임계 영역은 얼마나 멀리 떨어져 있습니까?,
- 샘플 통계-중요한 영역 내에 있습니까?
어떤 연구가 실제 인구 효과가 100%의 시간을 갖는지를 올바르게 결정하는 특별한 유의 수준은 없습니다. 전통적인 수준의 의미 0.05 0.01 는 시도를 관리하는 사이에 균형을 갖는의 가능성이 낮은 거부하는 진정한 null 설과 데 적합한 전력을 감지하는 효과를 한 경우 실제로 존재합니다.
유의 수준은 실제로 참인 귀무 가설을 잘못 거부하는 비율입니다(유형 I 오류)., 예를 들면,모든 연구를 사용하는 의미의 수준 0.05 고 널 가정이 올바른 기대할 수 있습니다 그들의 5%하는 샘플 통계는 가을에서 중요한 영역이다. 이 오류가 발생하면 귀무 가설이 정확하다는 것을 알지 못하지만 p-값이 0.05 보다 작기 때문에이를 거부합니다.
이 오류는 연구원이 실수를 저질렀다는 것을 나타내지 않습니다. 그래프에서 알 수 있듯이 샘플 오류만으로 인해 극단적 인 샘플 통계를 관찰 할 수 있습니다. 그것은 무승부의 행운입니다!,
관련 게시물:유형에 오류가 가설 검정
가설검증을 중요하고 싶을 때 사용하여 샘플을 만들기 위해 데이터에 대한 결론 인구 때문에 이러한 테스트 계정에 대한 샘플에 오류가 있습니다. 유의 수준과 p 값을 사용하여 귀무 가설을 거부 할시기를 결정하면 올바른 결론을 도출 할 확률이 향상됩니다.통계적 유의성이 반드시 실제적이고 실제적인면에서 효과가 중요하다는 것을 의미하지는 않는다는 것을 명심하십시오. 자세한 내용은 실제 대 통계적 유의성에 대한 내 게시물을 읽으십시오.,
이 게시물이 마음에 들면 동반자 게시물:가설 테스트의 작동 방식:신뢰 구간 및 신뢰 수준을 읽으십시오.
할 수도 있습니다 내 다른 게시물을 읽는 방법을 설명하는 다른 테스트:
- 어떻게 t-테스트 작업
- 는 방법 F-테스트에서 작동 ANOVA
- 는 방법 카이 제곱 테스트는 독립의 작품
을 보는 다른 방법은 전통적인 가설을 테스트를 사용하지 않는 확률 분포 및 테스트,통계 에 대해 배울에서 부트스트랩 시계피>
Leave a Reply