추론 통계할 수 있습에 대한 결론을 도출 인구를 사용하여 작은 샘플입니다. 결과적으로 추론 통계는 일반적으로 전체 인구를 측정 할 수 없기 때문에 엄청난 이점을 제공합니다.
그러나,이러한 혜택을 얻을,당신 사이의 관계를 이해하는 집단이 집단간 인구 매개 변수 샘플 및 샘플 통계입니다.
이 블로그 게시물에,나는 이러한 논의 개념을 얻는 방법을 대표 샘플을 사용하여 무작위 샘플링입니다.,
관련 게시물:차이점을 설명하고 추론 통계
인구
인구를 포함할 수 있는 사람들지만,다른 예는 개체를 포함,이벤트,기업니다. 통계에는 두 가지 일반적인 유형의 인구가 있습니다.
모집단은 존재하는 모든 유사한 항목의 완전한 집합 일 수 있습니다. 예를 들어,한 국가의 인구는 현재 해당 국가 내의 모든 사람들을 포함합니다. 그것은 유한하지만 잠재적으로 큰 회원 목록입니다.
그러나 모집단은 잠재적으로 크기가 무한한 이론적 인 구성 일 수 있습니다., 예를 들어,품질 개선을 분석가들은 종종 모든 현재와 미래의 출력에서 생산 라인의 일부가 될 인구입니다.
모집단은 사용자가 정의하는 특성 집합을 공유합니다. 예를 들어,다음은 인구입니다:
- 은하수의 별.
- 생산 라인에서 부품.
- 미국 시민.
연구를 시작하기 전에 공부하고있는 인구를 신중하게 정의해야합니다. 이러한 집단은 분석의 요구를 충족시키기 위해 좁게 정의 될 수 있습니다., 예를 들어,그렇지 않으면 건강하지만 골다공증이있는 성인 스웨덴 여성.
Subpopulations 분석을 향상시킬 수 있습니다
Subpopulations 추가 속성을 공유합니다. 예를 들어,미국의 인구는 남성과 여성의 하위 집단을 포함합니다. 지역,연령,사회 경제적 지위 등과 같은 다른 방법으로 세분화 할 수도 있습니다. 다른 연구를 포함하는 같은 인구할 수 있으로 나누어 서로 다른 집단간에 따라 의미가 무엇을 위해 데이터 및 분석한다.,
연구의 하위 주제를 이해하면 주제를보다 철저하게 파악하는 데 도움이됩니다. 또한 데이터에 더 잘 맞는 통계 모델을 생성하는 데 도움을 줄 수 있습니다. 하위 집단은 전체 인구와 체계적으로 다른 특성을 가질 때 특히 중요합니다. 데이터를 분석 할 때 이러한 더 깊은 분열을 인식해야합니다. 사실,관련 하위 집단을 나중에 분석에서 추가 요인으로 취급 할 수 있습니다.,
경우,예를 들어,당신은 분석 평균 높이의 미국 성인,당신은 당신의 결과를 향상시킬을 포함하여 남성과 여성의 집단간 때문에 그들의 높이에서 체계적으로 다릅니다. 이 게시물의 뒷부분에서 그 예를 깊이 다룰 것입니다!
인구는 매개변수에 대한 샘플 통계
매개 변수 값을 설명하는 특성이 전체의 인구와 같은 인구가 의미합니다. 전체 모집단을 거의 측정 할 수 없기 때문에 일반적으로 매개 변수의 실제 값을 알지 못합니다., 사실,매개 변수 값은 거의 항상 알 수 없다. 우리가 가치를 알지 못하는 동안,그것은 확실히 존재합니다.
예를 들어,평균의 높이는 성숙한 여성 미국에서 매개 변수가 있는 정확한 가치 우리는 단지 그것이 무엇인지 알!
모집단 평균과 표준 편차는 두 가지 공통 매개 변수입니다. 통계에서 그리스어 기호는 일반적으로 평균에 대한 μ(mu)및 표준 편차에 대한 σ(sigma)와 같은 모집단 매개 변수를 나타냅니다.
통계는 표본의 특성입니다., 샘플을 수집하고 평균 및 표준 편차를 계산하면 샘플 통계입니다. 추론 통계를 사용하면 표본 통계를 사용하여 모집단에 대한 결론을 내릴 수 있습니다. 그러나 유효한 결론을 도출하려면 특정 샘플링 기술을 사용해야합니다. 이러한 기술은 샘플이 편견없는 추정치를 생성하도록하는 데 도움이됩니다. 편향된 추정치는 체계적으로 너무 높거나 너무 낮습니다. 평균적으로 정확하기 때문에 편견없는 견적을 원합니다.
추론 통계에서 표본 통계를 사용하여 모집단 매개 변수를 추정합니다., 예를 들어,당사가 수집하는 무작위 샘플의 성인 미국에서 여성과 측정의 높이,우리가 계산할 수 있습니다 샘플은 의미로 사용하는 편견의 추정 인구는 뜻입니다. 우리가도 수행할 수 있습니다설에서 테스트 샘플을 추정하고 대한 신뢰를 만들 수 있는 간격을 구성하는 범위는 실제 인구 값을 가능성이 떨어지습니다.,div id=”6aadacc401″>
Mu (μ)
: Measures of Central Tendency and Measures of Variability
Representative Sampling and Simple Random Samples
In statistics, sampling refers to selecting a subset of a population., 후기 샘플을 측정하는 하나 이상의 특성 모든 항목에서 샘플을 높이 등과 같은 소득,온도,의견,etc. 전체 인구에서 이러한 특성에 대한 결론을 도출하려는 경우 샘플을 수집하는 방법에 대한 제한을 부과합니다. 잘못된 방법론을 사용하는 경우 샘플이 모집단을 대표하지 않을 수 있으므로 잘못된 결론으로 이어질 수 있습니다.
편견없는 대표 샘플을 얻는 가장 잘 알려진 방법은 간단한 무작위 샘플링입니다., 이 방법을 사용하면 모집단의 모든 항목이 선택 될 확률이 동일합니다. 이 프로세스는 샘플이 모집단의 전체 범위를 포함하는지 확인하는 데 도움이됩니다. 또한 모든 관련 하위 집단은 샘플에 통합되어 평균적으로 정확하게 표현되어야합니다. 간단한 무작위 샘플링은 바이어스를 최소화하고 데이터 분석을 단순화합니다.
에 대해 설명하겠습니다 샘플링 방법론 자세히에서 블로그 포스트,하지만 거기에 몇 가지 중요한 사항에 대해 단순한 임의의 샘플링입니다., 이 접근법은 편견을 최소화하지만 샘플 통계가 모집단 매개 변수와 정확히 동일하다는 것을 나타내지는 않습니다. 대신 특정 샘플의 추정치는 약간 높거나 낮을 가능성이 있지만 프로세스는 평균적으로 정확한 추정치를 생성합니다. 또한,무작위 샘플링으로 비정상적인 샘플을 얻는 것이 가능합니다—단지 예상 결과가 아닙니다.
관련 게시물:샘플 통계는 항상이 잘못된다(어느 정도까지)!
또한 무작위 샘플링은 약간 우연하고 쉽게 들릴 수 있습니다., 간단한 무작위 샘플링은 모집단에 존재하는 모든 사람 또는 항목의 전체 목록을 체계적으로 컴파일한다고 가정합니다. 그런 다음 해당 목록에서 무작위로 과목을 선택하고 샘플에 포함시킵니다. 매우 번거로운 과정일 수 있습니다.
이 개념들을 삶으로 가져 가자!
의 인구를 가진 중요한 부분
고 있다고 생각해 보세요 공부를 높이 미국 시민의하고 더 이상 가정을 우리에 대해 많이 알고하지 않습니다., 결과적으로 무작위 샘플을 수집하고 높이를 센티미터 단위로 측정하고 샘플 평균과 표준 편차를 계산합니다. CSV 데이터 파일은 다음과 같습니다.
우리는 다음과 같은 결과를 얻을 수
기 때문에 우리가 모인 무작위 샘플링,우리가 추측할 수 있는 이러한 샘플 통계는 편견의 추정 인구는 매개 변수입니다.
이제 연구 영역에 대해 더 많이 배우고 남성과 여성을 하위 집단으로 포함한다고 가정합니다. 우리는 다음과 같은 결과를 얻습니다.,
알 수 있는 방법을 하나의 광범위한 배포로 대체되었습니다 두 개의 좁은 분포? 분배 성별은 작은 표준 편차보다는 하나의 유통에 대한 모든 성인과 일치하는 엄격한 주위에 확산 수단에 대한 남성과 여성 모두에서는 그래프입니다. 이러한 결과는 우리가 성별로 높이를 평가할 때 평균이보다 정확한 추정치를 제공하는 방법을 보여줍니다. 실제로 전체 모집단에 대한 평균은 어느 하위 모집단에 대한 평균과 같지 않습니다. 오해의 소지가 있습니다!,
이 프로세스 동안,우리는 성별 중요한 subpopulation 에 관한을 높이고 우리의 이해 증가의 주제를 파악할 수 있습니다. 높이에 대한 향후 연구에서 성별을 예측 변수로 포함시킬 수 있습니다.
이 예제에서는 범주형 그룹화 변수(성별)와 연속 결과 변수(높이)를 사용합니다. 이 예제와 같이 그룹간에 연속 값의 분포를 비교하려는 경우 boxplots 및 개별 값 플롯 사용을 고려하십시오. 이러한 플롯은 그룹 수가 증가함에 따라 더욱 유용 해집니다.,
이 예는 의도적으로 이해하기 쉽게 하지만 상상 연구에 대해 분명하다. 이 프로세스는 새로운 통찰력을 얻고 더 나은 통계 모델을 생성하는 데 도움이됩니다.
를 사용하여 귀하의 지식,인구의 부분,매개 변수 샘플링,샘플 통계,당신은 그릴 수 있습니다 귀중한 결론에 대해 큰 인구가 사용하여 작은 샘플입니다. 인구에 대한 가설을 테스트 할 수있는 방법에 대한 자세한 내용은 가설 테스트에 대한 나의 개요를 읽으십시오.피>
Leave a Reply