전체 글

태블로/TWBX

오프라인 1차 교육

보호되어 있는 글입니다.

수학/통계학

3. t-test - (4) / 양측검정, 단측검정

t-test를 이해하는 데 앞서, 정규분포, 표준정규분포, z-test 다음으로 이해해야하는 것이 양측검정, 단측검정이다.  앞선 키 예제를 그대로 사용함! 양측검정 vs 단측검정* D = 차이  / Da-b : A와 B의 차  대립가설에서 양측검정은 의미상 크거나 작다를 모두 포함한 경우이고, 단측검정은 둘 중 하나만을 채택한 경우이다.양측검정과 단측검정의 사용에 있어, 정해진 것이 없기 떄문에 연구자의 판단에 따라 사용하면 된다.( 보통 단측이 한가지 경우만을 대립가설로 가져가기 때문에, 연구자가 설립한 가설을 확신할 수 있을 떄 단측을 사용하는 경우가 많음) 앞선 포스팅에서 1.4cm란 키차이가 우연히 발생했을 확률은 얼마나 될까? 했을 때, 확률이 유의수준 0.05보다 작으면 우연이 아니라고 보고..

태블로/공부

맵 차트 만들기

위도와 경도를 토대로 맵 형태의 뷰를 작성할 수 있다.맵으로 표현하기 위해서는 위도와 경도가 필요한데, 우리나라의 경우 시도와 시군구명이 있으면이 필드들로 위도와 경도를 만들 수 있다. 맵 차트1. 시도 필드 옆 아이콘 > 마우스 오른쪽 > 지리적 역할 > 주/시/도1-1. 시군구 필드도 같은 방법으로 해서 시군구> 측정값에 위도와 경도가 생성된다.  2. 우측하단에 unkown 이란 정보가 떠서 눌러보면 Ambiguous 란 에러를 내는 것을 알 수 있다.     이는 시군구가 어느 시도에 포함되어 있는지 알 수 없으면 에러를 내는 것이다. ( 강서구 > 서울에도 있고, 부산에도 있음 / 고성군 > 경남에도 있고 강원에도 있음..) 3. 이러한 에러를 해결해주기 위해서는 계층을 만들어줘야하는데, 하위 ..

태블로/공부

도넛차트 만들기

도넛 차트는 파이 차이와 동일하게 전체에서 각각의 값에 대한 비중을 살펴보는 차트지만, 파이 차트와는 달리 전체 합계를 표현할 수 있고, 요약 및 텍스트 또한 넣을 수 있기에 파이 차트보다 많이 활용된다 * 도넛 차트는 파이 차트 두 개를 합쳐서 만든다(이중축 사용) 도넛 차트1. 행 선반을 더블 클릭해서 의미 없는 숫자 0을 하나 삽입2.  마크를 파이차트로 변경3. 행 선반에 있는 0 필드를 컨트롤 키를 누른 상태에서 옆으로 옮겨 복제 4. 첫번째 합계 마크에 고객 세그먼트를 색상으로 지정4-1. 마크의 고객 세크먼트 필드 > 마우스 오른쪽 > 정렬 > 정렬기준 : 필드, 정렬 순서 : 내림차순, 필드명 : 매출5. 첫번쨰 합계 마크에 매출을 각도로 지정6. 첫번째 합계 마크의 크기를 키워줌 7. 열..

수학/통계학

3. t-test - (3) / 정규분포, 표준정규분포, z-test

t-test를 이해하는 데 앞서, 정규분포와 z-test를 먼저 이해하는 게 좋다.모집단의 경우에는 z-test를 하고 샘플의 경우에는 t-test를 하는 것이므로, 정규분포와 z-test에 대한 이해가 선행되면 t분포와 t-test에 대한 이해가 쉽기 때문! 정규분포  정규분포의 특징종모양을 갖는다평균 (정가운데)를 중심으로 좌우 대칭이다정규분포의 양 끝은 영원히 0에 닿지 않는다정규분포는 평균과 표준편차만으로 규정된다, 즉 평균과 표준편차가 다르다면, 서로 다른 정규분포가 무한대 존재하게 된다.정규분포의 아래 면적은 확률을 의미한다. 정규분포 곡선 아래의 모든 면적의 합은 1이다.이에 정규분포를 이용한 확률을 구하려면 적분을 해야하는데, 확률 구하려고 적분을 하나하나 하는건 비효율의 끝판왕이라고 할 ..

수학/통계학

3. t-test - (2)

t-test에 대한 이해t-test(1) 포스팅에서 두 대학 남학생들 평균키에 1.4cm란 차이가 발생했고,1.4cm가 우연히 발생했다면, 두 남학생 집단의 평균키는 같은 것이고1.4cm가 우연히 발생하지 않았다면, 즉 어떤 이유가 있다면 두 남학생 집단의 평균키는 다른 것이다. 라는 두 가지 상황에 대한 판단을 위해, 키 차이가 우연히 발생했을 확률이 얼마나 될까? 란 질문을 해야했다. 이에, 1.4cm란 차이가 우연히 발생할 수 있는 수치인지, 아닌지를 판단하기 위한 비교 대상이 필요하고, 이 비교 대상은 표준편차(분산)이 된다. 표준편차는, 데이터가 평균을 중심으로 "평균적으로 얼마만큼이 퍼져있는가"를 보여주는 것인데, 중요한 것은 이 퍼짐이 "의미 없이 우연히 퍼져있는 정도"라는 것이다.즉, 예를..

태블로/공부

파이차트 만들기

파이 차트는 전체에 대해 각각 얼마정도의 비중을 차지 하는지를 살펴보는 차트이다.다만, 파이 차트는 전체 총합에 대한 값을 보여주기 힘들고, 추가적인 메세지를 주는데 한계가 있어 파이 차트보다는 도넛차트가 더 선호된다. 표현 방식우측 상단에 표현 방식을 누르면 조건( ex.차원값과 측정값의 개수) 에 따라 나타낼 수 있는 차트가 보여진다.필드들을 눌렀을 때, 표현 방식 중 노란색 테두리가 생기는 표현 방식이 있는데, 그것이 태블로가 봤을 때 필드들을 가장 적합하게 표현할 수 있다고 생각한 방식이다. 파이 차트파이차트는 1개 이상의 차원과, 1개 또는 2개의 측정값이 필요하다. 1. 고객 세트먼트(차원)과 매출 (측정값)을 선택그럼 보다시피, 차원 1개와 측정값 1개로 표현할 수 있는 그래프는 표현방식에서..

수학/통계학

3. t-test -(1)

t-test란?t-test는 두개의 집단이 같은지 다른지 비교하기 위해 사용한다. 여기서의 집단은 샘플(표본)을 뜻한다.*집단에는 모집단과 샘플(표본)이 있는데, t-test에서 집단은 샘플이다. 그렇다면 어떻게 두개의 집단을 비교할까?예를 들어 1000명이 있다고 가정한다면, 1000명을 한명한명 비교하다가는 답도 없을 것이다.따라서, 두 집단의 대표값인 평균값을 사용해서, 평균값이 통계적으로 같은지 다른지를 확인하는 방식으로 두 집단을 비교한다 한 가지 예를 들어, A대학의 남학생들과 B대학의 남학생들의 키가 같은지 다른지 봐보고자 한다.A대학의 남학생 모두와 B대학의 남학생 모두의 키를 비교할 수 없으니, A대학 남학생의 샘플과 B대학 남학생의 샘플을 뽑아 비교해야한다. 샘플을 뽑아 비교하니 A대학..

- MJ -
JUtudy