Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 추천시스템
- CF
- Decision Tree
- 리눅스 환경변수
- 통계분석
- git 기본명령어
- airflow 정리
- 배깅
- Linux
- Oracle ASSM
- 데이터분석
- 네트워크
- 알고리즘
- enq: FB - contention
- SQL
- 데이터 분석
- 의사결정나무
- 랜덤포레스트
- Python
- 오라클 데이터 처리방식
- Oracle 논리적 저장 구조
- BFS
- git init
- Spark Data Read
- Collaborative filtering
- Spark 튜닝
- Spark jdbc parallel read
- eda
- git stash
- 앙상블
Archives
- Today
- Total
목록비모수검정 (1)
[Alex] 데이터 장인의 블로그
데이터 분석을 위한 통계(카이스퀘어 검정) feat. python
카이스퀘어 검정, 쉽게 기억하자. 카이스퀘어 검정은 카이 제곱 분포에 기초한 통계분석 방법입니다. 관찰된 '빈도'수가 기대되는 값, 즉 기댓값과 얼마나 다른지 확인함으로써 '범주형 변수'들의 관계 유무를 파악합니다. 두 변수의 관계가 있는가? 없는가? 카이제곱검정은 일어난 사건이 '통계적으로' 일어날 만한 차이인지, 희귀한 경우인지를 통계적으로 파악하는데 사용합니다. 변수 관계의 유무만 확인할 수 있기 때문에 어떤 관계가 있는지는 상관분석, 회귀분석 등 추가적인 분석을 통해 알 수 있습니다. 횟수 관련 데이터, 빈도 관련 데이터를 분석할 때, 자주 사용되는 통계분석 방법입니다. 분할표 예를 들어보겠습니다. 횟수관련 데이터, 빈도관련 데이터 등을 보여주는 분할표를 통해 100명의 환자 상태를 표현합니다. ..
Statistic
2020. 5. 26. 23:55