Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- git init
- 통계분석
- Python
- Collaborative filtering
- 랜덤포레스트
- Spark jdbc parallel read
- 알고리즘
- enq: FB - contention
- git 기본명령어
- 데이터 분석
- 의사결정나무
- 앙상블
- SQL
- Linux
- BFS
- 배깅
- 데이터분석
- 리눅스 환경변수
- git stash
- Decision Tree
- airflow 정리
- eda
- Spark 튜닝
- 네트워크
- Oracle ASSM
- CF
- 추천시스템
- Oracle 논리적 저장 구조
- 오라클 데이터 처리방식
- Spark Data Read
Archives
- Today
- Total
목록지니계수 (1)
[Alex] 데이터 장인의 블로그
[Machine Learning] Decision Tree - 의사결정나무
의사결정트리라고도 불리는 의사결정나무는 객체 레이블을 예측하는 매우 직관적인 방법이다. 단순히 입력 변수를 특정한 기준으로 잘라(분기) 트리 형태의 구조로 분류를 하는 모델이다. 보통 의사결정나무를 분석 모델로 선택하는 이유는 예측모형을 직접 보고 충분히 이해할 수 있기 때문이다.(속도가 빠른 것도) 로지스틱 회귀 등등 coef를 보고 해석할 수 있는 경우 있기야 하지만 의사결정 트리만큼 직관적이고 쉽게 해석할 수 있는 모델은 없다. 의사결정나무는 이진 분할을 통해 각 예측 Class 들의 옵션 수를 줄이고 때문에 빠르게 동작할 수 있다는 장점이 있다. 물론 각 단계마다 어떤 Feature에 어떤 질문을 하느냐가 중요하다. 어떤 질문을 하는지는 보통 불순도를 낮추는 방향이나 순수도를 높히는 방향으로 이루..
ML&DL/Machine Learning
2020. 9. 20. 22:16