Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Oracle ASSM
- git 기본명령어
- eda
- 네트워크
- Decision Tree
- CF
- Python
- 오라클 데이터 처리방식
- 의사결정나무
- Linux
- enq: FB - contention
- Collaborative filtering
- 알고리즘
- airflow 정리
- Spark 튜닝
- Spark jdbc parallel read
- 데이터 분석
- Oracle 논리적 저장 구조
- Spark Data Read
- 추천시스템
- 리눅스 환경변수
- 데이터분석
- 배깅
- git stash
- 통계분석
- git init
- SQL
- BFS
- 앙상블
- 랜덤포레스트
Archives
- Today
- Total
목록부스팅 (1)
[Alex] 데이터 장인의 블로그
[Machine Learning] Random Forest - 랜덤 포레스트
TREE가 모이게 되면 FOREST가 된다. 이전에 공부한 Decision Tree가 '나무' 였다면, 오늘 배울 Random Forest는 숲이다. 나무가 모여 숲이 되듯이 랜덤포레스트는 여러 의사결정나무 모델의 집합체라고 할 수 있다. 앙상블 기법 앙상블은 여러 모델의 집합을 이용해서 하나의 예측을 이끌어내는 방식이다. 배깅은 앙상블 방법 중 가장 많이 사용되는 방법 중 하나이다. 배깅은 데이터를 부트스트래핑하여 여러 모델을 만드는 가장 일반적인 방법을 말한다. 주로 배깅, 부스팅을 구분을 두어 학습하기도 하는데 간단히 정리하면 다음과 같다. Ensemble methods: Bagging & Boosting 배깅 배깅은 부트스트래핑 종합(Bootstrap aggregating)의 줄임말로 1994년 ..
ML&DL/Machine Learning
2020. 10. 4. 22:37