Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Linux
- git 기본명령어
- Oracle 논리적 저장 구조
- enq: FB - contention
- 배깅
- 의사결정나무
- SQL
- Oracle ASSM
- 리눅스 환경변수
- Spark Data Read
- airflow 정리
- 추천시스템
- 통계분석
- 데이터 분석
- git init
- Decision Tree
- Collaborative filtering
- git stash
- 네트워크
- Python
- Spark 튜닝
- 데이터분석
- Spark jdbc parallel read
- 오라클 데이터 처리방식
- BFS
- 알고리즘
- 앙상블
- CF
- eda
- 랜덤포레스트
Archives
- Today
- Total
목록데이터전처리 (1)
[Alex] 데이터 장인의 블로그
데이터 분석을 위한 SQL 쿼리 - 1. 데이터 정합성 검사
데이터 분석을 위한 SQL 쿼리 'SQL을 가장 많이 사용할때?!' feat. 저의 주관적 생각이 많이 담겨있습니다! 안녕하세요 ALEX 입니다! 예전부터 지금까지 'SQL을 어떤용도로 가장 많이 사용할까?' 생각해봤습니다. SQL은 단순히 전처리용이다? SQL의 용도를 '전처리' 로만 생각하시는 분들이 많으실 것 같은데. 그보다도 더 중요하고, 많이 쓰이는 순간이 있습니다. (아주 단순하지만 중요한 절차!) 만들어진 데이터도 다시보자. 확인하는 습관을 들이자. SQL과 함께 제가 생각하기에는 보여주려고 하는 데이터 값의 결과가 정확한가? 내가 생각하는 논리에 맞는가? 이상치는 없는가?를 기본적으로 빠르게 확인하는 과정에서 꼭 필요하고 가장 많이 쓰입니다. 보통 항상 저는 Data 결과를 다시한번 확인하..
SQL
2020. 4. 20. 11:19