일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 알고리즘
- 앙상블
- Oracle ASSM
- 오라클 데이터 처리방식
- 랜덤포레스트
- enq: FB - contention
- Spark 튜닝
- 추천시스템
- BFS
- 데이터분석
- Spark Data Read
- eda
- 의사결정나무
- git init
- airflow 정리
- Oracle 논리적 저장 구조
- Spark jdbc parallel read
- Python
- CF
- git 기본명령어
- Decision Tree
- Linux
- 배깅
- git stash
- 데이터 분석
- SQL
- 리눅스 환경변수
- 통계분석
- Collaborative filtering
- 네트워크
- Today
- Total
[Alex] 데이터 장인의 블로그
데이터 분석, SQL은 기본이다. 본문
EDA = SQL
제가 이번글을 작성한 이후 생각해봤던 이 글의 전체적인 맥락은 위 표현으로 나타낼 수 있을 것 같습니다.
저는 마케팅 전공의 베이스로 처음 데이터 분석을 접하게 되었습니다. CRM 마케팅, Data Driven Marketing 이라고도 불리웁니다. 때문에 머신러닝, 딥러닝을 이용한 예측, 분류 등이 아닌 '기본적인' EDA를 실시하는 과정부터 배워왔습니다.
주로 Annual report , Monthly report 등을 작성하며 대략적인 현황조사를 진행하였으며 이때 사용했던 데이터 분석 Tool이 바로 'SQL' 이었습니다.
데이터 분석으로의 커리어를 쌓아야겠다고 생각했던 학생시절.. R과 Python, 머신러닝 기법 등 기초 통계분석에 대해 공부했던 저로서는 쌩뚱맞은 언어라 생각했습니다.
Data driven Marketing,
주로 고객 행동에 대해 분석을 진행하고 상품 구매유도를 위한 Contact(e-amil, sms 반응유도)을 진행하는데,
이 데이터는 모두 회사내부 = (데이터베이스)에 존재하였습니다. 이를 직접적으로 분석하고 인사이트를 도출하기 위해서는 SQL 쿼리 외의 다른 Tool 들은 필요하지 않았던 것 같습니다.
현재 모든 기업들이 (모든 기업들이라고 해도 과언은 아닐 듯 합니다.) 데이터를 활용하여 브랜드 내에서의 고객 경험을 증대시키기 위해 갖가지 노력을 진행한다고 합니다. 기업의 입장에서는 새로운 고객을 얻기위해 들이는 비용보다도 기존고객을 유지하기 위한 비용이 적기 때문에 이러한 데이터 기반의 마케팅 활동들을 진행합니다. 고객은 어느새 나도모르는 나의 취향과 입맛을 기업이 캐치하고 구매를 유도하기 위한 상품추천까지 이어집니다.
기업들은 바보가 아니라 이러한 Action을 위한 데이터를 기업 내부, 자신들의 데이터베이스에 '저장'합니다. 이를 꺼내고 바로 분석까지 진행하기 위해서는 SQL역량이 필수적이었던 것이죠. 물론 'SQL' 만 잘해서 되냐? 끝이냐? 이런 물음에는 'NO'라고 말씀드리고 싶습니다.
데이터를 한눈에 살펴보고 더 나아가 '무엇'인가? 인사이트를 얻기위해서는 Excel 이든 PPT는 이해할 수 있도록 도식화하는 작업이 필요합니다. 또한 데이터 분석이 데이터 사이언티스트, 데이터 분석가 , 엔지니어 등 그들만의 리그가 되지 않도록 쉽게 이야기할 수 있는 능력도 필요하다 생각합니다. 이 작업들에 시간을 쏟고, 데이터에서 다양한 인사이트를 탐구하기 위해서는 SQL를 활용한 빠른 분석이 필요합니다.
+ 데이터 시각화를 위한 시너지 효과
유명한 데이터 시각화 툴인 제플린(Zeppelin), 태블로(Tableau) 에서도 기본적인 BASE가 SQL 문법입니다. 즉, 데이터 '추출'부터 인사이트를 얻기위한 '시각화'까지. SQL을 배워야하는 이유는 생각외로 엄청나게 많습니다.
제가 느낀바, 실무를 어느정도 겪어보신 분들도 SQL을 잘 못다루시는 분들이 많습니다. 취업을 준비하시는 취준생 분들도 이 부분을 생각하시고 준비하신다면 눈에 띄는 사람으로 보일거라 생각됩니다. (R과 Python은 누구나 다 준비하고 잘하니깐, 난 SQL 역량까지 쌓아야지..!)
'Alex's data analysis' 카테고리의 다른 글
데이터 분석가 취업 (4) | 2020.02.23 |
---|