일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- enq: FB - contention
- 데이터분석
- Oracle 논리적 저장 구조
- CF
- airflow 정리
- 랜덤포레스트
- 배깅
- Spark 튜닝
- Decision Tree
- 데이터 분석
- 앙상블
- git stash
- 통계분석
- eda
- 의사결정나무
- 네트워크
- Oracle ASSM
- Spark jdbc parallel read
- Collaborative filtering
- 추천시스템
- Linux
- 오라클 데이터 처리방식
- Spark Data Read
- Python
- git 기본명령어
- SQL
- git init
- 알고리즘
- BFS
- 리눅스 환경변수
- Today
- Total
목록전체 글 (85)
[Alex] 데이터 장인의 블로그
Elasticsearch 중요 용어 Elasticsearch 관계형 데이터베이스(RDMS) 인덱스(Index) 테이블(Table) 샤드(Shard) 파티션(Partition) 문서(Document) 행(Row) 필드(Field) 열(Column) 매핑(Mapping) 스키마(Schema) Query DSL or KQL SQL 색인(indexing) 데이터를 검색될 수 있는 구조로 변경하기 위해 원본 문서를 검색어 토큰들로 변환하여 저장하는 일련의 과정. = 색인, 색 과정 인덱스(index, indices) 색인 과정을 거친 결과물 or 색인된 데이터가 저장되는 저장소 ES에서는 도큐먼트들의 논리적인 집합을 표현하는 단위 검색(search) 인덱스에 들어있는 검색어 토큰들을 포함하고 있는 문서를 찾아가는..
Elasticsearch 역사 검색엔진의 시초, Lucene 루씬(Lucene)은 자바 언어로 이루어진 정보 검색 라이브러리 자유-오픈 소스 소프트웨어. 아파치 소프트 웨어 재단에 의해 지원되며, 아파치 라이선스 하에 배포. Full text 색인 및 검색 기능을 필요로 하는 모든 응용 프로그램에 적합하지만 웹 검색 엔진 및 로컬 단일 사이트 검색 구현에서의 유용성으로 널리 알려져 있다. 이 루씬(java)을 기반으로 등장하여 검색엔진의 지배적인 위치해 있고 나아가 로그분석 등 다양한 영역에서 요즘 핫한 오픈소스 서비스 제품이 바로 '엘라스틱 서치' ELK 는 옛말. Elastic Search + Logstach + Kibana를 묶어 ELK(ELK Stack)라는 서비스명으로 제공했으나 5.0.0 버전..
마크다운(MarkDown) 누가 작성해놓은 github에 접속하여 해당 패키지를 설명해놓은 문서를 보신적 있나요? README.md, 이 파일이 바로 마크다운 문법으로 작성된 문서 파일입니다. 개발자들이 블로그나 github의 내용을 정리할 때 주로 사용하고, 분석가들이나 DS분들이 주피터에 마크다운 형식으로 정리를 하기도 합니다. 이처럼 알아두면 쓸데있는, 오늘은 마크다운 사용법에 대해서 정리해보겠습니다. 마크다운 에디터 추천 Vscode - 마크다운 Mac 사용자는 거의 대부분의 마크다운 에디터가 '유료'이기 때문에 Vscode의 확장팩을 활용해서 가성비를 챙기시는 걸 추천드립니다. Typora 편리함.... 편리해요.. 윈도우 사용자는 추천입니다. 마크다운(MarkDown) 사용법 정리 제목(Hea..
2022.01.16 - [Git] - [Git] 기본명령어 (pull, fetch, reset, revert, push) git stash 출처 : https://gmlwjd9405.github.io/2018/05/18/git-stash.html ex. 자신이 어떤 작업을 하던 중에 다른 요청이 들어와 하던 작업을 멈추고 잠시 브랜치를 변경해야 할 일이 있다고 하자. 이때, 아직 완료하지 않은 일을 commit하는 것은 껄끄럽다. 어떻게 해야 될까? 1. 현재 작업하고 있는 작업물을 따로 저장 git status // working directory에 있는 파일의 상태 확인 $ git status Changes to be committed: (use "git reset HEAD ..." to unstag..
2022.01.15 - [Git] - [Git] 기본명령어 (init, add, commit, push, diff, status, log) 이전글에 이어서 정리. git remote add origin [원격 저장소 위치] [원격 저장소 위치] = git 주소 저장소 위치를 origin 에 추가하는 작업. 나중에 url을 일일히 타이핑하는 것이 아니라 origin으로만 실행할 수 있음. git push -u origin master 로컬 저장소에서 연결된 저장소에 push(업로드) add해서 stage에 넣어놨던 코드를 최종목적지(git 주소)로 보내기 위한 작업. git remote -v 연결 상태 확인 git clone [url] 원격 저장소(url)에서 코드를 다운로드 -> 각자 로컬 컴퓨터에서 따..
보통의 소프트웨어 버전 개발 여러명의 협업자가 각자의 개발작업을 마친 후 하나의 리포지토리로 업로드. 초기 셋팅 로컬 저장소에서 원격 저장소로 데이터를 넘길때 커밋한 사람이 누구며, 어떠한 사람인지 남길 필요가 있음. 이런 인증에 대한 부분을 git config 명령어로 설정. 아래의 명령어는 PC의 git 시스템 환경설정정보를 설정하는 명령어 git config --global user.name "작성자 이름" git config --global user.email "작성자 이메일" 앞으로 commit을 수행할 때마다 위에 설정한 정보를 사용. git init .git 폴더 생성 버전의 모든 데이터들이 저장되어 있는 폴더 위치 폴더를 지우면 모든 것이 초기화 + .gitignore : 업로드를 무시하고..
git을 단지 취업을 위해 관리하는 용도가 아닌 실제 용도에 맞게 공부하기 위해서 정리해 놓은 글입니다. 보여주기 위한 git이 아니라 내가 팀에 도움이 될 수 있도록 하기위한 git을 공부 중입니다. Git Git을 모르고 이 글을 읽기 시작했을리는 없을것이라 자세한 설명을 하진 않겠지만, 짧게 git을 정의하자면 개발에서의 버전관리, 협업을 위한 용도로 사용되는 것. VCS (Version Control System, 버전 관리 시스템) 버전관리에 필요한 요소 Snapshot : 특정 시점에서 파일의 상태 (현재 상태의 모든 정보) Delta : 파일의 이전 상태와 비교한 변경사항 DVCS (분산 버전관리) 중앙 서버에 있는 코드를 각각 개발자 로컬 컴퓨터에 복사한 후, 복사된 프로젝트를 가지고 작업..