Airflow 실습02
데이터베이스를 위한 아파치 에어플로 데이터 파이프라인 구축
실무 예제로 배우는 데이터 공학 87 ~ 91p
관리자 권한으로 실행 : ubuntu
→ elasticsearch 가동하기
→ Kibana 가동하기
- 경로 이동, 가상 환경 진입
→ cd ..
→ cd ..
→ cd mnt/c/airflow-test
→ source venv/bin/activate
- 교재의 elastic search 버전을 참고하여 설치
→ pip3 install elasticsearch==7.17.2
- 교재 80p
- 일단 vi 대신에 code . 를 사용한다.
→ code .
( 안 될 경우, Ubuntu를 다시 시작한다)
→ 코드 실행 시, VSCord가 자동으로 시작된다
- 폴더 생성
→ 폴더 생성 : chapter04
→ 파일 생성 : e_search.py
→ 코드 작성
1 | from elasticsearch import Elasticsearch |
- 가상환경 가동 후 실행
→ 저장
→ 터미널
→ source venv/bin/activate
→ cd chapter04/
→python3 e_search.py
- 교재 81p
→ 파일 작성 : e_search02.py
→ 코드 작성
1 | from elasticsearch import Elasticsearch |
→ 저장 후 실행
→ python3 e_search02.py
→ 다음과 같이 (998,[]) 출력되면 성공
- Kibana 페이지 실행
→ 주소창에 입력 : localhost:5601/
→ 메뉴바
→ Stack Management
→ Index Patterns
→ Create index pattern
→ 이름 : users
→ Create index pattern
→ 햄버거 메뉴바 열기
→ Discover
→ 앞에서 추가한 index의 문서를 확인할 수 있다.
데이터 저장소
- RDBMS
— 종류 : Oracle, PostgreSQL, MySQL, 빅쿼리(구글),…
— 표준 SQL (하나를 잘 알면, 거의 비슷!)
- NoSQL
— 종류 : Elasticsearch, 몽고 DB (무료 버전)
어려운 것 조회 하는 방법이 RDMBS ≠ NoSQL 다름 (완전 다름!)
- Reference
- 실무 예제로 배우는 데이터 공학
- Elasticsearch (notion.so)
install_url
to use ShareThis. Please set it in _config.yml
.