강사 : 그루터 정재화
http://blrunner.com/
Hadoop?
HDFS : 분산 스토리지
MapReduce : 데이터처리시스템
DW VS QueryEngine :
HIVE, TAJO, DRILL, presto, cloudera IMPALA, HAWQ
타조란?
java 언어로 접근해야해서 기존 분석가들이 처리하기 힘들었음
하둡기반의 데이터 웨어하우스 엔진
특징 :
SQL표준 지원(조회 위주)
강력한 분산처리(맵리듀스 엔진을 쓰지 않음)
햫상된 쿼리 최적화 알고리즘과 기술
Tajo로 할수 있는 일 :
oltp, crm, erp, ecommerce, other ==> DW ==> front end analytics
DW : ...