- PrestoAndHiveTrainingSession . . . . 8 matches
# Hive & Presto Architecture
- DFS(HDFS, S3) > ResourceManager(YARN) > Processing(MapReduce,Tez) > SQL Engine(Hive)
basedOnDisk: Hive(MR, Tez)
Hive on Tez(or MR) : best for batch processing
Presto: join 순서를 변경하지 않음. 왼쪽은 결과셋이 큰테이블, 오른쪽은 작은 테이블을 쓰는게 빠르다(Hive는 무관)
Hive: group by 기준컬럼은 distinct(=분포도) 가 높은 컬럼 순으로 작성(ex: group by order_dt, gender)
Hive: order by a, b --> distribute by a sort by a, b (a를 이용해서 reducer 생성)
대량 order by : Hive에서 중간 테이블 만들고 Presto에서 이용
- Hive . . . . 1 match
[Presto and Hive Training Session]
- Presto . . . . 1 match
[Presto and Hive Training Session]
- ejb . . . . 1 match
*[HiveMind] : 또 하나의 [IoC]컨테이너.
Found 4 matching pages out of 1800 total pages
You can also click here to search title.