1.内存优化7 ]+ g8 y$ C& I; _# T+ j
2小文件过多问题
* N5 w6 [1 y+ R$ C( u# T3.spark sql合理利用cpu资源2 W; G4 r5 l2 l: G
4.spark sql广播join! C1 T' B3 ?# d6 B. o9 y, o
5.提高并行度解决数据倾斜错误演示
# s9 A, m: i) b2 S# J \6.解决数据倾斜打散大表扩容小表% Z0 R: I/ P5 u! z, g' Q
7.大表join大表优化SMBJoin+ c( H; @( _) J+ E0 A9 k$ U
8.使用堆外内存
# j- [* P; }! Z% I1 c9 ~9.spark 3.0AQE动态缩小分区& |/ M. v1 B& d" \8 ^! n
10.spark 3.0AQE动态选择join策略$ w8 u0 h" ^9 H" O& b. n
11 spark3.0AQE动态优化倾斜join. x' A( I- z' V, X
12 sparak3.0 dpp动态分区修剪6 `3 _ z& V. h7 j/ ^
1 B% e/ x: l& A1 m
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!4 t) E2 ~3 ?7 d
' n: c* ?* r/ y
; U, F! z3 {) A/ \# W) i
& ^; W( v+ {$ o; [" [+ ^
- B5 `1 g, D, J" I% q/ g' h! H& W; ~ |