1.内存优化" j6 u0 i0 _ ]
2小文件过多问题# v: P) X9 M! K! t K2 w9 ]4 x7 o
3.spark sql合理利用cpu资源
% ]* y$ x/ l" I' x+ b" r4.spark sql广播join" ?% K4 J4 L% S' V% B8 ?
5.提高并行度解决数据倾斜错误演示( w. q6 X- e/ T! R1 `$ d
6.解决数据倾斜打散大表扩容小表! c& b. h+ m- I ~4 R, u0 D4 W+ Q; T5 P
7.大表join大表优化SMBJoin2 M: w" I2 | H
8.使用堆外内存
6 a& Z5 g1 ?/ p& G/ x& d9.spark 3.0AQE动态缩小分区1 F$ n6 M7 Z2 i' v3 A
10.spark 3.0AQE动态选择join策略
3 b# C% ]( S4 p; e L3 O9 I11 spark3.0AQE动态优化倾斜join, X; W6 m( W& z( y. B. W6 w# K
12 sparak3.0 dpp动态分区修剪
I0 l; l5 w6 a- q X5 T4 o; l- N/ S8 x0 }1 {1 g) B
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!" a7 ]8 V: S+ Y; e/ g) Q
& j2 H; M3 h) s# r9 G( F( q! R
5 w( g1 `" b$ D5 p" q
) i5 P: P, }- J1 M! }
- f7 |8 n& x. i" `. \! d4 X |