1.内存优化
! S* \% j7 P, O2小文件过多问题& D3 h$ u/ V c# C l, c4 z
3.spark sql合理利用cpu资源
% I9 N0 E( w( }8 e9 h9 ?9 g4.spark sql广播join
5 Y+ R* X7 y+ z. |- t5 Z$ D O5.提高并行度解决数据倾斜错误演示# S# W l8 ` I! d5 L
6.解决数据倾斜打散大表扩容小表. b8 L: E/ Z& g3 H* z: }
7.大表join大表优化SMBJoin
+ R) k# U# q' e# u d7 L/ e8.使用堆外内存
8 l( W8 G! ^& H9.spark 3.0AQE动态缩小分区* x: M A2 I# D, k( V
10.spark 3.0AQE动态选择join策略
! x0 W/ U( T8 o* u% L# b/ h11 spark3.0AQE动态优化倾斜join
: Y' X7 `1 k$ e0 g" @12 sparak3.0 dpp动态分区修剪! B6 y5 f8 H5 p3 a/ f
4 N0 B! S# X/ i. W2 k
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!( [/ v# C/ k- f2 E
: v7 A- Z) h. B% V3 m$ v! _
4 F" | r9 p3 t3 ~% n; f5 {! Y
4 z& w! d0 Q% \4 C: h7 V
/ \: @1 I/ c2 I0 F |