1.内存优化
5 m; B/ m! j1 X* M. p2小文件过多问题
* A0 Q/ \* s5 ?# f8 t; Q3.spark sql合理利用cpu资源5 |2 B) H9 ~6 C1 T7 t, ^
4.spark sql广播join
2 d3 X7 N) z& x4 b$ T! a- k' l5.提高并行度解决数据倾斜错误演示
, K7 U8 A/ d; _% P6.解决数据倾斜打散大表扩容小表
A! \/ \$ w* l, E7.大表join大表优化SMBJoin, w* y1 n. A8 r& f0 N: m
8.使用堆外内存# m: y* D3 l: J8 ?9 F. P5 `
9.spark 3.0AQE动态缩小分区
% R( f- g/ S5 U$ x3 L' k; B10.spark 3.0AQE动态选择join策略
- C/ u0 V1 [+ x: u11 spark3.0AQE动态优化倾斜join9 P7 K' k8 t) Q5 x/ k, \% R
12 sparak3.0 dpp动态分区修剪 j, `9 _2 g" b% }2 X
; h) {3 l8 _. i- g: g本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!
) I' s0 \* G0 W; b
2 i# ] o7 H6 [2 M2 I- c2 s. y% ~, W
9 h, c4 H0 V6 \$ a& K
2 n! n/ G, \& y7 T% k; U# v% }! |, k0 K
. H: K V: f0 p% g3 ^' y' i
|