1.内存优化. K: k, c1 H8 ~/ y! p$ U
2小文件过多问题' o. E& |4 x3 C- Z
3.spark sql合理利用cpu资源5 {: G5 E2 ]" N" v3 D& |
4.spark sql广播join
, t% k3 ]4 a9 W" S& f5.提高并行度解决数据倾斜错误演示5 S: i/ Z$ d. y& W3 B: H# j
6.解决数据倾斜打散大表扩容小表/ ~) c k) U: C, s5 Y2 V* M2 U* F. i
7.大表join大表优化SMBJoin
# t4 r* ]" Y ? J8.使用堆外内存/ w6 }/ s. e* q+ ~, x5 U: }! ~
9.spark 3.0AQE动态缩小分区
1 r0 e9 q w# u' P+ \% c# O10.spark 3.0AQE动态选择join策略
# S- F G# H7 b/ a11 spark3.0AQE动态优化倾斜join
+ m& x$ J; {: U! d# H12 sparak3.0 dpp动态分区修剪
; b) O+ O8 k2 D' ~( @+ l$ w* z# G- h8 E \2 E
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!
. o, ^ e$ f9 _' k. {( L; o* r4 y( ~ F9 d+ _+ |. g
, ?; l \. ^/ |" c+ [# _7 f
# `, ^/ N( p, ]8 I6 o3 q9 ]
# g* X- B* B. k1 H. F$ p |