1.内存优化
7 _& t( U- C0 d0 K! |; S3 H4 _2小文件过多问题/ b4 R& ?6 R$ m1 e* l8 O; L
3.spark sql合理利用cpu资源- i: m( J( R7 b! G! ?4 U5 G) m
4.spark sql广播join
* j8 ^5 N+ l# T' v; q# |5.提高并行度解决数据倾斜错误演示
# T9 q# M( {" u' A2 P6.解决数据倾斜打散大表扩容小表: k2 z. ?4 A) {- _
7.大表join大表优化SMBJoin1 `( G' i% K$ A x( G
8.使用堆外内存
; f2 O" D& t' ]- _) s5 M: \3 Z/ D9.spark 3.0AQE动态缩小分区! p" v# ^% ^, ^2 ?# K5 ?0 w! |9 {6 a
10.spark 3.0AQE动态选择join策略
7 j& n( ^" z7 n11 spark3.0AQE动态优化倾斜join
% E. f& z3 ~( R12 sparak3.0 dpp动态分区修剪
& {' s5 F0 }/ U, B/ ]9 _# J6 U3 V1 S8 \% A
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!
/ k; {. X3 N7 }# y; m9 U
+ g. I9 _: g: Q c o
9 J6 J Y+ Y- n# k6 ?# Q6 k: c5 P _( m1 U$ Q
- j1 i, i* R2 ~; F: ?: q
|