1.内存优化$ N6 j3 K2 r, F4 _
2小文件过多问题
( x7 ]9 u' X7 D* N, H3.spark sql合理利用cpu资源" x( a1 V$ Y6 ~) l
4.spark sql广播join: J% K$ t ^: ?; _& Z- F
5.提高并行度解决数据倾斜错误演示
& T. Y; o% y$ Z9 R+ A# M6.解决数据倾斜打散大表扩容小表4 c) j4 U" C/ @* R% s1 x
7.大表join大表优化SMBJoin8 b; u; D% Y& U' T$ K. w
8.使用堆外内存% w6 S% t# h+ {
9.spark 3.0AQE动态缩小分区4 W$ Q+ x0 @3 ]0 M! ^, e$ H+ J
10.spark 3.0AQE动态选择join策略; h2 D$ w$ q4 N- b/ M9 E# r2 d
11 spark3.0AQE动态优化倾斜join& U" I, b4 h% q7 i- f- q$ ]
12 sparak3.0 dpp动态分区修剪
2 ?$ X$ v: J, J; R3 Y, C/ e7 w( e' s% v8 ~
本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!
% t6 c0 Z" E; R0 c* R) \2 J% }) I( ]2 c5 ^2 Z* ]9 R6 j7 c
D$ g2 E9 R! n9 B' Y6 T+ ^! I
3 g$ F2 {2 S! {) t |