Spark Sql

Spark sql

Spark中dataframe执行sql操作

Spark中join类型

Spark中的join格式

left and left_outer joins are the same.

left and left_outer joins are the same.

outer, full and full_outer joins are the same.

例子

Spark执行hive sql

Spark sql需要分段执行

操作外表

要么直接create后,insert到数据仓库中,成为一张新表

要么直接先对dataframe进行cache,然后再生成临时表进行使用(第一次时会仍然进行操作的),但是之后会加快速度。

Reference

Last updated