Java 实现SparkSQL保存查询结果（带有字段信息）到HDFS（header）

技术2024-03-12 74

public class SparkSQLJob { private static final Logger LOG = Logger.getLogger(SparkSQLJob.class); public static void main(String[] args) throws InterruptedException{ LOG.setLevel(Level.INFO); if (args == null || args.length < 2){ LOG.error("Please input the AppName, querySQL, savePath, LogPath parameters!"); return; } SparkSQLJob searchObj = new SparkSQLJob(); String querySQL = args[0]; String savePath = args[1]; searchObj.run(querySQL, savePath); } private void run(String querySQL, String savePath){ SparkSession spark = null; try{ spark = SparkSession .builder() .enableHiveSupport() .getOrCreate(); String applicationId = spark.sparkContext().applicationId(); LOG.info("applicationId = " + applicationId); LOG.info("spark sql = " + querySQL); LOG.info("Start Spark Job, data file will in " + savePath); spark.sql(querySQL).write().format(Constants.WRITE_FORMAT).option("header", true).save(savePath); LOG.info("Finished Spark Job, data file in " + savePath); }catch (Exception error){ LOG.error("Spark Job Error", error); return; }finally { try{ spark.close(); }catch (Exception error){ LOG.error("Spark Job Close Failed"); } } } }

Processed: 0.009, SQL: 9