Mryqu's Notes


  • 首页

  • 搜索
close

[Spark] Set spark.yarn.archive

时间: 2016-08-01   |   分类: BigData     |   阅读: 55 字 ~1分钟

提交Spark作业时,遇到没有设置spark.yarn.jars和spark.yarn.archive的告警:

16/08/01 05:01:19 INFO yarn.Client: Preparing resources for our AM container
16/08/01 05:01:20 WARN yarn.Client: Neither spark.yarn.jars nor spark.yarn.archive is set, falling back to uploading libraries under SPARK_HOME.
16/08/01 05:01:23 INFO yarn.Client: Uploading resource file:/tmp/spark-AA-BB-CC-DD-EE/__spark_libs__XXX.zip -> hdfs://node50064.mryqu.com:9000/user/hadoop/.sparkStaging/application_1469998883123_0001/__spark_libs__XXX.zip

解决方案:

cd $SPARK_HOME
zip spark-archive.zip jars/*
hadoop fs -copyFromLocal spark-archive.zip 
echo "spark.yarn.archive=hdfs:///node50064.mryqu.com:9000/user/hadoop/spark-archive.zip" >> conf/spark-defaults.conf

如系统没有安装zip,可执行sudoapt-get install zip进行安装。 这样就不用每次上传Spark的jar文件到HDFS,YARN会找到Spark的库以用于运行作业。

标题:[Spark] Set spark.yarn.archive
作者:mryqu
声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 CN 许可协议。转载请注明出处!

#spark# #spark.yarn.jars# #spark.yarn.archive# #yarn#
Hive与Spark的版本搭配
短网址服务学习和测试
  • 文章目录
  • 站点概览

Programmer & Architect

662 日志
27 分类
1472 标签
GitHub Twitter FB Page
© 2009 - 2023 Mryqu's Notes
Powered by - Hugo v0.120.4
Theme by - NexT
0%