- Spark大数据编程实用教程
- 艾叔主编
- 402字
- 2025-02-17 19:26:51
2.3 运行Spark程序(Local方式)
Spark程序运行方式有两种:
1)第一种为本地运行(Local),Spark程序只在本地运行,不在其他节点运行。此方式经常被用于调试和快速验证;
2)第二种为分布式运行,Spark程序会分布到多个节点上运行,常用于生产环境。
本节以 Spark 自带的圆周率计算示例 SparkPi 为例,介绍Spark程序的本地运行方式。不管是哪种模式,Spark程序运行后,都有Client、Driver和Executor三种角色。
Spark Local运行方式示例——SparkPi。
Spark 软件包中有一个 spark-examples_2.11-2.3.0.jar,它是 Spark 自带示例的 jar 包,下面就以其中的SparkPi为例,介绍Spark程序的本地(Local)运行方式。
运行SparkPi的具体命令如下。

SparkPi的程序参数说明如下。
●--class org.apache.spark.examples.SparkPi,指明此次运行程序的Main Class;
●--master local,表示此Spark程序Local运行;
●examples/jars/spark-examples_2.11-2.3.0.jar,为Spark示例的jar包;
●10,表示迭代10次。
如果输出以下结果,说明计算成功。

程序运行时,会有一个Warn提示,如下所示。

解决办法是在/etc/profile中添加下面的内容。

切换到普通用户,运行下面的命令,使得配置生效。

再次运行SparkPi,就不会有警告了。
Spark本地方式运行,不需要集群管理器。