MyException - 我的异常网
当前位置:我的异常网» PowerDesigner » Spark 2017 BigData Update(一)ENV on Spark 2.2.1

Spark 2017 BigData Update(一)ENV on Spark 2.2.1 with Zeppelin on Local

www.MyException.Cn  网友分享于:2013-03-06  浏览:0次
Spark 2017 BigData Update(1)ENV on Spark 2.2.1 with Zeppelin on Local
Spark 2017 BigData Update(1)ENV on Spark 2.2.1 with Zeppelin on Local

Java Version
>java -version
java version "1.8.0_121"

Maven Version
>mvn --version
Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c07478323dc5; 2015-11-10T10:41:47-06:00)

Protoc Version
>protoc --version
libprotoc 2.5.0

Currently Spark is with hadoop 2.7 version, so I plan to use these, Install hadoop 2.7.5
http://mirrors.ocf.berkeley.edu/apache/hadoop/common/hadoop-2.7.5/hadoop-2.7.5-src.tar.gz

Prepare CMake ENV on MAC
https://cmake.org/install/
>wget https://cmake.org/files/v3.10/cmake-3.10.1.tar.gz
unzip and go to that working directory
>./bootstrap
>make
>sudo make install
>cmake --version
cmake version 3.10.1

Unzip the source of hadoop try to build that
>mvn package -Pdist,native -DskipTests -Dtar

Still I can not build that on my MAC, so it is fine. I will use the binary as well.
Download the binary
>wget http://apache.osuosl.org/hadoop/common/hadoop-2.7.5/hadoop-2.7.5.tar.gz
Unzip the file and move to work directory
>sudo ln -s /Users/carl/tool/hadoop-2.7.5 /opt/hadoop-2.7.5
Prepare the Configuration file
>cat etc/hadoop/core-site.xml
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

>cat etc/hadoop/hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

Format the file system
>hdfs namenode -format

Generate the key to access localhost
>ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
>cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

Still have issue saying connection refused
>ssh localhost
ssh: connect to host localhost port 22: Connection refused
Solution:
https://bluishcoder.co.nz/articles/mac-ssh.html
Open System Reference —> Sharing —> Remote Login
Not work on Mac OS.

HDFS, but I need to type password during the process
>sbin/start-dfs.sh

Visit the webpage
http://localhost:50070/dfshealth.html#tab-overview

YARN
>sbin/start-yarn.sh

Visit the page
http://localhost:8088/cluster

Install Spark
>wget http://apache.spinellicreations.com/spark/spark-2.2.1/spark-2.2.1-bin-hadoop2.7.tgz
unzip and place in the working directory
>sudo ln -s /Users/carl/tool/spark-2.2.1 /opt/spark-2.2.1

Prepare Configuration File
>cat conf/spark-env.sh
HADOOP_CONF_DIR=/opt/hadoop/etc/hadoop

>echo $SPARK_HOME
/opt/spark

Start the Spark Shell
>MASTER=yarn-client bin/spark-shell
yarn-client is changed after 2.0, I will use this instead
>MASTER=yarn bin/spark-shell

It stuck there for a while, maybe because of some stuck tasks, let me kill them
>bin/yarn application -kill application_1514320285035_0001

Install Zeppelin
https://zeppelin.apache.org/docs/0.7.3/install/install.html#installation
Download binary
>wget http://apache.mirrors.tds.net/zeppelin/zeppelin-0.7.3/zeppelin-0.7.3-bin-all.tgz
Place the file in directory
>sudo ln -s /Users/carl/tool/zeppelin-0.7.3 /opt/zeppelin-0.7.3
Prepare conf
>cat conf/zeppelin-env.sh
export SPARK_HOME="/opt/spark"
export HADOOP_CONF_DIR="/opt/hadoop/etc/hadoop/"

Start the notebook
>bin/zeppelin-daemon.sh start
stop the notebook
>bin/zeppelin-daemon.sh stop

Visit the webpage
http://localhost:8080/#/

You can see the task here as well
http://localhost:4040/stages/

spark.master is ‘local
  • ’, that is why it runs on local machine, not on remote YARN, we can easily change that in the setting page

  • References:
    http://sillycat.iteye.com/blog/2286997
    http://sillycat.iteye.com/blog/2288141
    http://sillycat.iteye.com/blog/2405873

    https://spark.apache.org/docs/latest/
    https://zeppelin.apache.org/docs/0.7.3/install/install.html#installation

    文章评论

    程序员应该关注的一些事儿
    程序员应该关注的一些事儿
    为什么程序员都是夜猫子
    为什么程序员都是夜猫子
    为啥Android手机总会越用越慢?
    为啥Android手机总会越用越慢?
    如何成为一名黑客
    如何成为一名黑客
    “懒”出效率是程序员的美德
    “懒”出效率是程序员的美德
    中美印日四国程序员比较
    中美印日四国程序员比较
    程序员眼里IE浏览器是什么样的
    程序员眼里IE浏览器是什么样的
    程序员的鄙视链
    程序员的鄙视链
    十大编程算法助程序员走上高手之路
    十大编程算法助程序员走上高手之路
    60个开发者不容错过的免费资源库
    60个开发者不容错过的免费资源库
    2013年中国软件开发者薪资调查报告
    2013年中国软件开发者薪资调查报告
    10个帮程序员减压放松的网站
    10个帮程序员减压放松的网站
    每天工作4小时的程序员
    每天工作4小时的程序员
    程序员和编码员之间的区别
    程序员和编码员之间的区别
    什么才是优秀的用户界面设计
    什么才是优秀的用户界面设计
    如何区分一个程序员是“老手“还是“新手“?
    如何区分一个程序员是“老手“还是“新手“?
    程序员必看的十大电影
    程序员必看的十大电影
    旅行,写作,编程
    旅行,写作,编程
    程序员周末都喜欢做什么?
    程序员周末都喜欢做什么?
    那些性感的让人尖叫的程序员
    那些性感的让人尖叫的程序员
    当下全球最炙手可热的八位少年创业者
    当下全球最炙手可热的八位少年创业者
    老美怎么看待阿里赴美上市
    老美怎么看待阿里赴美上市
    Java程序员必看电影
    Java程序员必看电影
    5款最佳正则表达式编辑调试器
    5款最佳正则表达式编辑调试器
    老程序员的下场
    老程序员的下场
    看13位CEO、创始人和高管如何提高工作效率
    看13位CEO、创始人和高管如何提高工作效率
    鲜为人知的编程真相
    鲜为人知的编程真相
     程序员的样子
    程序员的样子
    我的丈夫是个程序员
    我的丈夫是个程序员
    科技史上最臭名昭著的13大罪犯
    科技史上最臭名昭著的13大罪犯
    不懂技术不要对懂技术的人说这很容易实现
    不懂技术不要对懂技术的人说这很容易实现
    写给自己也写给你 自己到底该何去何从
    写给自己也写给你 自己到底该何去何从
    Web开发人员为什么越来越懒了?
    Web开发人员为什么越来越懒了?
    Java 与 .NET 的平台发展之争
    Java 与 .NET 的平台发展之争
    聊聊HTTPS和SSL/TLS协议
    聊聊HTTPS和SSL/TLS协议
    程序员都该阅读的书
    程序员都该阅读的书
    要嫁就嫁程序猿—钱多话少死的早
    要嫁就嫁程序猿—钱多话少死的早
    Web开发者需具备的8个好习惯
    Web开发者需具备的8个好习惯
    “肮脏的”IT工作排行榜
    “肮脏的”IT工作排行榜
    10个调试和排错的小建议
    10个调试和排错的小建议
    Google伦敦新总部 犹如星级庄园
    Google伦敦新总部 犹如星级庄园
    程序员的一天:一寸光阴一寸金
    程序员的一天:一寸光阴一寸金
    总结2014中国互联网十大段子
    总结2014中国互联网十大段子
    编程语言是女人
    编程语言是女人
    程序猿的崛起——Growth Hacker
    程序猿的崛起——Growth Hacker
    做程序猿的老婆应该注意的一些事情
    做程序猿的老婆应该注意的一些事情
    团队中“技术大拿”并非越多越好
    团队中“技术大拿”并非越多越好
    我是如何打败拖延症的
    我是如何打败拖延症的
    2013年美国开发者薪资调查报告
    2013年美国开发者薪资调查报告
    软件开发程序错误异常ExceptionCopyright © 2009-2015 MyException 版权所有