网站首页 > 开源技术 正文
利用Docker可以很快的安装一个Hadoop集群,方便学习和尝试Hadoop。
检查你的Docker环境
如果你还没有安装Docker,你可以参考Docker官方网站(https://docs.docker.com/install/)或者这个网站(https://yeasy.gitbooks.io/docker_practice/install/)进行安装。
安装好了以后可以用下面的命令检查一下你的环境:
$ docker --version
$ docker-compose --version
$ docker-machine –version
可以通过下面的命令启动一个web服务器:
docker run -d -p 80:80 --name myserver nginx
启动起来以后可以用浏览器打开这个网页
http://localhost
这说明你的Docker环境好了。
用Docker安装Hadoop集群
首先你需要一个Docker Image,如果你安装了git, 你可以clone一个repo到本地:
$ git clone git@github.com:big-data-europe/docker-hadoop.git
如果你没有git,你也可以直接下载zip(https://github.com/big-data-europe/docker-hadoop/archive/master.zip)
然后你就可以进入这个目录,安装和启动一个Hadoop集群:
$ cd docker-hadoop
$ docker-compose up -d
第一次运行,需要比较长的时间来下载docker的image。
这一个命令会帮你安装和启动一个Hadoop集群,其中包括:
- 1个 HDFS namenode
- 1个 HDFS datanode
- 1个 YARN resourcemanager
- 1个 historyserver
- 1个 nodemanager
通过下面的命令可以查看到Docker的进程列表:
$ docker ps
查看系统的信息
可以通过这个下面的地址查看系统的信息:
http://localhost:9870
试试你的集群
我们现在可以用经典的Hadoop实例WordCount来试运行一下。通过下面的命令进入到namenode的容器里:
$ docker exec -it namenode bash
首先我们准备一些文件:
$ mkdir data
$ echo "Hello Docker World" > data/f1.txt
$ echo "Hello toutiao" > data/f2.txt
在HDFS里面建一个文件夹data:
$ hadoop fs -mkdir -p data
把我们刚才准备的文件写到HDFS:
$ hdfs dfs -put ./data/* data
下载WordCount代码(https://repo1.maven.org/maven2/org/apache/hadoop/hadoop-mapreduce-examples/2.7.1/hadoop-mapreduce-examples-2.7.1-sources.jar)
找到namenode的容器的ID
$ docker container ls
把刚下载的jar包复制到namenode:
$ docker cp ./hadoop-mapreduce-examples-2.7.1-sources.jar 2aa29deaaf80:hadoop-mapreduce-examples-2.7.1-sources.jar
运行WordCount
root@namenode:/# hadoop jar hadoop-mapreduce-examples-2.7.1-sources.jar org.apache.hadoop.examples.WordCount input output
打印出运行结果:
root@namenode:/# hdfs dfs -cat output/part-r-00000
Docker 1
Hello 2
World 1
toutiao 1
这样我们就完成了集群的搭建。
安全的关闭集群
$ docker-compose down
猜你喜欢
- 2024-11-20 docker 容器内怎么把文件拷贝到宿主机
- 2024-11-20 2024年了,你还在使用Docker做容器吗?
- 2024-11-20 Docker入门详解(下)
- 2024-11-20 Docker与虚拟机区别详解(图文全面总结)
- 2024-11-20 Docker技术剖析
- 2024-11-20 【系统架构】Kubernetes还是DC/OS?容器编排平台如何选?
- 2024-11-20 如何使用Docker部署MongoDB副本集
- 2024-11-20 Docker Swarm 让你事半功倍
- 2024-11-20 WIN7下安装Docker容器
- 2024-11-20 大白话 linux 教程-02-环境搭建
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)