网站首页 > 开源技术 正文
1.概述
计算框架和存储系统之间的桥梁.
2.功能
2.1. 统一命名空间
Alluxio通过挂载功能在不同的存储系统之间实现高效的数据管理 (统一管理不同存储系统)。
1.Alluxio中的挂载
将hdfs目录挂在到Alluxio中,再使用alluxio去操作。
这个特性允许用户挂载不同的存储系统到Alluxio命名空间中并且通过Alluxio命名空间无缝地跨存储系统访问文件。
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs ls /
drwxr-xr-x hadoop hadoop 18 PERSISTED 01-10-2018 13:02:18:321 DIR /default_tests_files
drwxr-xr-x hadoop hadoop 1 PERSISTED 01-18-2018 14:51:18:328 DIR /home
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs ls /
drwxr-xr-x hadoop hadoop 18 PERSISTED 01-10-2018 13:02:18:321 DIR /default_tests_files
drwxr-xr-x hadoop hadoop 1 PERSISTED 01-18-2018 14:51:18:328 DIR /home
#挂载HDFS 目录
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs mount /kyrie-mnt/ hdfs://nameservice1/kyrie
Mounted hdfs://nameservice1/kyrie at /kyrie-mnt
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs ls /kyrie-mnt
-rw-r--r-- hadoop supergroup 2329875 PERSISTED 02-01-2018 17:29:02:607 0% /kyrie-mnt/a9a.train
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:609 DIR /kyrie-mnt/linearregression
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:611 DIR /kyrie-mnt/log
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:612 DIR /kyrie-mnt/log2
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:614 DIR /kyrie-mnt/model
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:615 DIR /kyrie-mnt/model2
2.加速访问
由于Alluxio利用内存存储数据,它可以加速数据的访问 。
使用load 文件加载到内存。
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs ls /kyrie-mnt
-rw-r--r-- hadoop supergroup 2329875 PERSISTED 02-01-2018 17:29:02:607 0% /kyrie-mnt/a9a.train
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:609 DIR /kyrie-mnt/linearregression
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:611 DIR /kyrie-mnt/log
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:612 DIR /kyrie-mnt/log2
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:614 DIR /kyrie-mnt/model
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:615 DIR /kyrie-mnt/model2
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs load /kyrie-mnt/a9a.train
/kyrie-mnt/a9a.train loaded
[172.20.42.3:hadoop@sz-pg-mc-test-004:/home/hadoop/alluxio-1.6.1-hadoop-2.6]$ ./bin/alluxio fs ls /kyrie-mnt
-rw-r--r-- hadoop supergroup 2329875 PERSISTED 02-01-2018 17:29:02:607 100% /kyrie-mnt/a9a.train
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:609 DIR /kyrie-mnt/linearregression
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:611 DIR /kyrie-mnt/log
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:612 DIR /kyrie-mnt/log2
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:614 DIR /kyrie-mnt/model
drwxr-xr-x hadoop supergroup 0 PERSISTED 02-01-2018 17:29:02:615 DIR /kyrie-mnt/model2
3.架构概述
以内存为中心的设计作为数据访问的中心,Alluxio可以为那些大数据应用提供一个数量级的加速,同时它还提供了通用的数据访问接口。
Alluxio对应用屏蔽了底层存储系统的整合细节,所以任何底层存储系统都可以支撑运行在Alluxio之上的应用和框架。
此外Alluxio可以挂载多种底层存储系统,所以它可以作为统一层为任意数量的不同数据源提供服务。
3.1.alluxio组件
Alluxio的设计使用了单个主Master和多Worker的架构。
Alluxio可以被分为三个部分,Master,Worker和Client。
Master和Worker一起组成了Alluxio的服务端,它们是系统管理员维护和管理的组件。
Client通常是应用程序,如Spark或MapReduce作业,或者Alluxio的命令行用户。 Alluxio用户一般只与Alluxio的Client组件进行交互。
Master部署
主master 和从master。
Alluxio Master有简单和高可用性 两种部署模式。这两种模式都只有一个主Master。
简单模式最多只会有一个从Master,而且这个从Master不会被转换为主Master。
高可用性模式可以有零个或者多个从Master。 当主Master异常的时候,系统会选一个从Master担任新的主Master。
高可用地址:https://www.alluxio.org/docs/master/cn/Running-Alluxio-Fault-Tolerant.html
Worker
Alluxio的Worker负责管理分配给Alluxio的本地资源。这些资源可以是本地内存,SDD或者硬盘,其可以由用户配置。 Alluxio的Worker以块的形式存储数据,并通过读或创建数据块的方式处理来自Client读写数据的请求。但Worker只负责这些数据块上的数据;文件到块的实际映 射只会存储在Master上。
Client
Alluxio的Client为用户提供了一个与Alluxio服务端交互的入口。它为用户暴露了一组文件系统API。Client通过发起与Master 的通信来执行元数据操作,并且通过与Worker通信来读取Alluxio上的数据或者向Alluxio上写数据。存储在底层存储系统上而不是Alluxio上的数据可以直接通过 底层存储客户端访问。
alluxio文章列表:
猜你喜欢
- 2024-09-12 在AWS环境下基于EMR、Alluxio和S3构建高效数据分析流水线
- 2024-09-12 Kubernetes, Alluxio 以及解耦的数据分析技术栈
- 2024-09-12 基于Grafana仪表盘的Alluxio指标可视化
- 2024-09-12 基于HashiCorp Nomad构建运行Alluxio经验总结
- 2024-09-12 新版Alluxio提升了GPU利用率和AI/ML应用程序的数据管理性能
- 2024-09-12 Alluxio 2.0到来!数据简仓、数据编排、加速创新
- 2024-09-12 阿里云 E-MapReduce 全面支持 Alluxio
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)