网站首页 > 开源技术 正文
测试数据以及脚本准备
1.创建一个MySQL的测试账号及准备测试数据
CREATE USER 'testuser'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON *.* TO 'testuser'@'%';
FLUSH PRIVILEGES;
准备测试表和数据
create database test_db default character set utf8;
创建表并插入数据
create table user(
id int(10) primary key not null auto_increment,
name varchar(20) not null,
age int(10) not null
) ENGINE=InnoDB DEFAULT CHARSET=UTF8;
desc user;
插入数据
2.Sqoop抽数脚本
sqoop import --connect jdbc:mysql://192.168.0.224/test_db --username testuser --password password --table user --delete-target-dir --target-dir /tmp/sqoop_test -m 4
配置工作流
1.进入Hue界面,选择”Workflows” => “Editors”=> “Workflows”
2.点击“Create”创建工作流
3.进入Workspace,将jdbc文件导入到该Workspace
4.创建Sqoop抽数作业
将Sqoop语句填入Sqoop Command
保存
5.试运行
执行成功
文件已存在
配置定时任务
1. 进入Hue界面,选择”Workflows” => “Editors”=> “Coordinators”
2.选择”Create”
3.选择”Choose a workflow”
4.选择上面所创建的工作流“My Workflow”
5.填写相关配置
此处设置循环为小时循环,可以设置小时、天、周、月、年。
6.设置开始时间与结束时间
生成任务
验证
向表再次添加数据。
第一次任务执行时间为
可以看到Yarn上存在任务
导入的文件内容与表内容一致。
猜你喜欢
- 2024-10-09 大数据开发岗位的职业规划,你知道吗?
- 2024-10-09 大数据开发和大数据分析有什么区别吗?
- 2024-10-09 大数据分析工程师入门11-Hue&Zeppelin
- 2024-10-09 Hadoop的任务调度器:Azkaban快速入门
- 2024-10-09 0207-使用Oozie API接口向Kerberos环境的CDH集群提交Shell作业
- 2024-10-09 0535-5.15.0-Oozie中创建Ssh Action指定ssh端口号
- 2024-10-09 如何在HUE上创建oozie Coordinator定时任务流
- 2024-10-09 如何在HUE上通过oozie调用Pig工作流
- 2024-10-09 0475-如何统一Hue和Oozie的时区(0475-如何统一hue和oozie的时区使用)
- 2024-10-09 Hadoop2.7.3上安装oozie-4.3.1(hadoop3.1.3安装详细步骤)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)