用DolphinScheduler轻松实现Flume数据采集任务自动化！-摩杜云开发者社区

用DolphinScheduler轻松实现Flume数据采集任务自动化！

sFKdtsnoEZdx 15天前 20 0

大数据

file

转载自天地风雷水火山泽

目的

因为我们的数仓数据源是Kafka，离线数仓需要用Flume采集Kafka中的数据到HDFS中。
在实际项目中，我们不可能一直在Xshell中启动Flume任务，一是因为项目的Flume任务很多，二是一旦Xshell页面关闭Flume任务就会停止，这样非常不方便，因此必须在后台启动Flume任务。
所以经过测试后，我发现海豚调度器也可以启动Flume任务。
file

海豚调度Flume任务配置

（一）Flume在Linux中的路径
file

（二）Flume任务文件在Linux中的位置以及任务文件名
file

（三）在海豚中配置运行脚本
file

#!/bin/bash
source /etc/profile

/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意：/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装，根据自己安装路径进行调整
（四）海豚任务配置好后就可以启动海豚任务
file

（五）在HDFS对应文件夹中验证是否采集到数据
file
可以看到，Flume采集Kafka数据成功写入到HDFS中，成功实现用Apache DolphinScheduler执行Flume任务的目的！
原文链接：
https://blog.csdn.net/tiantang2renjian/article/details/136399112

本文由白鲸开源提供发布支持！

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： GreatSQL统计信息相关知识点下一篇：对接HiveMetaStore，拥抱开源大数据

分享：

最后一次编辑于 15天前 0

暂无评论

推荐阅读

Spark中的闭包引用和广播变量

fpnGa3tZblZa 6天前 15 0 0 大数据

Apache DolphinScheduler 4月简报：社区发展与技术革新速递

sFKdtsnoEZdx 19小时前 6 0 0 大数据

Apache SeaTunnel 4月回顾：明星贡献者与技术突破

NCZdV8CZSb34 19小时前 5 0 0 大数据

大数据面试SQL每日一题系列：最高峰同时在线主播人数。字节，快手等大厂高频面试题

Ku3edDmxXuM9 19小时前 5 0 0 大数据

基于Hadoop框架实现的对历年四级单词的词频分析（入门级Hadoop项目）

OTTdqlHwhoOK 19小时前 5 0 0 大数据

什么是SQL 语句中相关子查询与非相关子查询

Ku3edDmxXuM9 11天前 15 0 0 大数据

OLAP开源引擎对比之历史概述

fpnGa3tZblZa 11天前 15 0 0 大数据

Apache DolphinScheduler 3.3.0 版本重磅更新提前看！

sFKdtsnoEZdx 19小时前 6 0 0 大数据

Apache DolphinScheduler支持Flink吗？

sFKdtsnoEZdx 9天前 13 0 0 大数据

对接HiveMetaStore，拥抱开源大数据

YqbaJkf98QJO 15天前 28 0 0 大数据

指标+AI：迈向智能化，让指标应用更高效

b5JnreLK4zaN 15天前 18 0 0 大数据

手把手教你掌握SeaTunnel k8s运行Zeta引擎本地模式的技巧

NCZdV8CZSb34 16天前 21 0 0 大数据

大数据怎么学？对大数据开发领域及岗位的详细解读，完整理解大数据开发领域技术体系

Ku3edDmxXuM9 9天前 16 0 0 大数据

告别手动调度，海豚调度器 3.1.x 集群部署让你轻松管理多机！

sFKdtsnoEZdx 16天前 19 0 0 大数据

Apache SeaTunnel k8s 集群模式 Zeta 引擎部署指南

NCZdV8CZSb34 9天前 12 0 0 大数据

用DolphinScheduler轻松实现Flume数据采集任务自动化！

sFKdtsnoEZdx 15天前 20 0 0 大数据

玩转云端 | 拥有HBlock这项“存储盘活绝技”，数据中心也能“热辣瘦身”！

1H97ZBKLEqYv 16天前 15 0 0 大数据

金融案例：统一查询方案助力数据治理与分析应用更高效、更安全

b5JnreLK4zaN 13天前 13 0 0 大数据

实战干货｜Spark 在袋鼠云数栈的深度探索与实践

b5JnreLK4zaN 13天前 13 0 0 大数据

SQL窗口分析函数使用详解系列三之偏移量类窗口函数

Ku3edDmxXuM9 13天前 20 0 0 大数据

sFKdtsnoEZdx

作者其他文章更多

Apache DolphinScheduler 4月简报：社区发展与技术革新速递

2024-05-08

Apache DolphinScheduler 3.3.0 版本重磅更新提前看！

2024-05-08

Apache DolphinScheduler支持Flink吗？

2024-04-30

用DolphinScheduler轻松实现Flume数据采集任务自动化！

2024-04-24

告别手动调度，海豚调度器 3.1.x 集群部署让你轻松管理多机！

2024-04-23

WhaleScheduler为银行业全信创环境打造统一调度管理平台解决方案

2024-04-19

这篇 DolphinScheduler on k8s 云原生部署实践，值得所有大数据人看！

2024-04-17

用海豚调度器定时调度从Kafka到HDFS的kettle任务脚本

2024-04-17

裁员了！别错过2024年大数据工程师必备的10项技能

2024-04-16

【安装部署】Apache SeaTunnel 和 Web快速安装详解

2024-04-16

最新推荐更多

GitLab 管理 NuGet 包

2024-05-08

分层架构上的探索实践

2024-05-08

教你用Perl实现Smgp协议

2024-05-08

Sermant在异地多活场景下的实践

2024-05-08

Redis开源社区持续壮大，华为云为Valkey项目注入新的活力

2024-05-08

详解数仓的3A安全能力

2024-05-08

基于Hadoop框架实现的对历年四级单词的词频分析（入门级Hadoop项目）

2024-05-08

大数据面试SQL每日一题系列：最高峰同时在线主播人数。字节，快手等大厂高频面试题

2024-05-08

Apache SeaTunnel 4月回顾：明星贡献者与技术突破

2024-05-08

Apache DolphinScheduler 4月简报：社区发展与技术革新速递

2024-05-08

Apache DolphinScheduler 3.3.0 版本重磅更新提前看！

2024-05-08

mysql安装使用教程

2024-05-08

GreatSQL的sp中添加新的sp_instr引入的bug解析

2024-05-08

mysql基本语法

2024-05-08

SQL Server实战四：查询数据库的数据

2024-05-08

SQL Server实战五：存储过程与触发器

2024-05-08

搭建MongoDB分片集群

2024-05-03

Spark中的闭包引用和广播变量

2024-05-03

Linux上OcenBase单机版部署及基本信息查询

2024-05-02

Linux白屏部署OceanBase集群版

2024-05-02