Kettle(Pentaho Data Integration)8.2的简单使用
  Y8XIq1u6ceQW 2023年11月19日 22 0

Kettle(Pentaho Data Integration)8.2的简单使用

Kettle(Pentaho Data Integration)是一个开源的ETL工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。是以Java开发,支持跨平台运行。

这里使用它来帮助我们导入将Excel中的数据导入到mysql中

这里我们通过实践来验证下:

这里有一张数据表t1,结构如下:

CREATE TABLE `t1`  (
  `id` int(11) NOT NULL,
  `name` varchar(255)  NULL
)

有一个Excel文件t1.xls数据如下:

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle

这里实践将t1.xls的工作表sheet1的数据导入到mysql里表t1中

打开Kettle

将下载后的Kettle软件解压缩后,找到目录中的Spoon.bat批处理,双击即动打开软件

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_02

在"帮助->关于"下我们可以看到当前软件版本号

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_03

这里由于使用了mysql,需要将mysql的驱动下载,放入到lib目录下

Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_04

mysql JDBC驱动下载地址https://mvnrepository.com/artifact/mysql/mysql-connector-java

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_05

这里选择了5.1.49版本的来测试

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_06

在使用Kettle需要先安装jdk并配置好环境变量

开始使用

新建转换方案

文件->新建->转换 建立转换方案

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_07

在”核心对象->输入“拖一个”Excel输入“ 到当前建立的“转换1”方案工作台中

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_08

在“输出”里找到"表输出"拖一个到工作台中

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_09

”Excel输入“配置

双击工作台中的”Excel输入“弹出窗口对其进行配置

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_10

在“文件->文件或目录“,浏览选择Excel文件,选择完毕,记得点击”增加“,将文件添加到下方”选中的文件“列表中

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_11

切换到"!工作表"页面,点击”获取工作表名称....“ 弹出窗口,选择需要读取的工作表Sheet1

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_12

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_13

切换到"!字段"页面,点击”获取来自头部数据的字段...“,取得需要读取的字段,如果发现读取到的Excel字段类型有误,可以修正

Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_14

Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_15

通过"预览记录"我们可以测试看是否能读取到数据

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_16

“表输出”配置

双击工作台中的”表输出“弹出窗口对其进行配置,这里看到数据库连接是空的,可以点击”新建“

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_17

输入数据库连接参数,输入完毕可点击”测试“验证是否能成功连接数据库

Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_18

选择”目标表“

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_19

建立连接

选中”Excell输入“,出来下方的操作工具条,点击第四个Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_20,后移到“表输出”图标上,创建与”表输出“的连接


Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_21


Kettle(Pentaho Data Integration)8.2的简单使用_数据处理_22

 操作过程

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_23

建立连接后,双出”表输出“,进行”数据库字段“配置

选中”指定数据库字段“,由于这里数据库表字段与excel的表头一致,点击”获取字段“,在”插入的字段“里即我们映射完成了,

如果数据库表字段与excel的表头一致,需要自动做好映射

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_24

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_25

查看映射情况

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_26

运行

配置完毕,点击方案左上角的”Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_27“运行按扭,运行这个转换

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_28

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_29

“启动”运行后我们下方出来的日志,看到运行提示"转换完成",没有报错

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_30

在”步骤度量“里成功看到”输入“了10

Kettle(Pentaho Data Integration)8.2的简单使用_ETL_31

通过数据库工具打开表看看结果

Kettle(Pentaho Data Integration)8.2的简单使用_Kettle_32

至此成功完成Kettle的简单使用。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月19日 0

暂无评论

推荐阅读
Y8XIq1u6ceQW
最新推荐 更多