如何创建 Hive 的 UDF？-摩杜云开发者社区

如何创建 Hive 的 UDF？

bhG8jH8b1hMi 2023年11月02日 28 0

jar udf apache hive jar udf hive apache

UDF（User Defined Function）又称：用户自定义函数。可以像 concat, substr那样的 hive 内置的函数一样直接用于 select 语句，简化复杂查询。

编写 UDF 其实就是写一个类继承 org.apache.hadoop.hive.ql.exec.UDF 该类，在类里面写一个名为 evaluate 的方法，在方法里写相应的业务逻辑，最后打成 jar 包，提交到服务器上，在 hive 的命令行模式下添加这个 jar 包到环境变量，使用里面写好的 evaluate 方法。

编写 UDF 基本步骤

所需 pom 文件如下：

<dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-exec</artifactId>
    <version>2.3.0</version>
</dependency>

继承 org.apache.hadoop.hive.ql.exec.UDF ，重写 evaluate 方法：

package udf;

import org.apache.hadoop.hive.ql.exec.UDF;

/**
 * 用于判断员工薪水级别的函数
 */
public class CheckSalaryGrade extends UDF {

	public String evaluate(String salary) {
		// 判断薪水的级别
		int sal = Integer.parseInt(salary.trim());
		
		if (sal < 1000) {
			return "Grade C";
		} else if (sal < 3000) {
			return "Grade B";
		} else {
			return "Grade A";
		}
	}	
}

打成 jar 包，提交到服务器上：

如何创建 Hive 的 UDF？_jar

执行 hive 命令，启动 hive 的命令行模式
添加 jar 包：

如何创建 Hive 的 UDF？_jar_02

创建临时函数：

create temporary function checksalary as "udf.CheckSalaryGrade";

如何创建 Hive 的 UDF？_apache_03

使用 UDF 执行查询：

select ename, sal, checksalary(sal) from emp;

如何创建 Hive 的 UDF？_udf_04

销毁临时函数：

drop temporary function checksalary;

如何创建 Hive 的 UDF？_apache_05

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： Kafka 简介、集群架构、安装部署、基本命令下一篇： SQLite Write-ahead Logging

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

PDF转化为图片

2OAa79iHhyoO 2023年12月11日 34 0 0 Java pdf pdf List List apache java apache

本地jar安装到maven中（淘宝为例）本地jar无法打包

ttOzQgS7km1w 2023年12月12日 36 0 0 Java java 本地jar安装到maven中本地jar无法打包 jar 本地jar安装到maven中 jar 本地jar无法打包

上传到服务的jar包怎么使用docker运行部署

2OAa79iHhyoO 2023年12月11日 27 0 0 Java Dockerfile java docker jar docker Dockerfile jar

windows系统安装RocketMQ_dashboard

06PagLd5y8mb 2023年12月23日 83 0 0 maven maven rocketmq rocketmq jar 官网 jar 官网

使用Dockerfile Maven Plugin 将Docker镜像Push到AWS ECR (Elastic Container Registry)

wHsz5gF329ep 2023年12月23日 33 0 0 maven maven AWS jar docker 云计算 AWS jar docker 云计算

RSA分段加密方案

tDpTloHDC5uy 2023年12月12日 40 0 0 Java apache ci java ci apache

Jdk升级到1.7后，hutool工具类的很多方法报错解决方案

6HyrTgZXAbVP 2023年12月12日 90 0 0 Java 模块化模块化 jar java jar

看来写echarts的程序员肯定是玩过dota啊！

Nhts4LcX4RvQ 2023年12月12日 31 0 0 html apache apache html

rocketmq: 顺序消息和延迟消息和批量消息

Ta2cNb9VdLMk 2023年12月11日 71 0 0 List List rocketmq rocketmq 开发语言 apache python 开发语言 python apache

记录 | ubuntu降低内核版本的方法

HRODlxSsrDy9 2023年12月19日 57 0 0 降低内核版本降低内核版本 linux ubuntu hive 降低内核 ubuntu linux hive 降低内核

Linux常用命令大全(你值得拥有)

ttOzQgS7km1w 2023年12月12日 30 0 0 hive linux命令 rpm包 hive sed sed rpm包 linux命令

springboot~构建webjars类型的前端jar包

XfpaLQko7Ata 2023年12月12日 32 0 0 maven 静态资源 jar 静态资源 maven jar

SpringBoot指定激活配置文件

YdgLK35ZDPaA 2023年12月11日 23 0 0 maven spring jar 配置文件 maven spring 配置文件 jar

bhG8jH8b1hMi

作者其他文章更多

Storm集成 JDBC

2023-11-13

mapreduce自定义inputformat

2023-11-02

如何创建 Hive 的 UDF？

2023-11-02

Kafka 简介、集群架构、安装部署、基本命令

2023-11-02

Spark编程案例：分析tomcat访问日志求访问量最高的前两个网页

2023-11-02

Spark编程案例：创建自定义分区

2023-11-02

利用 zookeeper 的分布式锁实现秒杀

2023-11-02

使用JDBC操作Hive

2023-11-02

如何编写 Storm 程序？

2023-11-02

Kafka 生产者API，消费者API，拦截器，流计算

2023-11-02

最新推荐更多

终于搞懂了！原来 Vue 3 的 generate 是这样生成 render 函数的

2024-05-20

博客园美化：增加顶部炫彩loading进度条

2024-05-20

lodash已死？radash库方法介绍及源码解析 —— 函数柯里化 + Number篇

2024-05-20

TypeScript入门介绍

2024-05-20

XML Schema 复杂元素类型详解：定义及示例解析

2024-05-20

什么是单点登录？如何实现？

2024-05-20

基于uniapp+vue3自定义增强版table表格组件「兼容H5+小程序+App端」

2024-05-18

解释下什么是事件代理？应用场景？

2024-05-18

Vue项目中有封装过axios吗？主要是封装哪方面的？

2024-05-17

浅谈Vue.js与原生开发

2024-05-17

vue要做权限管理该怎么做？如果控制到按钮级别的权限怎么做？

2024-05-17

Vue模板语法、属性绑定、条件渲染的学习

2024-05-17

vue3编译优化之“静态提升”

2024-05-17

VUE-局部使用

2024-05-17

你是怎么处理vue项目中的错误的？

2024-05-17

实现抖音 “视频无限滑动“效果

2024-05-17

说说webpack proxy工作原理？为什么能解决跨域?

2024-05-17

我为什么还要造一个前端轮子？

2024-05-17

一款摸鱼神器！帮助你利用上班时间背单词！

2024-05-17

next-route

2024-05-17