zepplin 配置hive on spark-摩杜云开发者社区

zepplin 配置hive on spark

e7PL9TmFyi0o 2023年11月02日 52 0

hive spark hive spark

Zeppelin配置Hive on Spark的流程

下面是配置"Zepplin配置Hive on Spark"的步骤表格：

步骤	操作
1.	下载和安装Apache Zeppelin
2.	配置Spark和Hive的环境变量
3.	启动Zeppelin服务
4.	创建一个新的Zeppelin笔记本
5.	在笔记本中配置Spark和Hive的设置
6.	执行Hive查询

步骤1：下载和安装Apache Zeppelin

访问Apache Zeppelin官方网站（
解压下载的文件到一个合适的目录。
进入解压后的Zeppelin目录，并执行bin目录下的zeppelin.sh脚本来启动Zeppelin。

步骤2：配置Spark和Hive的环境变量

打开终端窗口，并使用文本编辑器打开~/.bashrc文件。
在文件的末尾添加以下两行代码：

export SPARK_HOME=/path/to/your/spark/installation
export HIVE_HOME=/path/to/your/hive/installation

确保将/path/to/your/spark/installation和/path/to/your/hive/installation替换为实际的Spark和Hive安装路径。 3. 保存并关闭文件。 4. 在终端窗口中执行以下命令以使环境变量生效：

source ~/.bashrc

步骤3：启动Zeppelin服务

打开终端窗口，并进入Zeppelin目录。
执行以下命令以启动Zeppelin服务：

bin/zeppelin-daemon.sh start

步骤4：创建一个新的Zeppelin笔记本

打开Web浏览器，并访问Zeppelin的URL（通常为http://localhost:8080）。
在Zeppelin界面上选择"Create new note"（创建新的笔记本）。
输入笔记本名称，并点击"Create note"（创建笔记）。

步骤5：在笔记本中配置Spark和Hive的设置

在新创建的笔记本中，点击页面右上角的"Interpreter Binding"（解释器绑定）按钮。
在弹出的对话框中，选择"spark"解释器，并点击"Create"（创建）按钮。
在"spark"解释器的设置页面中，找到"spark.master"选项，并将其设置为"yarn-client"。
找到"spark.app.name"选项，并将其设置为任意名称。
找到"spark.sql.hive.verifyPartitionPath"选项，并将其设置为"false"。
点击页面底部的"Save"（保存）按钮。

步骤6：执行Hive查询

在新创建的笔记本中，输入Hive查询语句。
在查询前，使用以下代码来启用Hive支持：

%spark
sqlContext.setConf("spark.sql.hive.convertMetastoreParquet", "false")

该代码将确保Spark使用Hive的元数据和表定义。 3. 执行Hive查询并查看结果。

请注意，以上代码示例中的/path/to/your/spark/installation和/path/to/your/hive/installation应替换为您实际的Spark和Hive安装路径。

希望这篇文章能帮助你成功配置"Zepplin配置Hive on Spark"！

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： zeppelin 连接hive Required field 'serverProtocolVersion' is unset! Struct:TO 下一篇：编译hive3.10

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

hive reflect取数组中最大的

sElzGQA8fX6P 2023年12月23日 84 0 0 hive 字段 hive 数组字段数组

大数据篇（二） Spark运行环境

KRe60ogUm4le 2024年05月31日 37 0 0 大数据 Kubernetes spark

hive查询多个表的数据条数

uBACcm3oHgm7 2023年12月23日 65 0 0 hive 加载数据加载数据数据数据 hive

截止今天学习大数据技术的笔记

KRe60ogUm4le 2024年04月26日 53 0 0 hive Hadoop kafka

hive select 字段别名

sElzGQA8fX6P 2023年12月23日 129 0 0 hive 示例代码字段示例代码 hive 字段

hive on spark 怎么配置

529IrGbiySY6 2023年12月23日 75 0 0 hive 执行引擎 spark hive spark 执行引擎

hive sql转置函数

AyUM17vPJ7Nd 2023年12月23日 47 0 0 hive 转置数据数据 hive 转置

大数据篇（五） Spark SQL简介

KRe60ogUm4le 2024年05月31日 33 0 0 大数据 java spark

hive查询锁表

DnO2EFaOOFqd 2023年12月23日 46 0 0 hive 锁表 sql sql 锁表 hive

【大数据篇】Spark运行时架构详解

KRe60ogUm4le 2024年05月31日 33 0 0 大数据架构 spark

hive sql 多表 join

7YynnRRFCsyP 2023年12月23日 45 0 0 hive sql sql hive 多表多表

hive的rename语法

eiYoUGgFNvQA 2023年12月23日 48 0 0 hive 重命名 hive 数据库重命名数据库

e7PL9TmFyi0o

作者其他文章更多

情感分析神经网络

2023-12-23

axios header传参

2023-12-23

android gradle 获取当前时间

2023-12-23

vue3 axios 跨域接收后台数据

2023-12-23

axios xhrfields progress

2023-12-23

ios滑动穿透怎么解决的

2023-12-23

iOS 判断app在后台

2023-12-23

mysql 双判断

2023-12-23

java怎么在静态方法使用非静态变量

2023-12-22

PythonAutogui linux

2023-12-22

最新推荐更多

【Leetcode】排序+双指针-16

2024-05-31

【.net 深呼吸】设置序列化中的最大数据量

2024-05-31

【Leetcode】python哈希表

2024-05-31

【Leetcode】链表-21，23

2024-05-31

vue再读20-表格案例--处理无数据的时候的渲染

2024-05-31

你被请来给一个要举办高尔夫比赛的树林砍树，树林由一个 m x n 的矩阵表示，在这个矩阵中： 0 表示障碍，无法触碰 1 表示地面，可以行走比 1 大的数表示有树的单元格

2024-05-31

假设有一个源源吐出不同球的机器，只有装下10个球的袋子，每一个吐出的球，要么放入袋子，要么永远扔掉。

2024-05-31

比jsonpath 更方便的json 数据查询JMESPath 使用

2024-05-31

已知一棵二叉树上所有的值都不一样，给定这棵二叉树的头节点head，给定一个整型数组arr，arr里放着不同的值，每个值一定在树上返回数组里所有值的最低公共祖先。

2024-05-31

给定一个数组arr，给定一个值v。求子数组平均值小于等于v的最长子数组长度。

2024-05-31

线性回归api深度介绍

2024-05-31

给定一个单链表的头节点head，请判断该链表是否为回文结构。

2024-05-31

力扣546，移除盒子。给出一些不同颜色的盒子，盒子的颜色由数字表示，即不同的数字表示不同的颜色。你将经过若干轮操作去去掉盒子，直到所有的盒子都去掉为止。

2024-05-31

给定一个数组arr，长度为N ＞ 1，从中间切一刀，保证左部分和右部分都有数字，一共有N-1种切法，如此多的切法中，每一种都有:绝对值(左部分最大值 – 右部分最大值)。

2024-05-31

【算法】哨兵思想 -- 待进一步总结

2024-05-31

给定两个可能有环也可能无环的单链表，头节点head1和head2。请实现一个函数，如果两个链表相交，请返回相交的第一个节点。如果不相交，返回null。

2024-05-31

数据统计之日分类商品访问量

2024-05-31

稀疏数组搜索

2024-05-31

魔术索引（返回索引值最小的一个）

2024-05-31

求表达式 f(n)结果末尾0的个数

2024-05-31