Pig-摩杜云开发者社区

Pig

fztgkkRjHIsV 2023年11月12日 26 0

Pig Hive Hadoop hadoop hive Pig

Pig的简介

Pig Latin，该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

Compare：相比Java的MapReduce API，Pig为大型数据集的处理提供了更高层次的抽象，与MapReduce相比，Pig提供了更丰富的数据结构，一般都是多值和嵌套的数据结构。Pig还提供了一套更强大的数据变换操作，包括在MapReduce中被忽视的连接Join操作。

　Pig包括两部分：

用于描述数据流的语言，称为Pig Latin。
用于执行Pig Latin程序的执行环境，当前有两个环境：单JVM中的本地执行环境和Hadoop集群上的分布式执行环境。

这些变换操作被转换成一系列MapReduce作业，Pig让程序员不需要知道这些转换具体是如何进行的，这样工程师可以将精力集中在数据上，而非执行的细节上。

Pig与Hive的区别

　　对于开发人员，直接使用Java APIs可能是乏味或容易出错的，同时也限制了Java程序员在Hadoop上编程的运用灵活性。于是Hadoop提供了两个解决方案，使得Hadoop编程变得更加容易。

Pig是一种编程语言，它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义（如日志文件）。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。

Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS，并允许使用类似于SQL语法进行数据查询。与Pig一样，Hive的核心功能是可扩展的。

Pig相比Hive相对轻量，它主要的优势是相比于直接使用Hadoop Java APIs可大幅削减代码量。正因为如此，Pig仍然是吸引大量的软件开发人员。

安装与环境配置

pig-0.17.0版本，官网（URL：http://pig.apache.org/releases.html）

wget http://mirrors.hust.edu.cn/apache/pig/pig-0.17.0/pig-0.17.0.tar.gz

tar zxvf pig-0.17.0.tar.gz

环境配置vi ~/.bashrc

#PIG
export PIG_HOME=/usr/local/hadoop/pig-0.17.0
export PATH=$PIG_HOME/bin:$PATH

生效环境配置source ~/.bashrc

Pig_Hive

Pig实现各种SQL效果（链接）

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：【深入理解Java虚拟机】类加载机制下一篇： Spark(三): spark集群环境搭建

分享：

最后一次编辑于 2023年11月12日 0

暂无评论

推荐阅读

hbase的物理存储

YdYt4nHVhvue 2023年12月11日 35 0 0 apache Apache 创建表 hadoop 创建表 hadoop

hbase 全表扫描影响read

SuVXIKXQi51s 2023年11月30日 24 0 0 apache Apache 数据 hadoop 数据 hadoop

hbase多列族

s2pvW3BZ98qa 2023年11月26日 37 0 0 apache Apache 数据 hadoop 数据 hadoop

NIFI系列---【Linux单机安装nifi】

Afe4H47zX3K6 2023年11月30日 30 0 0 上传 apache apache Hadoop hadoop 上传

hbase查询所有rowkey

f0yUGNPhZjqd 2023年11月28日 27 0 0 apache Apache 数据 hadoop 数据 hadoop

hadoop源码解读

4N8wwc5chVdo 2023年12月05日 30 0 0 大数据分布式元数据元数据大数据 Hadoop hadoop 分布式 RPC RPC

hive常用命令记录

xaeiTka4h8LY 2024年05月31日 35 0 0 Hive hadoop

Hive的NVL()函数

qNufQyMQglJ5 2023年12月12日 27 0 0 Hive 默认值 Hive SQL SQL 默认值

mysql Archive如何安装

CqYk2IE3w7Yy 2023年12月11日 26 0 0 Arc Arc MySQL MySQL Hive Hive

hbase创建表压缩方式

CToBlGIFivud 2023年12月02日 31 0 0 apache Apache 创建表 hadoop 创建表 hadoop

hbase put在若存在就累加

eEsPR9IZLNNM 2023年12月02日 34 0 0 apache Apache 数据 hadoop 数据 hadoop

flink hbase 去重

HbPAXgHyHPiB 2023年11月30日 28 0 0 flink apache Apache hadoop flink hadoop

【Java 进阶篇】Java Listener 使用详解

sp7JwLWMrMhH 2023年12月06日 28 0 0 开发语言开发语言 Java 数据仓库 Hive python Java hive python 数据仓库

hbase 连接查询数据

GitKh09GSP8c 2023年12月02日 38 0 0 apache Apache 数据 hadoop 数据 hadoop

hbase版本检查

KObryig2cZt5 2023年12月02日 38 0 0 apache Apache hadoop hadoop 版本信息版本信息

hbase 创建表提示已存在

CToBlGIFivud 2023年11月28日 31 0 0 apache Apache 创建表 hadoop 创建表 hadoop

hbase 已知命名空间写入数据

P4Buhht98JbZ 2023年11月26日 32 0 0 apache Apache 数据 hadoop 数据 hadoop

hbase条件更新

RicJUpRJV7So 2023年11月30日 46 0 0 java apache Apache hadoop Java hadoop

fztgkkRjHIsV

作者其他文章更多

Spring与RMI集成实现远程访问

2023-11-19

Maven构建多模块项目

2023-11-19

如何创建线程？

2023-11-19

Active MQ延时发送消息的Java示例代码段

2023-11-19

任务调度开源框架Quartz动态添加、修改和删除定时任务

2023-11-19

SpringAOP拦截Controller,Service实现日志管理(自定义注解的方式)

2023-11-19

Mybatis中insert中返回主键ID的方法

2023-11-19

进程和线程之由来

2023-11-19

SQL Server触发器创建、删除、修改、查看

2023-11-19

Java中hashCode的作用

2023-11-19

最新推荐更多

考研数据结构之线性表（1.7）——练习题之逆置单链表（C表示）

2024-05-31

考研数据结构之数组（5.3）——使用三元组法表示稀疏矩阵（C表示）

2024-05-31

基于nchan 构建可靠的websocket 服务

2024-05-31

一文带你精通MongDB

2024-05-31

深入理解ClickHouse 的高性能与高可用原理

2024-05-31

redis的数据类型，命令以及应用场景

2024-05-31

java面试知识点整理之扩展系列

2024-05-31

redis简介以及安装

2024-05-31

java面试知识点整理之数据结构算法（待完善）

2024-05-31

【HBase】HBase深度解析：特性、实战应用及核心流程全景

2024-05-31

【HBase】HBase高性能架构：如何保证大规模数据的高可用性

2024-05-31

ClickHouse入门篇:一文带你学习ClickHouse

2024-05-31

【数据结构】时间复杂度和空间复杂度

2024-05-31

387. 字符串中的第一个唯一字符.py-----leetcode刷题（python解题）

2024-05-31

345. 反转字符串中的元音字母-----leetcode刷题（python解题）

2024-05-31

434. 字符串中的单词数

2024-05-31

hive常用命令记录

2024-05-31

Django rest froamwork-HyperlinkedModelSerializer

2024-05-31

mysql-字段值的约束

2024-05-31

【MySQL】表设计与范式设计

2024-05-31