pyspark数据计算-摩杜云开发者社区

pyspark数据计算

ShfiGzHolqgo 2023年11月15日 30 0

导包导包 d3 spark d3 spark

# 导包
from pyspark import SparkConf, SparkContext

# 获取sparkconf对象
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")

# 基于sparkconf获取sparkcontext对象(sparkcontext对象是pyspark一切功能的入口)
sc = SparkContext(conf=conf)

rdd1 = sc.parallelize([1, 2, 3, 4, 5, 6])
rdd2 = sc.parallelize((1, 2, 3, 4, 5, 6))
rdd3 = sc.parallelize({1, 2, 3, 4, 5, 6})
rdd4 = sc.parallelize("asdfghjkl")
rdd5 = sc.parallelize({"key1": 666, "key2": 999})
rdd6 = sc.textFile("D:/title.txt")  # 通过文件路径进行读取

print(rdd1.collect())
print(rdd2.collect())
print(rdd3.collect())
print(rdd4.collect())  # 字符串会被拆成一个一个的字符
print(rdd5.collect())  # 字典仅剩下key的值
print(rdd6.collect())
#停止Pyspark程序
sc.stop()

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： Android文件浏览器的开发下一篇：使用MySQL数据库实现Word文档上传功能（mysql 上传word）

分享：

最后一次编辑于 2023年11月15日 0

暂无评论

推荐阅读

C++ 从大数据SPARK框架的DAG引擎，再论有向无环图（DAG）的拓扑排序

8JXh2nINxLkX 2023年12月12日 43 0 0 搜索子节点 SPARK 搜索 spark 子节点

vue2实现文件分片上传/续传

9m65el8SCpbP 2023年12月11日 31 0 0 上传 ios ios spark 上传 spark

采集拼多多商品详情api接口

bsVlJRLD3XWp 2023年12月15日 19 0 0 3c d3 python 2d d3 2d 3c Python

python 如何自动导包

nWgWMQU6mNNG 2023年12月15日 26 0 0 导包导包 python Python

python bard3d导出图片

6x82OSIkB82a 2023年12月23日 78 0 0 d3 python 3d d3 3d Python

vue实现大文件分片上传 vue-simple-uploader

9m65el8SCpbP 2023年12月12日 37 0 0 上传 ico spark 上传 ico spark

Java 中的Lock锁

anLrwkgbyYZS 2023年12月30日 23 0 0 System d3 java System Java d3

基于新技术搭建企业级大数据项目，成就全能型大数据的研发经验总结

xGNSWopbyTE4 2023年12月08日 23 0 0 数据项新技术数据项新技术 spark spark

命令行相对路径导包 python

F1Wfwe7nWfUI 2023年12月12日 28 0 0 导包导包相对路径命令行命令行相对路径

元数据管理在数据仓库的实践应用

jnyjONGydcL2 2023年12月22日 42 0 0 分布式数据仓库大数据大数据数据仓库元数据 spark spark 分布式元数据

大数据平台实践之CDH6.2.1+spark3.3.0+kyuubi-1.6.0

8bxyRFfzXN55 2023年12月13日 107 0 0 cloudera 大数据大数据 SQL spark spark SQL cloudera

java spark hdfs

KgGOnwQ9X4OR 2023年12月22日 41 0 0 Java hdfs Java spark hdfs spark

java 创建hudi表

EtOZhtLTyvOz 2023年12月12日 79 0 0 存储方式 apache Apache spark spark 存储方式

ShfiGzHolqgo

作者其他文章更多

Collections工具类的使用

2023-12-22

以文件后缀名查找文件

2023-12-22

求回文四位十进制数的算法

2023-12-22

集合遍历方式

2023-12-19

选择排序

2023-12-15

查找数组索引

2023-12-12

旋转数组算法

2023-12-09

贪心算法

2023-12-08

算法1

2023-12-07

java-io

2023-12-06

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17