Python 基于 xlsxwriter 实现百万数据导出 excel-摩杜云开发者社区

Python 基于 xlsxwriter 实现百万数据导出 excel

UyENWESRSURd 2024年03月30日 129 0

Python

追加导出 + 自动切换 sheet

⚠️ excel 中的每个 sheet 最多只能保存 1048576 行数据


# 获取项目的根路径 rootPath
curPath = os.path.abspath(os.path.dirname(__file__))  
rootPath = curPath[:curPath.find(你的项目名称 + "/") + len(  
你的项目名称 + "/")]
# 临时文件
local_file_path = os.path.join(rootPath, "temp.xlsx")  
# 检查并删除现有的临时文件  
if os.path.exists(local_file_path):  
    os.remove(local_file_path)
    
sheet_number = 1  
sheet_name_format = "Sheet_{}"

# 数据量大，导出的数据又包含url的话，会疯狂报警告，大家用不到可以删掉
workbook = xlsxwriter.Workbook(local_file_path, options={'strings_to_urls': False})
table = workbook.add_worksheet(sheet_name_format.format(sheet_number))

# sheet 数据总条数
page_total = 0  
# 要写的行
row_number = 1
# 分批导出，每次 100000 条数据
default_limit = 100000
# 分批导出，第 1 页开始
page_number = 1

while True:
	# 分批获取数据
	data_list = get_data_list(page_number, default_limit) # 你的数据
	if len(data_list) == 0:  
		break  
	# sheet总条数，0代表第一次写入数据
	if page_total == 0:  
		# 标题
		header = [你的标题]
		table.write_row(0, 0, header)
		# todo 因为我把每个 sheet 控制在了 100万条，就切换下一个 sheet 了。 
		# todo 如果各位要是玩极限别忘了这里 page_total + 1
	  
	for item in data_list:  
		table.write_row(row_number, 0, list(item.values()))  
		row_number = row_number + 1 
	  
	page_total = page_total + len(data_list)  
	# 自动切换sheet
	if page_total >= 1000000:  
		# 换下一个sheet   
		sheet_number = sheet_number + 1  
		table = workbook.add_worksheet(sheet_name_format.format(sheet_number))  
		# 初始化
		page_total = 0  
		row_number = 1
	page_number = page_number + 1
# 关闭  
workbook.close()

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：【GUI软件】小红书按关键词采集笔记详情，支持多个关键词，含笔记正文、转评赞藏等下一篇：开源相机管理库Aravis学习（一）——安装

分享：

最后一次编辑于 2024年03月30日 0

暂无评论

推荐阅读

js逆向) 某音cookie中的__ac_signature

ILxlT0HtFgJu 2024年05月17日 68 0 0 Python

详解Python 中可视化数据分析工作流程

YqbaJkf98QJO 2024年05月17日 64 0 0 Python

快递查询 API 接口：让物流信息一目了然

Ugrw6b9GgRUv 2024年05月17日 76 0 0 Python

深入理解Django：中间件与信号处理的艺术

YpHJ7ITmccOD 2024年05月17日 55 0 0 Python

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

xCoOpmCw66sN 2024年05月17日 52 0 0 Python

Django性能之道：缓存应用与优化实战

YpHJ7ITmccOD 2024年05月17日 60 0 0 Python

Django 静态文件管理与部署指南

YpHJ7ITmccOD 2024年05月17日 61 0 0 Python

一篇文章掌握Python中多种表达式的使用：算术表达式、字符串表达式、列表推导式、字典推导式、_集合推导式、_生成器表达式、逻辑表达式、函数调用表达式

FDs7GVd6cZcT 2024年05月17日 69 0 0 Python

DrissionPage自动化框架学习

2Fnpj8K6xSCR 2024年05月17日 101 0 0 Python

Python字符串方法：字符串查找、替换、分割

FDs7GVd6cZcT 2024年05月17日 65 0 0 Python

高精度数学计算的瑞士军刀，mpmath库详解与应用示例

oaRbYQvpZaaT 2024年05月17日 53 0 0 Python

python中小数据池和编码

xKQN3Agd2ZMK 2024年05月17日 70 0 0 Python

python中7种方法实现字符串的拼接

49iChyeZd8DE 2024年05月17日 58 0 0 Python

Python中私有变量和私有方法

oELtfgAoDdFJ 2024年05月17日 52 0 0 Python

使用python中kivy库生成安卓APP

33Mqsls7cINW 2024年05月17日 58 0 0 Python

探索Django：从项目创建到图片上传的全方位指南

sSh3rBaiME5f 2024年05月17日 34 0 0 Python

运算符与表达式

fwjWaDlWXE4h 2024年05月17日 38 0 0 Python

Django国际化与本地化指南

YpHJ7ITmccOD 2024年05月17日 39 0 0 Python

Django测试与持续集成：从入门到精通

YpHJ7ITmccOD 2024年05月18日 69 0 0 Python

Python 潮流周刊#51：用 Python 绘制美观的图表

xCoOpmCw66sN 2024年05月18日 77 0 0 Python

UyENWESRSURd

作者其他文章更多

Python 基于 xlsxwriter 实现百万数据导出 excel

2024-03-30

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17