BOM及CSV/Excel乱码及从代码上根源解决问题-摩杜云开发者社区

BOM及CSV/Excel乱码及从代码上根源解决问题

TEZNKK3IfmPf 20天前 22 0

乱码

在使用Java代码生成csv文件时，使用Notepad++/Sublime Text之类的文本编辑器打开是没有问题的，但是可视化效果不好，故而考虑使用Excel打开，可是却出现乱码问题。

概述

BOM，Byte Order Mark，字节顺序标记，一种文件头部协议，存储在文件头部，用于标识文件编码。

如果使用UTF-8编码生成CSV文件，会发现CSV文件虽然可以用记事本打开，但是用Excel打开就会出现乱码。

原理：Excel在读取csv时是通过读取文件头上的bom来识别编码的，如果文件头无bom信息，则默认按照unicode编码读取。（bom是微软定义的一种文件头部协定，存储在文件头部，存储内容就是标识文件编码的信息。）而生成csv的平台不一定遵循微软的bom协议，导致如果输出非unicode编码的csv文件（如utf-8），并且没有生成bom信息的话，Excel自动按照unicode编码读取，就会出现乱码问题。解决：只需将非unicode编码的csv文件，用文本编辑器（Notepad++）打开并转换为带bom的编码形式（具体编码方式随意），问题解决。

问题

每次都是手动去修改并转换编码，那不是很傻么？既然CSV是程序生成的，那怎么用程序解决这个乱码问题？

Java

BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(Files.newOutputStream(tempFile.toPath(),
                StandardOpenOption.APPEND), StandardCharsets.UTF_8));
// fix
bw.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}));
bw.write();
bw.newLine();
bw.flush();
bw.close();

Python

import csv

# utf-8-sig
csv_file = open("writer.csv", "w+", newline = '', encoding = 'utf-8-sig')
writer = csv.writer(csv_file )
writer.writerow(text)

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：架构师学习笔记15-基于中间件的开发下一篇： VBA操作单元格

分享：

最后一次编辑于 20天前 0

暂无评论

推荐阅读

解决CentOS7 Confluence6 PPT中文乱码问题

TEZNKK3IfmPf 2023年11月14日 49 0 0 CentOS7 乱码

centOS 中文乱码解决方案

TEZNKK3IfmPf 2023年11月12日 43 0 0 centos 乱码

C#之四十二 C# 读写文本文件乱码解决方案

TEZNKK3IfmPf 2023年11月15日 87 0 0 解决方案乱码

控制台连接数据库乱码问题

TEZNKK3IfmPf 2023年11月14日 25 0 0 控制台数据乱码

BOM及CSV/Excel乱码及从代码上根源解决问题

TEZNKK3IfmPf 20天前 23 0 0 乱码

JSP之 MySQL 插入数据时，中文乱码问题的解决

TEZNKK3IfmPf 2023年11月15日 31 0 0 数据库 JSp 数据 mysql 乱码

Windows7安装多语言包后部分软件显示乱码问题的解决方法

TEZNKK3IfmPf 2023年11月14日 29 0 0 windows 乱码

Hibernate持久化数据中文乱码

TEZNKK3IfmPf 2023年11月14日 25 0 0 数据库乱码 hibernate

zabbix：乱码问题

TEZNKK3IfmPf 2023年11月14日 23 0 0 zabbix 乱码

TEZNKK3IfmPf

作者其他文章更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

最新推荐更多

使用代码获得所有适用于创建的transaction type

2024-06-14

C/C++ realloc()函数解析

2024-06-14

生成一个文件保存在指定的文件夹中思路 python

2024-06-14

Windows 10封装中出现“无法验证你的Windows安装”错误解决方法

2024-06-14

109-修改返回体的内容RestControllerAdvice

2024-06-14

C/C++ 判断进程是否存在

2024-06-14

使用面向对象重构之-使用接口完成行为抽象

2024-06-14

使用面向对象重构之-把抽象控制在一处：提高内聚性

2024-06-14

重操旧业障碍多

2024-06-14

关于关闭自动装配

2024-06-14

使用面向对象重构之-从过程式设计到面向对象

2024-06-14

nodejs部署神器pm2的使用体验

2024-06-14

java虚拟机启动过程解析

2024-06-14

mysql-忘记密码时重置操作

2024-06-14

Callable和runnable的区别

2024-06-14

python的粘包和分包

2024-06-14

tftp文件服务（udp端口：69）

2024-06-14

C语言反汇编 - 流程控制与循环结构

2024-06-14

python-列表包字典-根据字典的某一个键的值来进行排序

2024-06-14

使用面向对象重构之-使用接口抽象完成不同维度的扩展

2024-06-14