Java 读取压缩文件
  S5peUojkKKej 2023年11月25日 14 0

1、jar vs zip:

jar 文件和 zip 文件都是归档文件,并且都经过压缩。事实上,jar 文件使用与 zip 文件相同的存档和压缩技术,所以 jar 文件实际上是一种特定类型的 zip 文件。(JAR 文件本质上是一个包含可选 META-INF 目录的 zip 文件。)这一切都意味着:

  • 您可以使用与打开 zip 文件相同的工具打开 jar 文件
  • jar 文件是 zip 文件的子集,因此如果 zip 文件遵循 jar 规范,则它可以用作 jar 文件

2、读取zip压缩文件:

1)方法一:通过ZipFile从文件中读取

private static void readZipFile() {    try (ZipFile zipFile = new ZipFile("/data/testzip.zip");) {	    Enumeration<? extends ZipEntry> entries = zipFile.entries();         while(entries.hasMoreElements()){             ZipEntry entry = entries.nextElement();		 System.out.println("fileName:"+entry.getName()); //文件名		 InputStream stream = zipFile.getInputStream(entry); //读取文件内容		 read(stream);         }    } catch(Exception e) {}	//zipFile.close();}private static void read(InputStream in) {     try (InputStreamReader reader = new InputStreamReader(in, "UTF-8");         BufferedReader br = new BufferedReader(reader);) {         String con = null;	      while ((con = br.readLine()) != null) {	          System.out.println(con);	      }    } catch (Exception e) {}}

2)方法二:通过ZipInputStream从流中读取

private static InputStream getInputStream() throws FileNotFoundException {	File file = new File("/data/testzip.zip");	InputStream in = new FileInputStream(file);	return in;}//错误方法private static void readZipInputStream() throws FileNotFoundException, IOException {	InputStream zippedIn = getInputStream(); // zip压缩文件流	ZipInputStream zis = new ZipInputStream(zippedIn);	read(zis); //读取的是空}//正确方法private static void readZipInputStream2() throws FileNotFoundException, IOException {	InputStream zipFileInput = getInputStream(); // zip压缩文件流	ZipInputStream zis = new ZipInputStream(zipFileInput);	ZipEntry entry = null;	try {		while ((entry = zis.getNextEntry()) != null) {			try {				final String name = entry.getName();				System.out.println("fileName:"+name);				String content = IOUtils.toString(zis);				System.out.println(content);			} finally {				zis.closeEntry(); // 关闭zipEntry			}		}	} finally {		zis.close(); //关闭zipInputStream	}}

注意:在从流中读取数据是使用了IOUtils,原因是自定义read方法读取完后会把传递进来的inputStream给关闭了。如果zip包中有多个文件,那么在读取第二个entry文件时就会报错。zipInputStream只能在最后关闭。而IOUtils使用了copy的方式,不会关闭传入的流。

3、jar中文件/目录便利,以及读取:

1)方法一:使用JarFile读取Jar文件

和ZipFile类似,使用'getEntry(String name)'或'entires'获得ZipEntry或JarEntry(它们可以看作同一东西),接下来使用" JarFile.getInputStream(ZipEntry ze)"将其用于获取InputStream

static void test1() {    String path = "/Users/liuxiao/maven-rep/org/apache/thrift/libthrift/0.9.0/libthrift-0.9.0.jar";    try (JarFile jarFile = new JarFile(new File(path));) {        Enumeration<JarEntry> entries = jarFile.entries();        while (entries.hasMoreElements()) {            JarEntry entry = entries.nextElement();            String entryName = entry.getName();            if (!entry.isDirectory() && entryName.equals("org/apache/thrift/TBase.java")) {                System.out.println(entryName);//  org/apache/thrift/EncodingUtils.class                read(jarFile.getInputStream(entry));            }        }    } catch (Exception e) {    }    //使用stream apitry (Stream<JarEntry> stream = new JarFile(new File(path)).stream();) {        stream            .filter(entry -> !entry.isDirectory() && entry.getName().endsWith(".class"))            .forEach(entry -> System.out.println(entry.getName()));    } catch(Exception e) {    }}

2)方法二:通过JarInputStream从流中读取(和ZipInputStream类似)

private static InputStream getJarFileInputStream() throws FileNotFoundException {	File file = new File("/data/mvn_repo/commons-lang/commons-lang/2.1/commons-lang-2.1.jar");	InputStream in = new FileInputStream(file);	return in;}private static void readJarInputStream2() throws FileNotFoundException, IOException {	InputStream zipFileInput = getJarFileInputStream(); // jar包流	JarInputStream jis = new JarInputStream(zipFileInput);	JarEntry entry = null;	try {		while ((entry = jis.getNextJarEntry()) != null) {			try {				if (entry.isDirectory()) {					continue;				}				final String name = entry.getName();				System.out.println("fileName:"+name);				String content = IOUtils.toString(jis);				System.out.println(content);			} finally {				jis.closeEntry(); // 关闭zipEntry			}		}	} finally {		jis.close(); //关闭zipInputStream	}}

3)方法三:通过JarURLConnection来打开一个jar中的资源,然后通过流来读取 

static void test2() throws Exception {	String filePath = "/Users/liuxiao/maven-rep/org/apache/thrift/libthrift/0.9.0/libthrift-0.9.0.jar";	String name = "org/apache/thrift/TBase.java";		URL url = new URL("jar:file:" + filePath + "!/" + name);	JarURLConnection jarConnection = (JarURLConnection) url.openConnection();	try (InputStream in = jarConnection.getInputStream();			BufferedReader br = new BufferedReader(new InputStreamReader(in, "UTF-8"));) {		String con = null;		while ((con = br.readLine()) != null) {			System.out.println(con);		}	} catch (Exception e) {		e.printStackTrace();	}}

总结:

由于zip和jar结构时一致的,所以ZipFile和JarFile,ZipInputStream和JarInputStream的使用方法是一样的。需要说明的一点是,由于zip包的这种特殊结构,默认ZipInputStream中是不包含数据的,只有在调用getNextEntry方法后,才回把对应的entry(zip包中的一个文件)内容写入到ZipInputStream中。上面的一个错误写法中,可以看到直接从ZipInputStream中读不到数据,只有调用getNextEntry后才可以。

www.mianshi.online www.i9code.cn

本文由博客一文多发平台 OpenWrite 发布!

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月25日 0

暂无评论

推荐阅读
  2Vtxr3XfwhHq   2024年05月17日   51   0   0 Java
  Tnh5bgG19sRf   2024年05月20日   104   0   0 Java
  8s1LUHPryisj   2024年05月17日   46   0   0 Java
  aRSRdgycpgWt   2024年05月17日   47   0   0 Java