Jsoup抓取Https出现unable to find valid certification path to requested target-摩杜云开发者社区

Jsoup抓取Https出现unable to find valid certification path to requested target

0ZwfR6X6Muxs 2023年11月18日 36 0

抓取网页 HTML 抓取网页 html

解决办法如下：

方法一：

增加前置初始化操作

static public void init() {
        try {
            SSLContext context = SSLContext.getInstance("TLS");
            context.init(null, new X509TrustManager[]{new X509TrustManager() {
                public void checkClientTrusted(X509Certificate[] chain, String authType) throws CertificateException {
                }

                public void checkServerTrusted(X509Certificate[] chain, String authType) throws CertificateException {
                }

                public X509Certificate[] getAcceptedIssuers() {
                    return new X509Certificate[0];
                }
            }}, new SecureRandom());
            HttpsURLConnection.setDefaultSSLSocketFactory(context.getSocketFactory());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

在进行网站抓取

public static void main(String[] args) throws Exception {
        String url = "https://info.hebei.gov.cn/hbszfxxgk/6898876/6898925/6899014/6906934/748af770/index1.html";
        init();
        String UA = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36";
        Document countDocument = Jsoup.connect(url).timeout(30000).userAgent(UA).get();
        System.out.println(countDocument);
    }

方法二：使用httpUtil请求抓取网页结果

//首先使用工具类获取一下网页结构
 String strHtml = HttpUtil.get(url, 30000);
 //在用JSOUP解析HTML结构
 Document countDocument = Jsoup.parse(strHtml);

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： springboot项目搭建过程中遇到的问题下一篇：【Https异常】This request has been blocked; the content must be served over HTTPS解决方法

分享：

最后一次编辑于 2023年11月18日 0

暂无评论

推荐阅读

# vue 使用 html2canvas 截取图片保存

Cp0PPONmvoyE 2023年12月26日 38 0 0 跨域 HTML 跨域 html

jQuery 调用 Ajax 实现查询的局部更新（jsp + servlet + jQuery + Ajax）

anLrwkgbyYZS 2023年12月30日 41 0 0 AJAX ajax java Java HTML html

java 特殊字符串转

wURKzOHw9Irf 2023年12月24日 29 0 0 HTML ico ico html

Java api html转word

0noBQ6yUPIt9 2023年12月22日 123 0 0 Word apache Apache HTML Word html

爬取博客信息的简单爬虫

anLrwkgbyYZS 2023年12月30日 32 0 0 调用函数调用函数个人主页 HTML html 个人主页

css 禁止用户选择字体

8l4CZpTOKa7P 2023年12月26日 40 0 0 html html

java返回前端换行标签

8ThFdkrjNoZ5 2023年12月24日 44 0 0 字符串 Java HTML Java 字符串 html

csi 学习文档

dwHry2iKGG0I 2023年12月26日 31 0 0 github github html html

py之网详情链接

3TaxIqXGeDtF 2023年12月26日 32 0 0 windows XML windows html xml html

java渲染html数据并转换成字符串

tqf4faUYHHCA 2023年12月22日 79 0 0 Java 数据 HTML Java html 数据

py图网址获取

3TaxIqXGeDtF 2023年12月26日 29 0 0 windows XML windows html xml html

python Django的html页面中如何引入其他html

yEoORObu1VfG 2023年12月23日 25 0 0 HTML 加载 html 加载

Java 爬小程序path的内容

MSmqJL966ONP 2023年12月22日 76 0 0 Java HTML 代码示例 Java html 代码示例

前端歌谣-第陆拾玖课-MongoDB之node操作实现数据库增删改查

iHT0TLzU167T 2023年12月31日 34 0 0 用户名前端 javascript HTML JSON javascript JSON html 前端用户名

python html排版工具

5iQTA4J0tGQG 2023年12月23日 86 0 0 python HTML html Python

0ZwfR6X6Muxs

作者其他文章更多

关于List添加对象重复问题/list内参数被修改引用地址

2023-11-26

NACOSwindows不能双击启动问题

2023-11-26

JavaJDK1.8之stream流操作入门及常用方法

2023-11-26

Failed to execute goal org.apache.maven.plugins:maven-war-plugin:2.2:war (default-war) on project zh

2023-11-26

解决启动nginx，iis，sqlserver时报80端口被占用的问题

2023-11-26

SpringBoot+WebSocket群聊功能完整代码实例

2023-11-26

json如何获取map

2023-11-26

aspose.word.pdf操作实例

2023-11-26

ora-01653无法通过1024在表空间(BGXT)中扩展

2023-11-26

Windows Minio 安装和使用

2023-11-26

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17