使用一个Selenium爬虫程序，主要是用于采集苏宁类目的-摩杜云开发者社区

使用一个Selenium爬虫程序，主要是用于采集苏宁类目的

fbzvtvmWfKEY 2023年12月12日 14 0

Chrome Selenium System

使用一个Selenium爬虫程序，主要是用于采集苏宁类目的_System

今天再给大家看一个Selenium爬虫程序，主要是用于采集苏宁类目的，之前分享过一个，不过网友发现好像有点问题，不过今天这个我是亲自测试过的，很流畅很稳定，一起来看看吧。

```csharp
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace CrawlerSuning
{
    class Program
    {
        static void Main(string[] args)
        {
            // 设置Chrome浏览器的驱动程序路径
            ChromeDriverService service = ChromeDriverService.CreateDefaultService();
            service.Port = 8000; // 使用www.duoip.cn的代理服务器，端口号为8000
            service.AddArgument("--proxy-server=duoip.cn:8000");
            IWebDriver driver = new ChromeDriver(service);

            // 打开网页
            driver.Navigate().GoToUrl("https://www.suning.com/");

            // 获取网页源代码
            string sourceCode = driver.PageSource;

            // 关闭浏览器
            driver.Quit();

            // 输出网页源代码
            Console.WriteLine(sourceCode);

        }
    }
}
```

首先，我们引入了必要的命名空间，包括OpenQA.Selenium、OpenQA.Selenium.Chrome、System、System.Collections.Generic、System.Linq、System.Text和System.Threading.Tasks。
在Main方法中，我们设置了Chrome浏览器的驱动程序路径。我们使用ChromeDriverService创建一个默认的服务，并设置其端口号为8000，以使用www.duoip.cn的代理服务器。我们还添加了"–proxy-server=http://www.duoip.cn:8000"这个参数，以告诉浏览器使用代理服务器。
然后，我们创建了一个新的ChromeDriver实例，并使用服务来启动浏览器。
接着，我们使用浏览器的Navigate方法打开网页。
然后，我们使用PageSource属性获取网页的源代码。
最后，我们关闭浏览器，并输出网页的源代码。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： sql注入原理与实战（二）数据库原理下一篇：用Kotlin编写一段知乎问题收集的程序

分享：

最后一次编辑于 2023年12月12日 0

暂无评论

推荐阅读

Java集合—HashSet

A4PAi5jvsjgM 2023年11月19日 33 0 0 Google System Java

代码pa取在线视频

pfl0iGEgXbv6 2023年11月02日 65 0 0 Chrome User f5

Java 集合—ArrayList

A4PAi5jvsjgM 2023年11月19日 24 0 0 数组 System Java

HTTP安全响应头配置之Strict-Transport-Security

A4PAi5jvsjgM 2023年11月02日 42 0 0 Chrome web安全缓存

HTTP安全响应头配置之X-Content-Type-Options

A4PAi5jvsjgM 2023年11月02日 33 0 0 Chrome web安全 ecmascript JavaScript

Java笔记—Java接口

A4PAi5jvsjgM 2023年11月19日 20 0 0 抽象类静态方法 System

HTTP安全响应头配置之X-XSS-Protection

A4PAi5jvsjgM 2023年11月02日 44 0 0 Chrome web安全字段服务器

Java学习—对象和类

A4PAi5jvsjgM 2023年11月05日 27 0 0 构造函数实例变量 System

使用一个Selenium爬虫程序，主要是用于采集苏宁类目的

fbzvtvmWfKEY 2023年12月12日 15 0 0 Chrome Selenium System

Chrome配置

732iZwUPltPZ 2023年11月19日 29 0 0 Chrome 安全策略自动跳转

ISIS NSAP地址

4i8hCvzXKbg6 2023年11月14日 24 0 0 IP System 服务访问点

python设置代理ip，动态代理IP有哪些优势？

e1LQ835HYc0i 2023年11月02日 27 0 0 Chrome 网络爬虫 IP 动态代理代理IP

最新整理的网络术语大全，强烈建议收藏！

bFOzmHL3C5uF 2023年11月02日 48 0 0 IP Internet 网络术语 System

Java学习—Java方法

A4PAi5jvsjgM 2023年11月19日 20 0 0 父类子类 System

从原理到实战，详解XXE攻击

YqbaJkf98QJO 2023年11月02日 64 0 0 XML System

fbzvtvmWfKEY

作者其他文章更多

分享一个Perl写的爬虫程序

2023-12-12

分享猿辅导相关的采集程序

2023-12-12

用cheerio库编写一个专门采集携程相关视频的程序

2023-12-12

用Kotlin编写一段知乎问题收集的程序

2023-12-12

使用一个Selenium爬虫程序，主要是用于采集苏宁类目的

2023-12-12

使用 Perl 运行的爬虫程序

2023-12-11

用R语言的rvest包来抓取网页信息

2023-12-11

使用C++中的库来实现网络爬虫功能来用于房源采集

2023-12-11

一个用于从台湾虾皮商品网站抓取内容的Python爬虫程序

2023-12-11

一个使用 luahttp 库来爬取美团商家信息采集的内容简单的爬虫程序

2023-12-11

最新推荐更多

BUUCTF-WEB(4-8)

2024-05-20

常回家看看之堆溢出

2024-05-20

BUUCTF-WEB(9-14)

2024-05-20

“复兴杯”2023第四届大学生网络安全精英赛排位赛 Writeup

2024-05-20

BUUCTF-WEB(15-20)

2024-05-20

MJUCTF—WP

2024-05-18

Weblogic T3反序列化漏洞（CVE-2018-2628）

2024-05-18

文件处理漏洞--文件上传

2024-05-17

应急响应web1

2024-05-17

Stratum挖矿协议&XMR挖矿流量分析

2024-05-17

以数字守护汉字！天翼云TeleDB数据库获GB 18030最高级别认证！

2024-05-17

CSRF(Pikachu靶场练习)

2024-05-17

SQL注入(pikachu)

2024-05-17

流量特征提取工具NFStream

2024-05-17

LoRa与NB-IoT两大低功耗通信技术对比

2024-05-17

记一些CISP-PTE题目解析

2024-05-17

Webshell流量分析之菜刀Chopper&蚁剑AntSword

2024-05-17

RCE(Pikachu)

2024-05-17

不安全的URL跳转(Pikachu)

2024-05-17

不安全的文件上传(Pikachu)

2024-05-17