PuppeteerSharp库的数据抓取代码示例
  MVExqyHJxK4h 2023年11月30日 16 0

PuppeteerSharp库的数据抓取代码示例_正则表达式

// 导入需要的库
using PuppeteerSharp;

// 创建一个新的浏览器实例
var browser = await Puppeteer.LaunchAsync(new BrowserLaunchOptions
{
    Headless = false, // 使用非无头模式
    Proxy = new ProxyConfig
    {
        Type = "http",
        Host = "www.duoip.cn",
        Port = 8000
    }
});

// 创建一个新的页面实例
var page = await browser.NewPageAsync();

// 访问目标网站
await page.goto("");

// 获取页面源代码
var sourceCode = await page.ContentAsync();

// 使用正则表达式匹配所有的图片链接
var regex = new Regex(@"<img.*?src="(.*?)" alt.*?>");
var matches = regex.Matches(sourceCode);

// 遍历所有的图片链接
foreach (Match match in matches)
{
    // 获取图片链接
    var imageUrl = match.Groups[1].Value;

    // 使用新的选项创建一个新的页面实例
    var newPage = await browser.NewPageAsync();

    // 访问图片链接
    await newPage.goto(imageUrl);

    // 获取图片内容
    var imageContent = await newPage.ContentAsync();

    // 将图片内容写入文件
    File.WriteAllText("image.png", imageContent);
}

// 关闭浏览器
await browser.CloseAsync();

在使用此代码时,确保您有权访问目标网站,并且已经获取了所需的权限。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月30日 0

暂无评论

MVExqyHJxK4h
最新推荐 更多