Python套接字Socket读取http网页web数据
  TEZNKK3IfmPf 2023年11月14日 26 0

Python套接字Socket读取http网页web数据

基于Python的套接字Socket,读取网页web的数据,以读取百度首页的内容为例,程序代码如下:

import socket


def getDataBySocket(url):
    sock = socket.socket()
    ip_port = (url, 80)
    sock.connect(ip_port)

    print("建立连接的远程服务器地址:", sock.getpeername())

    sock.send("GET / HTTP/1.1\r\n".encode("utf-8"))
    sock.send(("Host: "+url+"\r\n").encode("utf-8"))
    sock.send(("\n").encode("utf-8"))

    size = 1024
    while True:
        try:
            data = sock.recv(size)
            count = len(data)
            print("读取数据数量:", count)

            if count == 0:
                print("读数据完毕")
                break

            ret = str(data, encoding="utf-8")
            print(ret)
        except BaseException as exc:
            print("发生异常")
            break


if __name__ == '__main__':
    url = "www.baidu.com"
    getDataBySocket(url)
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读
  TEZNKK3IfmPf   2024年05月31日   31   0   0 python开发语言
  TEZNKK3IfmPf   2024年05月31日   28   0   0 httphttps
  TEZNKK3IfmPf   2024年05月31日   25   0   0 python
  TEZNKK3IfmPf   2024年05月31日   22   0   0 python
  TEZNKK3IfmPf   2024年05月31日   36   0   0 服务器http
TEZNKK3IfmPf