socket编程中超好用的makefile方法

def makefile(self, mode="r", buffering=None, *, encoding=None, errors=None, newline=None)

makefile方法返回一个与socket套接字相关联的文件对象,在这之后,你就可以像操作一个文件一样去操作socket连接,它的参数解释与open函数的参数解释相同,唯一需要注意的地方是mode只支持r, w, b这三种模式。对于套接字,要求其必须是阻塞的,如果发生了超时, 文件对象的内部缓冲区可能会以不一致的状态结束 。关闭文件对象,不会关闭套接字,仅仅是解除文件对象与套接字的关联。

平时读取文件时,我们常用的是按行读取,但从socket套接字中读取数据时,你最熟悉的方法是读取指定长度的数据,试想一下,你现在写了一个socket,向一个web服务发送了请求,服务器返回response给你,你该如何解析呢?http response通常是下面的样子

HTTP/1.1 200 OK\r\n
Server: nginx/1.16.1\r\n
Date: Fri, 29 May 2020 01:02:01 GMT\r\n
Content-Type: text/html; charset=utf-8\r\n
Content-Length: 57889\r\n
Connection: close\r\n
\r\n
body

如果按照指定字节数量读取数据,该如何解析headers呢?这个问题困扰了我很久,直到阅读了python源代码中的http.client,才明白,原来底层的实现是借用makefile方法。使用makefile方法,创建一个与socket套接字相关联的文件对象,接下来就可以像读取文件一个读取socket套接字了,没错,就是readline,下面的示例代码像你展示如何准确读取解析http response的headers部分

import socket
​
​
url = 'www.coolpython.net'
port = 80
# 创建TCP socket
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 连接服务端
sock.connect((url, port))
# 创建请求消息头
request_url = 'GET / HTTP/1.1\r\nHost: www.coolpython.net\r\nConnection: close\r\n\r\n'
# 发送请求
sock.send(request_url.encode())
response = b''
# 接收返回的数据
fp = sock.makefile('rb')
while True:
    line = fp.readline()
    print(line)
    if line in (b'\r\n', b'\n', b''):
        break
​
fp.close()

扫描关注, 与我技术互动

QQ交流群: 211426309

加入知识星球, 每天收获更多精彩内容

分享日常研究的python技术和遇到的问题及解决方案