求爬虫大佬看看代码

只看楼主
收藏
回复

pazzavipera
队列
7

caihuyougui
邻接矩阵
12

直接贴报错。

caihuyougui
邻接矩阵
12

看了下你的爬取函数和提取函数，槽点挺多：
1、你要爬取的网站设有用户登录机制，那么你的函数中是不是应该加入身份验证的功能？
2、“内容”的英译是content，不是contant；
3、response.read()的返回值是字节串，不是字符串，那么你是不是应该先将其解码成字节串？
4、将正则解析的结果再解析的做法很low，即使要这样做，你也应该使用【" ".join()】转换第一次的解析结果，而不是直接用str()函数；
5、get_url()函数中最后的return语句缩进错误。

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示

9回复贴，共1页

<<返回python3吧

分享到:

日	一	二	三	四	五	六