网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
12月25日
漏签
0
天
python3吧
关注:
28,424
贴子:
201,283
看贴
图片
吧主推荐
游戏
9
回复贴,共
1
页
<<返回python3吧
>0< 加载中...
求爬虫大佬看看代码
只看楼主
收藏
回复
pazzavipera
队列
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
caihuyougui
邻接矩阵
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
直接贴报错。
caihuyougui
邻接矩阵
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
看了下你的爬取函数和提取函数,槽点挺多:
1、你要爬取的网站设有用户登录机制,那么你的函数中是不是应该加入身份验证的功能?
2、“内容”的英译是content,不是contant;
3、response.read()的返回值是字节串,不是字符串,那么你是不是应该先将其解码成字节串?
4、将正则解析的结果再解析的做法很low,即使要这样做,你也应该使用【" ".join()】转换第一次的解析结果,而不是直接用str()函数;
5、get_url()函数中最后的return语句缩进错误。
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示