url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出,
中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\
像这样
最后一句改成这样
print(data.decode('utf-8'))
有这样的报错
UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence
求助,怎么解决?我看到关于python3的教程 他们输出都是正常的
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出,
中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\
像这样
最后一句改成这样
print(data.decode('utf-8'))
有这样的报错
UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence
求助,怎么解决?我看到关于python3的教程 他们输出都是正常的
