博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
urllib库爬虫技术从0开学习
阅读量:7135 次
发布时间:2019-06-28

本文共 584 字,大约阅读时间需要 1 分钟。

urllib库

urllib库是pytho中一个最基本网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。

urllopen函数

在python的urllib库中,有什么函数供我们使用,所以请求相关的方法都集成到urllib.request模块下以面了,先看urlopen函数基础使用:

from urllib import requestresp = request.urlopen('http://www.baidu.com')print(resp.read())
View Code

事实上,使用浏览器访问百度右键查看源代码,你会发现跟我们刚才打印出来的数据是一模一样的,也就是说上面三行代码就已经帮我们把百度首页的全部代码全部扒下来,,一个基本的url对应的python真的非常简单,,

以下对urllopen函数的进行详细讲解:

1 url: 请求的url
2 data : 请求的data,如果设置了这个值,那么将变成post请求
3 返回值:返回值是一个http.client.HTTPRespons对象,这个对象是一个类文件句柄有read(size),readline,readlines 以及getcode等方法

 

转载于:https://www.cnblogs.com/fgxwan/p/9739435.html

你可能感兴趣的文章
技术,技术人员,谁是风,谁是草
查看>>
Android应用程序键盘(Keyboard)消息处理机制分析(6)
查看>>
浅谈软件开发定律系列之帕金森定律(Parkinson’s Law)
查看>>
.NET简谈事务、分布式事务处理
查看>>
Windows操作系统的发展历史
查看>>
拆分又遇变数,传赛门铁克或将出售VERITAS,这又是挖的什么坑?
查看>>
UGC“废水”还是“良药”?56、人人"抱团"上路
查看>>
SCCM2012系列之十一,SCCM2012软件更新部署配置
查看>>
也谈大公司病4——大公司中的反模式
查看>>
基于IP-PBX的VoIP系统解决方案
查看>>
《Python从小白到大牛》第1章 开篇综述
查看>>
Word 2003中为什么修改一个段落的文章结果整篇文档的格式都变?
查看>>
安装 SQL Server Express 版本
查看>>
部署Lync Server 2013持久聊天即群聊功能
查看>>
VMware View 5.0从菜鸟到高手系列 7 -分配虚拟桌面篇
查看>>
Hyper-V 3虚拟机快照之一 快照应用介绍
查看>>
ASP.NET中页面传值
查看>>
Flex4中动态生成RadioButton,绑定数据源
查看>>
开源CMS大PK:WordPress vs Drupal vs Joomla ,谁更强大更好用
查看>>
HDU-1004 Let the Balloon Rise STL map
查看>>