hacker-newbie blog

爬虫BeautifulSoup模块的使用

BeautifulSoup是python的一个库，类似于正则表达式但又与其不同，主要用来爬取网页数据，提供一些用来处理导航、搜索、修改、分析树等功能的函数。通过解析文档为用户提供需要抓取的数据，用起来也比较简单。刚才说是通过解析文档，首先要保存文档，接上期获取网页后 12345html = response.read()html_str = html.decode('utf-8&#...

2021-04-05 python

阅读全文

爬虫urllib的使用与补充

关于urllib的使用与补充，在爬取的过程中要尽量做到浏览器的模拟仿真。如果在爬取的过程中不进行仿真处理，目标浏览器会识别出你是爬虫，从而把你拒之门外。类的使用123import urllib.requesturllib.request.urlopen(文本网址,*data,*timeout) #data为传参的文本，timeout为访问一次的时间节点print(response.stat...

2021-03-06 python

阅读全文

复制文本粘贴文本全选文本剪切文本在新标签页打开复制图片地址复制图片文件

常见问题
示例博客
加入社区

本站源码
主题源码

打印页面
暗黑模式
阅读模式