Urllib

Python urllib urllib库 包含以下几个模块 urllib.request # 打开和读取url urllib.error # 包含urllib.request抛出的异常 urllib.parse # 解析url urllib.robotparser #解析robots

python 

Requests

requests import requests #方法 #说明 requests.requst() # 构造一个请求,最基本的方法,是下面方法的支撑 requests.get() # 获取网页,对应HTTP中的GET方法 requests.post() # 向网页提交信息,对应HT

python 

Beautiful Soup

Python BS4 Beautiful Soup 简称 BS4(其中 4 表示版本号)是一个 Python 第三方库,它可以从 HTML 或 XML 文档中快速地提取指定的数据。 BS4 解析页面时需要依赖文档解析器 Python 也自带了一个文档解析库 html.parser, 但是其解析速度要

python 

python Re正则

表达式 单字符匹配 | 字符 | 功能 | 位置 | | :— | :——————: | ————– | | . | 匹配任意1个字符(除了\n) | | | [ ] | 匹配[ ]中列举的字符 | | | \d | 匹配数字,即0-9 | 可写在字符集[…]中 | | \s | 匹配空⽩,即空格,

python 

python Xpath

python Xpath XPath介绍: 是什么? 全称为XML Path Language 一种小型的路径查询语言 您可以将 Xpath 理解为在xml/html文档中检索、匹配元素节点的工具。 说到XPath是门语言,不得不说它所具备的优点: (1) 可在XML中查找信息 (2) 支持HTML

python 

feapder-【某法网】的案例

把这些案例的url放到mysql任务表里

python