Tags：python - 沧海一粟 - Web系统架构与服务器运维,php开发

在这里让我们一起学习，一起提高！

[python] 常用正则表达式爬取网页信息及分析HTML标签总结

jed , 2016-5-19 22:41 , 服务器技术 , 评论(0) , 阅读(31578) , Via 本站原创

这篇文章主要是介绍Python爬取网页信息时，经常使用的正则表达式及方法。它是一篇总结性文章，实用性比较大，主要解决自己遇到的爬虫问题，也希望对你有所帮助~
当然如果会Selenium基于自动化测试爬虫、BeautifulSoup分析网页DOM节点，这就更方便了，但本文更多的是介绍基于正则的底层爬取分析。

阅读全文

Tags: 正则表达式 , python

Python Requests快速入门

jed , 2016-5-18 16:11 , 服务器技术 , 评论(0) , 阅读(27134) , Via 本站原创

快速上手
迫不及待了吗？本页内容为如何入门Requests提供了很好的指引。其假设你已经安装了Requests。如果还没有，去安装一节看看吧。
首先，确认一下：
Requests 已安装
Requests是最新的
让我们从一些简单的示例开始吧。
发送请求
使用Requests发送网络请求非常简单。
一开始要导入Requests模块:

阅读全文

Tags: python , requests

Python爬虫之URLError异常处理

jed , 2016-5-18 10:39 , 服务器技术 , 评论(0) , 阅读(24091) , Via 本站原创

大家好，本节在这里主要说的是URLError还有HTTPError，以及对它们的一些处理。

1.URLError

首先解释下URLError可能产生的原因：

网络无连接，即本机无法上网
连接不到特定的服务器
服务器不存在
在代码中，我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子，先感受下它的风骚

阅读全文

Tags: python , 爬虫

分页： 1/1