最近刷题用python比较多,毕竟list比其他语言里面array好用多了,当然也还有dict。
分类:Python
[微信公众号文章抓取.二]构建Anyproxy来获取数据
上回书说到,啊啊呸。上一篇文章已经确定了抓取的思路是通过微信app来访问公众号文章的历史页面。从中获得数据。那么这就需要一个网关来拦截并获取其中的数据,同时这个网关最好还是可以基于它进行二次开发的,这样我们就可以让它自动提取我们需要的数据用来进行下一步的处理。
[微信公众号文章抓取.一]探索各种办法的可行性
最近在公司做了一个这方面的项目,总结一下。顺便把项目没用到的方案做了个小demo
python爬虫:提取页面时间
def date_check(date_str): now = datetime.date.today() zf_list = { ‘一’: 1, ‘二’: 2, ‘两’: 2, ‘三’: 3, ‘四’: 4, ‘五’: 5, ‘六’: 6, ‘七’: 7, ‘八’: 8, ‘九’: 9, ‘1’: […]
关于python中yield和协程的一点理解
yield一般应用于生成循环中的那个变量,一般这个变量是在代码编写时候就固定的或者是在生成器建立时候就传入的值 例如: def a(): i = 0 while True: yield i i += 2 def b(j): i = 0 while True: yield i i += j 但是
使用正则表达式解析url
#!/usr/bin/env python # -*- coding: utf-8 -*- import re class URL: def __init__(self, url): self.url = url.strip() match = re.search(r'(?P<protocol […]
python-单向链表
一个简单的单向链表类