记录python的一些笔记
URI是统一资源标识符,用于标识某一互联网资源,而URL是统一资源定位符,表示资源的地点(互联网上所处的位置)。所以URL是URI的子集。
urllib2 - An extensible library for opening URLs using a variety of protocols
除了”http:”,URL同样可以使用”ftp:”,”file:”等等来替代。HTTP是基于请求和应答机制的:客户端提出请求,服务端提供应答。
re.sub():
sub是substitute的简写,表示替换,作用:
对于输入的一个字符串,利用正则表达式(的强大的字符串处理功能),去实现(相对复杂的)字符串替换处理,然后返回被替换后的字符串。
比如这个字符串:
inputStr = "hello 123 world 456"
想要把数字都替换,则这样使用:
replacedStr = re.sub("\d+", "222", inputStr)
re.sub替换所有的匹配项,并不只是第一个匹配项
re.sub('[abc]', 'o', 'caps')
'oops'
re.findall():
匹配所有符合规律的内容,返回包含结果的列表
re.search():
匹配并提取第一个符合规律的内容,返回一个正则表达式对象
str.split():
split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)
编码:把一个Python对象编码转换成Json字符串
json.dumps()
解码:把Json格式字符串解码转换成Python对象
json.loads()
urllib模块提供urlretrieve()函数。urlretrieve()方法直接将远程数据下载到本地。
xrange()接受三个参数分别是start,stop和step(其中start和step是可选的,stop是必需的)
range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。xrange 用法与 range 完全相同,所不同的是生成的不是一个list对象,而是一个生成器。要生成很大的数字序列的时候,用xrange会比range性能优很多,因为不需要一上来就开辟一块很大的内存空间。
抓包利器Fiddler-fidder介绍:
电脑与互联网之间的通信是通过不同的数据包收发来实现的。Fiddler可以从中间对数据进行拦截。拷贝一份数据后再将数据发送给目的端。同类的还有WireShark。