不为谁而写的博
如果一件事坚持了太久,是否会成为一种习惯。不为谁而写的博,名字是模仿《不为谁而做的歌》这首歌,主要还是想讲讲“为什么写博客”这个主题。这个主题很久很久以前就想写了,快有一年了吧,但总是觉得写的还不够,还不足以支撑这篇博文主题,临近毕业之际,想...
如果一件事坚持了太久,是否会成为一种习惯。不为谁而写的博,名字是模仿《不为谁而做的歌》这首歌,主要还是想讲讲“为什么写博客”这个主题。这个主题很久很久以前就想写了,快有一年了吧,但总是觉得写的还不够,还不足以支撑这篇博文主题,临近毕业之际,想...
git忽略已经被提交的文件上次在github pages项目里修改了gitignore配置文件,提交了site文件夹,后来不准备把这个文件push上去,于是在gitignore里又添加了site,结果发现,这时候配置gitignore没有用了...
在部署jekyll和github pages的时候遇到的一些问题因为以前用过jekyll,所以以为jekyll和github pages搭配很简单,结果自己使用的过程中遇到了一些问题,使用google和stackoverflow解决了问题,有...
制作一款jekyll主题首先是用jekyll新建一个项目,在命令行中输入:jekyll new jekyll-blog这样就建好了一个jekyll项目,启动: jekyll serve
使用FEED43制作你的RSS源想知道某些新闻或某人的博客是否有更新文章,可以用RSS订阅,这样每次只需要查看rss阅读器就可以了。
python中的Beautiful Soup我们前面提到过一个xpath,今天要讲的Beautiful Soup作用类似,它是一个可以从HTML或XML文件中提取数据的Python库。
python中的xlwt我们有时候会使用python对数据进行处理,而有些数据通常会存储在excel表中,有时候呢,又需要把网上获取的数据存储到excel中,下面来看看python中如何存储excel数据吧。
请你相信我,把一切交给,我的逻辑思考。
xpath笔记当我们使用爬虫对网页进行爬取的时候,重要的一步就是对我们爬取的网页中所需要的数据进行提取,那么问题来了,怎么匹配出那些我们需要的数据呢?这就要提到正则表达式了,我们可以使用正则来搜索我们需要的信息,但是正则功能强大,弊端在于容易...
记录scrapy的一些笔记scrapy是python开发的一个快速web爬虫抓取框架,用于抓取web站点并从页面中提取结构化的数据。scrapy用途广泛,可以用于数据挖掘,监测和自动化测试。下面我们通过抓取豆瓣电影top排行榜来熟悉scrapy。
满地都是六便士他却抬头看见了月亮
记录python的一些笔记URI是统一资源标识符,用于标识某一互联网资源,而URL是统一资源定位符,表示资源的地点(互联网上所处的位置)。所以URL是URI的子集。 urllib2 - An extensible library for op...
在安装scrapy的过程中遇到了一些问题记录一下。安装这个确实挺多人遇到了问题的,虽然大家遇到的问题可能不同,但大部分可能都是缺少某些包
下载工具我们一般使用迅雷,但是在linux这一类的系统上没有迅雷肿么办,这时候就可以使用我们的命令行下载工具了,如wget,axel等,前者是单线程的,而且不支持断点续传,所以推荐使用后者。