蒲荣龙的博客

不为谁而写的博

如果一件事坚持了太久，是否会成为一种习惯。不为谁而写的博，名字是模仿《不为谁而做的歌》这首歌，主要还是想讲讲“为什么写博客”这个主题。这个主题很久很久以前就想写了，快有一年了吧，但总是觉得写的还不够，还不足以支撑这篇博文主题，临近毕业之际，想...

git忽略已经被提交的文件上次在github pages项目里修改了gitignore配置文件，提交了site文件夹，后来不准备把这个文件push上去，于是在gitignore里又添加了site，结果发现，这时候配置gitignore没有用了...

在部署jekyll和github pages的时候遇到的一些问题因为以前用过jekyll，所以以为jekyll和github pages搭配很简单，结果自己使用的过程中遇到了一些问题，使用google和stackoverflow解决了问题，有...

制作一款jekyll主题首先是用jekyll新建一个项目，在命令行中输入：jekyll new jekyll-blog这样就建好了一个jekyll项目，启动： jekyll serve

使用FEED43制作你的RSS源想知道某些新闻或某人的博客是否有更新文章，可以用RSS订阅，这样每次只需要查看rss阅读器就可以了。

python中的Beautiful Soup我们前面提到过一个xpath，今天要讲的Beautiful Soup作用类似，它是一个可以从HTML或XML文件中提取数据的Python库。

python中的xlwt我们有时候会使用python对数据进行处理，而有些数据通常会存储在excel表中，有时候呢，又需要把网上获取的数据存储到excel中，下面来看看python中如何存储excel数据吧。

请你相信我，把一切交给，我的逻辑思考。

xpath笔记当我们使用爬虫对网页进行爬取的时候，重要的一步就是对我们爬取的网页中所需要的数据进行提取，那么问题来了，怎么匹配出那些我们需要的数据呢？这就要提到正则表达式了，我们可以使用正则来搜索我们需要的信息，但是正则功能强大，弊端在于容易...

记录scrapy的一些笔记scrapy是python开发的一个快速web爬虫抓取框架，用于抓取web站点并从页面中提取结构化的数据。scrapy用途广泛，可以用于数据挖掘，监测和自动化测试。下面我们通过抓取豆瓣电影top排行榜来熟悉scrapy。

满地都是六便士他却抬头看见了月亮

记录python的一些笔记URI是统一资源标识符，用于标识某一互联网资源，而URL是统一资源定位符，表示资源的地点（互联网上所处的位置）。所以URL是URI的子集。 urllib2 - An extensible library for op...

在安装scrapy的过程中遇到了一些问题记录一下。安装这个确实挺多人遇到了问题的，虽然大家遇到的问题可能不同，但大部分可能都是缺少某些包

下载工具我们一般使用迅雷，但是在linux这一类的系统上没有迅雷肿么办，这时候就可以使用我们的命令行下载工具了，如wget，axel等，前者是单线程的，而且不支持断点续传，所以推荐使用后者。