最近小说站出现了关关采集器生成速度特别慢的问题? 特别是超大的小说章节。 目前测试已经基本解决这个问题了。 主要原因集中在关关5.5版本应付不了大量章节的数据
分类:Coding
测试百度主动提交对于收录与权重的影响!
今天开始测试百度主动提交对于百度收录与权重的影响! 如果真的会有权重提现。 以后做站的主要程序可能就会改为WP了。 从而进行简单的优化了。 目前百度还没有收录。 但是不知道是不是我的错觉!安装了主动提交插件以后。 抓取频…
PHP错误Parse error: syntax error, unexpected end of file 帝国报错
在Windows的环境下 安装帝国 出现这种报错 一般都是因为没有把short tags开启为On 仅需把Short tags开启为On多半都可以解决这个问题。 不要按照他的错误去看PHP文件了。 多半没有问…
admin对应的MD5 16值与32值 记录备用
有时候忘记了密码了 直接在数据库里搞定! 16位 7a57a5a743894a0e 32位 21232f297a57a5a743894a0e4a801fc3 再补充一个admin888的 ad…
pip和easy_install使用国内源
pypi.python.org速度巨慢,还经常连不上,好在还有一些国内源可以用。 pip的添加方法: 创建配置文件: Windows下是在:%HOME%\pip\pip.ini Linux和Mac下是在:&n…
记录一下学习XPATH的一些字符意义
// = 整个文本 * = 匹配任何类型的标签 [] = 给类型的标签作为限制 如 @id='xxxx' class='xxxx'
由于入了Amazon Cloud Drive的坑, 特别来安利一款小的软件 RCLONE
大厂不等于牛逼 去年在AMAZON CLOUD DRIVE(后面用ACD代替) 刚推出来$60= unlimited storage的时候。 感觉美人希所以就拿信用卡去做了3个月试用!中途因为忙于工作,忘记了事情。后来被…
Python爬虫建站入门手记——从零开始建立采集站点(二:编写爬虫) ZT
也就是一对乱七八糟的东西 装了pip,用pip装了virtualenv,建立了一个virtualenv,在这个virtualenv里面,装了Django,创建了一个Django项目,在这个Django项目里面创建了一个叫…
Python爬虫建站入门手记——从零开始建立采集站点(一:环境搭建) ZT
从今天起,我将在这里更新一个系列的python简单爬虫到建立网站的实践手记。 内容将会从最简单的开始,环境搭建,基本爬虫,入库,用Django建立可供用户访问的网站,网站部署。 同时打算涉及简单的异步爬虫,piplibe…
网络爬虫(二):利用urllib2通过指定的URL抓取网页内容
版本号:Python2.7.5,Python3改动较大,各位另寻教程。 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 类似于使用程序模拟IE浏览器的功能,把URL作为HTTP…