采集插件研究手记

目的: 平时发的原创文章,主要分布在公众号、豆瓣等平台,如何快速收录到后花园。


研究学习了syan 写的插件,使用过程中也做了修订,原先支持的是emlog 4.1.0, 修订后支持 emlog 5.3.1 , 其它版本没有做测试。

1. 这是版本问题,按照新的数据库写入方式即可。

SQL语句执行错误:INSERT INTO emlog_blog (`title`,`date`,`content`,`excerpt`,`sortid`,`top`,`hide`,`allow_remark`,`allow_tb`) VALUES ('','1612019082','','','-1','n','y','y','y');
Unknown column 'allow_tb' in 'field list'


2.url末尾反斜杠的问题


这个问题困扰了我两天,怎么采集都取不到标题和内容,但是测试又是好的,最后发现是在末尾的斜杠上面。

屏幕截图 2021-02-03 222759.png

https://www.douban.com/group/topic/111000215


以豆瓣这个为例,末尾一定要有反斜杠才行。


3. 重复插入问题

根据标题进行判断。

发表评论 / Comment

提示:本文章评论功能已关闭