开始使用
- 选择书籍,进行内容爬取
- 第二步,选择具体章节,进行阅读或者摸鱼阅读😀
正常阅读(查看源文件)
摸鱼阅读😀
快捷键
Windows |
Mac |
作用 |
alt+. |
cmd+. |
下一页 |
alt+, |
cmd+, |
上一页 |
alt+; |
cmd+; |
跳转指定页 |
alt+m |
cmd+m |
老板键🤫 |
如果发现快捷键无用,请检测按键冲突,自行进行修改
高级功能
配置抓取组
基本上每一个网站配置一个抓取组就行了
先进行书籍目录的抓取,提取关键信息 标题title和链接link
正则配置组
在从详情页中爬取内容,只需要大致全选内容content,程序会自动提取文本内容
正则匹配组
tips: 一般内容会存在换行的情况,可以使用 [\s\S] 代替正则通配符 . 。
例如
\<div class="content" itemprop="acticleBody"\>(?<content>[\s\S]*?)\<\/div\>
配置具体书籍抓取
开发相关
publish
npm i -g vsce
package
vsce package --no-yarn
vsce login Chensy
相关链接
| |