FictionDown(网络小说爬取工具)v0.1.2官方版
最新推荐
-
Turbosoft TTWeb v1.5.0 网络工具 / 14.8M
-
-
-
Bala八乐音乐世界 2.0 网络工具 / 6.4M
-
RaidenFTPD2.4 网络工具 / 5.5M
精品推荐
-
Tutanota(电子邮件客户端)v3.91.10官方版 网络工具 / 65.6M
查看 -
Visual Studio Downloaderv1.0免费版 网络工具 / 51KB
查看 -
Free Disney Plus Download(网页视频下载器)v5.1.27.225免费版 网络工具 / 59.2M
查看 -
鹰眼中控系统v2.0.10.300385官方版 网络工具 / 28.5M
查看 -
ZOOK MBOX to EMLX Converter(邮件转换软件)v3.0官方版 网络工具 / 3.3M
查看
本类排行
详情介绍
FictionDown是一款在线小说爬取工具,支持自动校对和多格式转换,解决章节缺失、章节顺序混乱的问题。它具有内置的简单广告过滤功能。事实上,大部分都需要手动删除!
FictionDown是一款在线小说爬取工具,支持自动校对和多格式转换,解决章节缺失、章节顺序混乱的问题。它具有内置的简单广告过滤功能。事实上,大部分都需要手动删除!
软件特点
以起点为样本,多站点多线程爬取校对
支持导出txt,兼容大多数阅读器
支持导出markdown并可以使用pandoc转换为epub,保留图书信息、卷结构、作者信息
内置简单的广告过滤(尚不完善)
用Golang编写,易于安装和部署,唯一的外部依赖是PhantomJS
指示
输入起点链接
获取书籍信息,开始抓取各章节内容,将VIP章节放入Example中作为校对样本
为碧曲格等盗版小说手动设置对应的链接和夯实字段
重新开始,开始爬取,只爬取VIP部分,并用Example校对
手动编辑对应的缓存文件并手动删除广告和某些随机字符(有些是关键字,可能会导致pandoc内存溢出或样式错误)
d -f md 生成markwown
使用pandoc转换为epub,pandoc -o xxxx.epub xxxx.md
特征
未实现功能
爬取起点爬取购买章节时带上cookie
支持刺猬猫(即“快乐书客”)
支持直接输出epub,无需pandoc
支持小说站内搜索
多线程转换md
在主包中组织面条逻辑
组织命令行参数样式
windows下,md转epub时出现路径问题。
改进广告过滤
简化使用步骤
优化日志输出
本书的介绍也应该是HTML 格式的。即p?/p代替当前的\\t和\\n
变更日志
在小说网站内搜索
命令行组织
修改站点匹配结构
每个输出格式都略有组织