Skip to content
This repository was archived by the owner on Nov 23, 2025. It is now read-only.

w-r0rschach/CSDNExporter

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CSDNExporter

介绍

CSDN 博客导出工具, 用于将 CSDN 博客导出为 Markdown / PDF 格式. 比较赞的地方在于, 它 不仅支持一篇博文的导出, 还支持将某个类目下的博文批量导出, 以及将导出的多篇博文汇总为 一篇, 以便用于全局搜索, 具体效果可以查看 导出 CSDN 博客至 Markdown 或 PDF 格式 (近乎完美).

运行脚本

  • Linux系统运行 启动脚本为 ./run.sh, 使用 chmod +x run.sh 增加其可执行权限;
  • Windows系统启动 启动脚本为run.bat, 双击打开或者在cmd中运行run.bat

补充

另外要说明的是:

  1. 安装必要的 Python 库, 如 httpx, requests, BeautifulSoup;

  2. 为了解析图片链接, 需要安装 aria2, 并保证能在命令行启动;

  3. 为了转换为 PDF, 需要安装 Pandoc, 同时需要安装MiKTeX;

  4. 安装字体Source Code Pro, windows用户建议安装ttf格式; 或修改main.py->generate_pdf方法中'-V mainfont="Source Code Pro"'等字体参数.

  5. 下载过快容易被CSDN屏蔽!

  6. TODO: 标题没有处理完善!

  7. 如MD文件无法正常转换为PDF,可使用VSCODE + Markdown Preview Enhanced插件 (https://marketplace.visualstudio.com/items?itemName=shd101wyy.markdown-preview-enhanced)实现。 使用VSCODE打开MD文件-右键菜单-打开侧边预览-在预览页面打开右键菜单-Open in browser-打印为PDF即可。

此外, 正如博客标题 导出 CSDN 博客至 Markdown 或 PDF 格式 (近乎完美) 中说的, "近乎完美", 是因为该博客导出工具还有一些细节没有考虑, 没有需求就没有动力去改代码, 精力有限, 目前该工具让我满意 😂😂😂.

#修复记录 20231109 1.在README中增加Pando和MikTex引擎安装信息。 2.修复Windows下run.bat中--to_pdf参数未生效的问题。 3.修复文章中存在gif,bmp格式图片时下载失败的问题。 4.修复文章中存在无后缀格式图片下载失败的问题。 5.修复文章中存在匹配图片格式但实际不是图片url导致下载失败的问题。 6.修复generate_pdf方法的is_win参数未生效的问题。 7.修复MD文件中图片路径由于img_file = join(self.fig_dir, img_file)导致未正常转义引发PDF转换失败的问题。

20231110 1.pandoc增加--verbose参数,便于后续调试。

About

CSDN 博客导出工具, 支持 Markdown / PDF 格式的导出

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 86.4%
  • Batchfile 7.4%
  • Shell 6.2%