Pandoc快速转换Word到Markdown文件

Excerpt

Pandoc快速实现Word转Markdown,Web服务器上HTML转Markdown


Pandoc是一款非常强大的文档格式转换工具,对于Word转Markdown的场景,可以快速的实现转换,并且把Word文件中图片,生成到指定的文件夹中。 

Pandoc是由John MacFarlane开发的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀”。

Pandoc understands a number of useful markdown syntax extensions, including document metadata (title, author, date); footnotes; tables; definition lists; superscript and subscript; strikeout; enhanced ordered lists (start number and numbering style are significant); running example lists; delimited code blocks with syntax highlighting; smart quotes, dashes, and ellipses; markdown inside HTML blocks; and inline LaTeX. If strict markdown compatibility is desired, all of these extensions can be turned off.

上面是引用的,关于Pandoc的介绍。  

1
2
3

pandoc -f docx -t markdown test.docx -o test.md --extract-media ./images

图片

Word文档中的图片  

图片

Word文档  

图片

转换后的Markdown文件

Pandoc还支持,直接通过Http协议访问网页的内容,并生成Markdown文件,远端Web服务器上的图片也可以,保存到本地的图片文件夹中。 

1
2
3

pandoc -f html -t markdown --request-header User-Agent:“Mozilla/5.0” https://candylab.net/design/HFishSOC/ -o candylab.md --extract-media ./images1

图片

网站上的HTML  

图片

保存到本地的Markdonwn文件

方便的地方在于,Word中和图片和网站上的图片,统一保存到指定文件夹中。

图片

内容简介

近年来,信息技术的广泛应用极大地促进了社会进步,也方便了人们的工作和生活,随之而来的网络安全问题日益突显。如何构建安全可靠的网络环境,如何与时俱进地把新技术纳入网络安全防护的实践当中,成为网络安全工作者的重要课题。本书聚焦于 Web 服务常用的安全技术,以案例形式展示 Web 服务所面临的威胁,并给出了丰富多样的解决方案。本书由浅入深地介绍了 Web 安全的相关主题,包括 Web 应用程序基础理论、Web服务器与负载均衡、HTTPS和CDN的安全问题、Web服务的安全因素、如何保护Web服务、WAF原理与实践、Web日志审计、蜜罐技术、大数据时代的Web安全、网络安全解决方案等内容。本书适合网络安全领域的研发人员、运维人员、高校师生、培训机构等群体阅读参考。