当前位置:首页|资讯|ChatGPT|人工智能

【这款软件肯定要火】连ChatGPT都在推荐这一款软件!

作者:UI8白嫖怪发布时间:2023-04-25

微信公众号:[小斐实战] 关注技术分享,资源分享。问题或建议,请公众号留言。

是一款流行的文档转换工具,可在不同文件格式之间进行转换。它被誉为文档转换的瑞士军刀,广受欢迎。连最近备受瞩目的人工智能ChatGPT都知道如何将Markdown格式的文件转换为docx格式,它的首选方案就是使用Pandoc

Pandoc是一款免费的命令行软件,基于GPL协议开源。它是由加州大学伯克利分校的哲学系教授John MacFarlane使用Haskell语言开发的,目前另一位核心开发者是来自德国的Albert Krewinkel。截至发稿,Pandoc在GitHub上的仓库拥有超过28,600个Star和3,100个Fork。

关注公众号,每天都有不一样的精彩内容

在Pandoc官网上,你可以找到各个操作系统上的详细安装方法。你可以根据自己使用的操作系统下载安装包进行安装,或者下载源代码并自行编译。当然,也可以使用包管理器进行安装。例如,在Windows系统上,你可以使用Chocolatey进行安装:


choco install pandoc

在 macOS 上使用 Homebrew 安装:


brew install pandoc

在 Linux 上使用 APT 安装:


sudo apt-get install pandoc

安装完成后,你可以在终端中输入pandoc --version来确认是否安装成功。如果输出以下或类似的信息,那么就说明安装成功了:









pandoc 2.19.2Compiled with pandoc-types 1.22.2.1, texmath 0.12.5.2, skylighting 0.13,citeproc 0.8.0.1, ipynb 0.2, hslua 2.2.1Scripting engine: Lua 5.4User data directory: /Users/username/.local/share/pandocCopyright (C) 2006-2022 John MacFarlane. Web:  https://pandoc.orgThis is free software; see the source for copying conditions. There is nowarranty, not even for merchantability or fitness for a particular purpose.

Pandoc的使用方式如下:


pandoc [options] [input-file]

比如我们希望将一个TXT文件转换为网页文件:


pandoc -f markdown demo.txt -t html -o demo-h.html

上述命令中,选项 -f markdown表示输入文件的格式为 Markdown,也可以用 --from=markdown-r markdown--read=markdown来表示;选项 -t html表示输出文件格式为HTML,也可以用 --to=html-w html--write=html来表示。输入文件为 demo.txt-o demo-h.html1也可以写成1--output=demo-h.html,表示将输出写入到一个HTML文件中,文件名为 demo-h.html

关注公众号,每天都有不一样的精彩内容

不只能处理文件

许多教程都强调Pandoc的“输入文件”和“输出文件”,尽管这本身没有问题,但却在一定程度上限制了Pandoc的功能,让新手觉得它只能处理文件。然而,实际情况并非如此。与大多数命令行工具一样,Pandoc的输入和输出也可以是stdin(标准输入)或stdout(标准输出),而不仅仅是文件。

据Pandoc用户手册所述,如果没有指定输入文件,Pandoc会从stdin读取输入。如果没有指定输出文件,则输出为stdout,也就是直接显示在终端中。例如,可以执行下面这个简单的命令:


echo 'hello world' | pandoc

可以通过管道操作符 | 将echo命令的输出结果传递给Pandoc。由于没有指定输入和输出文件,Pandoc默认将输入视为Markdown格式,将输出视为HTML格式,因此它会在终端中显示以下结果:


<p>hello world</p>

标准输入和标准输出的特性意味着Pandoc可以与其他命令行工具结合使用。例如,假设有一个文本文件demo.txt,但该文件的编码不是UTF-8,而Pandoc默认使用UTF-8,那么可以使用iconv命令进行转换,如下所示:


iconv -t utf-8 demo.txt | pandoc | iconv -f utf-8

其实Pandoc不仅可以用于"转换文档格式",还可以用于"处理文本"。此外,Pandoc还可以读取网页内容并将其转换为其他格式。


pandoc -f html https://pandoc.org -t commonmark-raw_html -o pandoc.md

这行命令将 Pandoc 官网主页从 HTML 转换为 Markdown,并关闭 raw_html 扩展(-extenson 表示关闭扩展),避免转换后的 Markdown 中出现很多 HTML 语法。需要指出的是,CommonMark 是一套针对标准 Markdown 语法进行严格定义并与之高度兼容的规范,也是由 John MacFarlane 教授主导开发的。

写在最后

毫不夸张地说,Pandoc 是我最喜欢的工具之一。尽管它是一个免费软件,但我仍然在 GitHub 上赞助了核心开发者。我感谢他们开发了如此优秀的软件,也希望为项目开发尽一份微薄之力。

撰写这篇介绍 Pandoc 的文章,让更多人了解并使用它,同样让我感到非常开心。这就像分享自己收藏已久的珍品一样令人兴奋。虽然文章可能无法涵盖所有方面,甚至可能会遗漏基础的部分,但我仍然希望能让你感受到 Pandoc 的魅力,并且希望你能使用并分享它。

获取工具关键词

关注公众号,每天都有不一样的精彩内容

大数据为您分享以下精彩内容

  • 【视频教程】0开发基础,60分钟制作一个可变现的小程序

  • 【硬盘有救了,缩小11G】Tiny11:迄今为止用过最流畅的精简Windows11系统!

  • 【免费!流畅!不限速】是时候卸载TeamViewer了!免费支持100 台设备!国货精品!

  • PowerToys的FancyZones也得靠边站!拿出用了10年的分屏工具:键盘侠们都哑巴了!

  • 【生产力工具】让你放弃Windows自带搜索功能的工具!10秒 VS 1秒!你选择哪个?

  •  【神技】听说你不想按住标题栏再移动窗口?Mac/Windows/Liinux新玩法!



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1