type
status
date
slug
summary
tags
category
icon
标签
参考标签
批量转换文档到纯文本txt文件的时候,格式都会搞得乱七八糟。运气好的话分段不会错,但是文件里会有很多空行,一般都是软件太傻,行间距大一点就当成空了一段。
清洁文本的时候,空行需要删掉。可是一个文件夹里上千个txt文件,一个文件里到处都是空行,怎么删?
凡是这种重复劳动,不需要脑子的活,就一定要找脑子笨而又不抱怨的人做,就是计算机没错了。
处理txt纯文本文件,最强大的软件之一,是EmEditor,运作轻巧敏捷而又功能强大丰富,支持多文档搜索替代和正则表达式。贵是贵了点,但脑力劳动者一定要支持脑力劳动者,入正版!
notion image
多文档搜索替代能解决批量处理。接下来用正则表达式定位空行就好了。
所谓空行,就是这一行没有可见的内容,但是可能有空格、制表符等等不可见内容。一个空行的正则表达式为:
^[\s]*\n
按照正则表达式的语法解释:^ 表示一个段落开始了,在这个段落里有[\s],即不可见的符号,也就是空白字符,包括空格、制表符、换页符等等。有多少个呢?有n个,所以是[\s]*表示把前面的子表达式重复零次或多次。之后,\n是换行符,表示这一行结束。
操作方法:
  • 1. 点开功能栏“搜索”,选“在文件中替换”
notion image
  • 2. 按照下图,查找“^[\s]*\n”,替换为空,就等于删除。文件夹选择需要处理的txt文件所在的文件夹,而且一定要勾选“使用正则表达式”,保险起见,也可以勾选“保存备份”。
notion image
完成!
相关文章
将剑桥英英词典加入Alfred快捷搜索
Lazy loaded image
将Perplexity加入Alfred快捷搜索
Lazy loaded image
NAS需要定时重启吗?
Lazy loaded image
下载 B 站视频的五种方法
Lazy loaded image
B站视频下载神器——哔哩下载姬
Lazy loaded image
Windows下使用OCRMyPDF批量识别扫描版PDF文字
Lazy loaded image
《小王子》第十五章《小王子》第十四章
Loading...
TZ
TZ
阅尽千帆终执手,此心安处是吾乡
最新发布
振臂高呼GPT必应
2025-2-3
将剑桥英英词典加入Alfred快捷搜索
2025-2-3
【转载】美国霸权的衰落
2025-2-2
将Perplexity加入Alfred快捷搜索
2025-2-1
五行旺衰
2025-1-30
正视中美差距
2025-1-30
2017-2025TZ.

阅千帆 | 阅尽千帆终执手,此心安处是吾乡

Powered byNotionNext 4.8.3.