我们知道,临床数据分析结果图表最终都会以RTF的格式呈现结果,打开类似word文档。
什么是rtf格式呢?
RTF即富文本格式(Rich Text Format),又称多文本格式,是由微软公司开发的跨平台文档格式。是一种轻量级的可编辑的文档格式。
为什么要用RTF?
RTF格式的优点:
(1) 通用兼容性是RTF的最大优点,它可以实现多平台的信息兼容。
(2) RTF格式文件可以在不同程序和同一程序不同版本之间传递数据,且它的格式信息不会丢失或破坏。
RTF文件是一种开源代码的文件格式,你可以用记事本,notepad等编辑器打开查看它的源代码、你完全可以像编辑HTML文件一样,使用“记事本”来编辑RTF格式文件。
与RTF相比,WORD是一种重量级的文档编辑器,用Word软件可以编辑文字图形、图像、声音、动画,还可以插入其它软件制作的信息,也可以用Word软件提供的绘图工具进行图形制作,编辑艺术字,数学公式,能够满足用户的各种文档处理要求。
我们可以打开一个RTF文件看看源代码:
当我们把RTF另存为word文档,再看源代码:
可以看出,其实已经转为字节码了。这样我们也无法通过代码的方式编辑Word,它的核心还是微软word的编译器或解释器。RTF其实相当于微软从word开源出来一部分的格式。
同样是同一个文件,因格式不同,背后的代码显示也不同。
我们可以看一下利用Python合并当前文件夹所有RTF,结果只用了不到1秒钟。
本质原因是合并的过程中,程序是读取的它背后的字符,像读取并合并txt一样。
文章评论