文本文件是一种计算机文件,它将键入的文档存储为一系列字母数字字符,通常没有视觉格式信息。内容可以是个人笔记或列表、期刊或报纸文章、书籍或可以以打字形式准确呈现的任何其他文本。文本文件与文字处理文件类似,两者的内容都主要是文本。它们的不同之处在于,文本文件通常不记录诸如字符样式和大小、分页或其他指定最终文档外观的详细信息。一些计算机操作系统对文本文件和二进制文件进行了基本区分,文本文件旨在直接翻译为人类可读的文本,而二进制文件则由计算机直接解释。
在大多数用于编码的方案中文本,每个字符都分配有一个数值,然后将文本写为一串二进制数字。一系列编码方案,称为 Ame黎加信息交换标准代码 (ASCII) 在计算历史的早期就成为广泛使用的标准,尽管它对英语以外的语言支持很差。 ISO 8859 编码系列为基于拉丁字母和类似字母的语言提供了更好的支持,但无法对日语等东亚语言的字符进行编码,导致不兼容标准的激增。
<图 >ASCII 编码系统以其适应性和简单性而闻名。最近,Unicode® 联盟一直在开发一种名为 Unicode® 的编码系统,其目标是分配唯一的地球上每种语言中使用的每个字符的编号。这将允许对每种语言使用单一代码,并允许多种语言的文本出现在单个文件中。 Unicode 的第一部分基于 ISO 8859,而 ISO 8859 本身又基于 ASCII。即使在英语国家,使用 Unicode® 也具有优势,因为使用旧方案编码的文本在从一个系统移动到另一个系统时可能会显示出细微的不一致。
文本文件的优点包括尺寸小和多功能性。它们比以其他格式存储的相同数据小千字节或兆字节,可以通过电子邮件或磁盘快速、大规模地交换。大多数都可以使用非常基本的软件在运行不同操作系统的计算机上打开。主要缺点是缺乏格式。对于表示包含图像或依赖设计元素来传达其含义的文档(例如,包含表格数据、数学公式或具体诗歌的文件),文本文件可能不是一个好的选择。
文本文件通常适用于可供人类阅读和编辑,但并非所有内容都包含主要供人类阅读和编辑的内容消费。大多数编程代码在编译之前都存储在文本文件中,即翻译成机器可读的二进制文件。文件还可能包含机器可读的文本标签,除了纯文本之外,还提供格式信息。例如,超文本标记语言 (HTML) 文件可以在文本编辑器中作为纯文本文件打开,或者在由 Web 浏览器解释后显示为格式化网页。类似的方案包括用于布置科学论文的 LaTeX 和用于构建数据的可扩展标记语言 (XML)。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!