当前位置:首页 » 文件管理 » 文本文件可以由多种编码的字符组成吗
扩展阅读
可以制作电话内容的app 2025-08-20 11:52:22

文本文件可以由多种编码的字符组成吗

发布时间: 2022-12-29 11:12:31

⑴ 文本文件和二进制文件的区别是什么

文本文件是指完全由可见字符组成的文件。所谓可见字符是指ASCII码为32到126的字符、回车符(ASCII码13)、换行符(ASCII码10)、制表符(ASCII码9)、以及所有汉字字符(当然也包括其他字符集如韩文、日文、阿拉伯文等等)。如果是Unicode文本,则还包括ASCII码0。
而二进制文件则有多种定义方式,广义的二进制文件是指电脑中的所有文件(包括文本文件),因为电脑中的所有文件其实都是以二进制方式存储的,也就是说每个字符(包括可见字符、控制字符)最终都是以0和1的形式存储在硬盘等介质中的(这也就是为什么说电脑只认识0和1这两个数字的原因);
而狭义的二进制文件则是相对于文本文件而言的,即只要文件中含有除可见字符之外的其他字符(主要是控制字符),就是二进制文件;
而比狭义的二进制文件更有特指性的定义方式则是指可执行文件(EXE)、库函数文件(DLL)、图片视频、数据库文件等等一切由程序代码、机器码、特定的二进制代码和数据等组成的有实际意义的文件。

⑵ 文本编码共有多少种有什么用为什么很多系统自动生成的文件都是乱码

文本编码常见的是UTF-8、ansi、Unicode等,一般UTF-8更常见,因为UTF-8支持中文字符,更多的我就不知道了,系统自动生成的文件编码格式不一样,所以如果没有对应的打开方式就会出现乱码,然后不是所有的文件都可以用文本方式打开,TXT只能打开以字符形式保存的文件,所以像一些视频、音频、图片或者可执行文件都是不能用TXT打开的,最后星号是经过算法加密的,你只能在输入密码的时候以明文方式查看。

⑶ 如何在一个文本文件里使用两种不同的文字编码

应该不行吧
打开一个文件就决定了这个文件的编码
如果要在同一个文件中实现不同编码的文本
这个文本编辑器
必须能够识别文本
转换后显示
或者通过某个标识识别某段文字的编码方式,通过程序去取
你要做什么呢
如果是在一短代码读取不同编码配置
用xml应该可以标识出来

⑷ 请问下,为什么说word是二进制文件

英文:Binary files - 包含在 ASCII 及扩展 ASCII 字符中编写的数据或程序指令的文件。计算机文件基本上分为二种:二进制文件和 ASCII(也称纯文本)文件,图形文件及文字处理程序等计算机程序都属于二进制文件。这些文件含有特殊的格式及计算机代码。ASCII 则是可以用任何文字处理程序阅读的简单文本文件。

广义的二进制文件即指文件,由文件在外部设备的存放形式为二进制而得名。狭义的二进制文件即除文本文件以外的文件。文本文件是一种由很多行字符构成的计算机文件。文本文件存在于计算机系统中,通常在文本文件最后一行放置文件结束标志。文本文件的编码基于字符定长,译码相对要容易一些;二进制文件编码是变长的,灵活利用率要高,而译码要难一些,不同的二进制文件译码方式是不同的。 从本质上来说他们之间没有什么区别,因为他们在硬盘上都有一种的存放方式--二进制,但是如果要对他们有些区分的话,那可以这样理解。我们现在的每个字符由一个或多个字节组成,每个字节都是用的-128—127之间的部分数值来表示的,也就是说,-128——127之间还有一些数据没有对应任何字符的任何字节。如果一个文件中的每个字节的内容都是可以表示成字符的数据,我们就可以称这个文件为文本文件,可见,文本文件只是二进制文件中的一种特例,为了与文本文件相区别,人们又把除了文本文件以外的文件称为二进制文件,由于很难严格区分文本文件和二进制文件的概念,所以我们可以简单地认为,如果一个文件专门用于存储文本字符的数据,没有包含字符以外的其他数据,我们就称之为文本文件,除此之外的文件就是二进制文件。

以上是引用的二进制文件的说明,一般意义上讲,文本文件你用记事本打开看到的都是正常的字符或文字,没有任何的格式,只是一些字符或文字的集合。只要其中加了格式的话,或引用的表格、图片等,就都是二进制文件了

⑸ 在C语言中,文件按存储形式划分可分为-----和-----

在C语言中文件按存储形式可划分为文本文件和二进制文件,文本文件又称纯文本文件。

文本文件是一种计算机文件,它是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。文本文件是指以ASCII码方式(也称文本方式)存储的文件,更确切地说,英文、数字等字符存储的是ASCII码,而汉字存储的是机内码。文本文件中除了存储文件有效字符信息(包括能用ASCII码字符表示的回车、换行等信息)外,不能存储其他任何信息。

二进制文件是指包含在 ASCII及扩展 ASCII 字符中编写的数据或程序指令的文件,广义的二进制文件即指文件,由文件在外部设备的存放形式为二进制而得名。狭义的二进制文件即除文本文件以外的文件。文本文件是一种由很多行字符构成的计算机文件。文本文件存在于计算机系统中,通常在文本文件最后一行放置文件结束标志。文本文件的编码基于字符定长,译码相对要容易一些;二进制文件编码是变长的,灵活利用率要高,而译码要难一些,不同的二进制文件译码方式是不同的。

⑹ 什么是文本文件和文本文档,它们有什么不同吗

一、主体不同

1、文本文件:是一种计算机文件,是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。

2、文本文档:以TXT后缀名的文件。


二、存储方式不同

1、文本文件:以ASCII码方式(也称文本方式)存储的文件,除了存储文件有效字符信息(包括能用ASCII码字符表示的回车、换行等信息)外,不能存储其他任何信息。

2、文本文档:是微软在操作系统上附带的一种文本格式,是最常见的一种文件格式,早在DOS时代应用就很多,主要存文本信息,即为文字信息。

三、特点不同

1、文本文件:在文本文件最后一行后放置文件结束标志来指明文件的结束。

2、文本文档:由可打印字符组成,人可以直接阅读和理解其形式。


⑺ 二进制文件与文本文件的区别

在定义和存取方式上二进制文件与文本文件存在区别。

1、定义上的区别

文本文件:文本文件是一种计算机文件,它是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。简单的说,文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。

二进制文件:是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。用户一般不能直接读懂它们,只有通过相应的软件才能将其显示出来。二进制文件一般是可执行程序、图形、图像、声音等等。

从上面可以看出文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异,文本文件基本上是定长编码的(也有非定长的编码如UTF-8)。而二进制文件则可看成是变长编码,因为是值编码,多少个比特代表一个值,完全由你决定。

2、存储方式上的区别

文本工具打开一个文件,首先读取文件物理上所对应的二进制比特流,然后按照所选择的解码方式来解释这个流,然后将解释结果显示出来。

一般来说,你选取的解码方式会是ASCII码形式(ASCII码的一个字符是8个比特),接下来,它8个比特8个比特地来解释这个文件流。

记事本无论打开什么文件都按既定的字符编码工作(如ASCII码),所以当他打开二进制文件时,出现乱码也是很必然的一件事情了,解码和译码不对应。

文本文件的存储与其读取基本上是个逆过程。而二进制文件的存取与文本文件的存取差不多,只是编/解码方式不同而已。

二进制文件就是把内存中的数据按其在内存中存储的形式原样输出到磁盘中存放,即存放的是数据的原形式。文本文件是把数据的终端形式的二进制数据输出到磁盘上存放,即存放的是数据的终端形式

(7)文本文件可以由多种编码的字符组成吗扩展阅读

文本文件和二进制文件的优缺点:

一般认为,文本文件编码基于字符定长,译码容易些;二进制文件编码是变长的,所以它灵活,存储利用率要高些,译码难一些(不同的二进制文件格式,有不同的译码方式)。

关于空间利用率,想想看,二进制文件甚至可以用一个比特来代表一个意思(位操作),而文本文件任何一个意思至少是一个字符.

在windows下,文本文件不一定是以ASCII来存贮的,因为ASCII码只能表示128的标识,你打开一个txt文档,然后另存为,有个选项是编码,可以选择存贮格式,一般来说UTF-8编码格式兼容性要好一些.而二进制用的计算机原始语言,不存在兼容性。

存储方式的区别:

如果存储的是字符数据,无论采用文本文件还是二进制文件都是没有任何区别的。

如果存储的是非字符数据,又要看我们使用的情况来决定:

1、如果是需要频繁的保存和访问数据,那么应该采取二进制文件进行存放,这样可以节省存储空间和转换时间。

2、如果需要频繁的向终端显示数据或从终端读入数据,那么应该采用文本文件进行存放,这样可以节省转换时间。

⑻ 文本文件和.txt文件是一回事吗

广义上是一样的

文本文件是一种由若干行字符构成的计算机文件。
格式有
ASCII
MIME
.txt
.txt是包含极少格式信息的文字文件的扩展名。.txt格式并没有明确的定义,它通常是指那些能够被系统终端或者简单的文本编辑器接受的格式。任何能读取文字的程序都能读取带有.txt扩展名的文件,因此,通常认为这种文件是通用的、跨平台的。
在英文文本文件中,ASCII字符集是最为常见的格式,而且在许多场合,它也是默认的格式。对于带重音符号的和其它的非ASCII字符,必须选择一种字符编码。在很多系统中,字符编码是由计算机的区域设置决定的。常见的字符编码包括支持许多欧洲语言的ISO 8859-1。
由于许多编码只能表达有限的字符,通常它们只能用于表达几种语言。Unicode制定了一种试图能够表达所有已知语言的标准,Unicode字符集非常大,它囊括了大多数已知的字符集。Unicode有多种字符编码,其中最常见的是UTF-8,这种编码能够向后兼容ASCII,相同内容的的ASCII文本文件和UTF-8文本文件完全一致。

⑼ 什么是纯文本文件

问题一:什么是纯文本文件 纯文本文件是只有文字的(.txt)文件

问题二:文本文件是什么 文本文件是一种典型的顺序文件,其文件的逻辑结构又属于流式文件。
特别的是,文本文件是指以ASCII码方式(也称文本方式)存储的文件,更确切地说,英文、数字等字符存储的是ASCII码,而汉字存储的是机内码。文本文件中除了存储文件有效字符信息(包括能用ASCII码字符表示的回车、换行等信息)外,不能存储其他任何信息,因此文本文件不能存储声音、动画、图像、视频等信息。
设某个文件的内容是下面一行文字:
中华人民共和国 CHINA 1949。
如果以文本方式存储,机器中存储的是下面的代码(以十六进制表示,机器内部仍以二进制方式存储):
D6 D0 BB AA C8 CB C3 F1?B9 B2 BA CD B9 FA 20 43
48 49 4E 41 20 31 39 34?39 A1 A3
其中,D6D0、BBAA、C8CB、C3F1、B9B2、BACD、B9FA分别是“中华人民共和国ABCD” 七个汉字的机内码,20是空格的ASCII码,43、48、49、4E、41分别是五个英文字母“CHINA”的ASCII码,31、39、34、39分别是数字字符“1949”的ASCII编码,A1A3是标点“。”的机内码。
从上面可以看出,文本文件中信息是按单个字符编码存储的,如1949分别存储“1”、“9”、“4”、“9”这四个字符的ASCII编码,如果将1949存储为079D(对应二进制为0000 0111 1001 1101,即十进制1949的等值数),则该文件一定不是文本文件。

问题三:文本文档与文档的区别是什么? 文本文档是以txt结尾的文件,只能记录字符,基本没有格式或其他功能。能用任何字处理软件打开。
文档是各类程序使用的记录文件的统称。一般都要加上程序名(或结尾表示文档类型的字符)来详细指明文档类型。比如word文档,excel文档,pdf文档,bmp文档,等等。
文丹又叫文件,但一般文档是指记录文件,不包括可执行文件。文件是最大的概念,全部都是文件。

问题四:什么是文本格式 就是TXT后缀的文件
也就是记事本里写字后保存的格式文件。

问题五:什么是TXT文件 TXT就是纯文本格式,这种格式通俗来说就是存的都是普通文字。记事本确实典型的纯文本编辑器,可以打开和创建TXT格式的文叮。当然,用记事本也可以创建其他格式的文档,但原理上说只能以纯文本的方式来创建。

问题六:文本文档是什么格式 这是个通称啊厂常说的文本文档都是指txt,但用于文本编辑目的的软件创建的都叫文本文档啊。在linux下的话,文本文档就太多类型了,所以不用太执着于一种格式的。关键看文件性质。

问题七:纯文本文件时什么啊 纯文本文件是只有文字的(.txt)文件 (能用记事本看到有意义的字符,都是文本文件)
简单地说,格式化就是为磁盘做初始化的工作,以便我们能够按部就班地往磁盘上记录资料。好比我们有一所大房子要用来存放书籍,我们不会搬来书往屋里地上一扔了事,而是要先在里面支起书架,标上类别,把书分门别类地放好。
我们新购买的磁盘在使用之前,要能让操作系统认得它,要先写入一些磁性的记号到磁盘上的每一扇区,便可在该操作系统下取用磁盘上的数据,这个动作就称为格式化。

问题八:什么叫文本文件?????????????????????????? 文本文字就是只包含字符的文件,操作系统中,是以 .txt 为扩展名的,建立文本文件很简单,在文件夹中或是桌面上,右击,点新建,建立文本文件,将文件名改ip.txt.(如果你的文件夹属性没有将隐藏已知扩展名前面的勾去掉,那.txt你是看不见,只显示文件名(即新建文本文件&础uot;),你改成ip就可以了,如果改成ip.txt就不一样了,因为文件的命名方式为:文件名.扩展名,因为你没有显示扩展名,你改成ip.txt的话,那文件的全名就是ip.txt.txt)

问题九:什么是文本文件和文本文档,它们有什么不同吗? 文本文件就是电脑上 开始 程序 附件 憨的“记事本”编辑的文件(扩展名为TXT)
文本文档就是 开始 程序 附件 里的“写字板”编辑的文件(扩展名为rtf或DOC)

问题十:文本文件和.txt文件是一回事吗? 广义上是一样的
文本文件是一种由若干行字符构成的计算机文件。
格式有
ASCII
MIME
.txt
.txt是包含极少格式信息的文字文件的扩展名。.txt格式并没有明确的定义,它通常是指那些能够被系统终端或者简单的文本编辑器接受的格式。任何能读取文字的程序都能读取带有.txt扩展名的文件,因此,通常认为这种文件是通用的、跨平台的。
在英文文本文件中,ASCII字符集是最为常见的格式,而且在许多场合,它也是默认的格式。对于带重音符号的和其它的非ASCII字符,必须选择一种字符编码。在很多系统中,字符编码是由计算机的区域设置决定的。常见的字符编码包括支持许多欧洲语言的ISO 8859-1。
由于许多编码只能表达有限的字符,通常它们只能用于表达几种语言。Unicode制定了一种试图能够表达所有已知语言的标准,Unicode字符集非常大,它囊括了大多数已知的字符集。Unicode有多种字符编码,其中最常见的是UTF-8,这种编码能够向后兼容ASCII,相同内容的的ASCII文本文件和UTF-8文本文件完全一致。

⑽ 什么是文本文件文本文件怎么创建

1、文本文件即文本文档,要创建文本文档,首先,右击电脑桌面的空白区域。
/iknow-pic.cdn.bcebos.com/342ac65c1038534304e4e79b9d13b07eca808865"target="_blank"title="点击查看大图"class="illustration_alink">/iknow-pic.cdn.bcebos.com/342ac65c1038534304e4e79b9d13b07eca808865?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_342ac65c1038534304e4e79b9d13b07eca808865"/>
2、然后在弹出的快捷菜单中点击“新建”选项。
/iknow-pic.cdn.bcebos.com/a8773912b31bb0515f57d392387adab44aede01d"target="_blank"title="点击查看大图"class="illustration_alink">/iknow-pic.cdn.bcebos.com/a8773912b31bb0515f57d392387adab44aede01d?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_a8773912b31bb0515f57d392387adab44aede01d"/>
3、接着在子菜单中点击“文本文档”。
/iknow-pic.cdn.bcebos.com/574e9258d109b3dedf0384d2c2bf6c81810a4ccf"target="_blank"title="点击查看大图"class="illustration_alink">/iknow-pic.cdn.bcebos.com/574e9258d109b3dedf0384d2c2bf6c81810a4ccf?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_574e9258d109b3dedf0384d2c2bf6c81810a4ccf"/>
4、通过以上操作,我们就在电脑桌面上新建了一个文本文档了。
/iknow-pic.cdn.bcebos.com/b3fb43166d224f4af59610a907f790529822d179"target="_blank"title="点击查看大图"class="illustration_alink">/iknow-pic.cdn.bcebos.com/b3fb43166d224f4af59610a907f790529822d179?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_b3fb43166d224f4af59610a907f790529822d179"/>