⑴ 文本文件和二進制文件的區別是什麼
文本文件是指完全由可見字元組成的文件。所謂可見字元是指ASCII碼為32到126的字元、回車符(ASCII碼13)、換行符(ASCII碼10)、製表符(ASCII碼9)、以及所有漢字字元(當然也包括其他字元集如韓文、日文、阿拉伯文等等)。如果是Unicode文本,則還包括ASCII碼0。
而二進制文件則有多種定義方式,廣義的二進制文件是指電腦中的所有文件(包括文本文件),因為電腦中的所有文件其實都是以二進制方式存儲的,也就是說每個字元(包括可見字元、控制字元)最終都是以0和1的形式存儲在硬碟等介質中的(這也就是為什麼說電腦只認識0和1這兩個數字的原因);
而狹義的二進制文件則是相對於文本文件而言的,即只要文件中含有除可見字元之外的其他字元(主要是控制字元),就是二進制文件;
而比狹義的二進制文件更有特指性的定義方式則是指可執行文件(EXE)、庫函數文件(DLL)、圖片視頻、資料庫文件等等一切由程序代碼、機器碼、特定的二進制代碼和數據等組成的有實際意義的文件。
⑵ 文本編碼共有多少種有什麼用為什麼很多系統自動生成的文件都是亂碼
文本編碼常見的是UTF-8、ansi、Unicode等,一般UTF-8更常見,因為UTF-8支持中文字元,更多的我就不知道了,系統自動生成的文件編碼格式不一樣,所以如果沒有對應的打開方式就會出現亂碼,然後不是所有的文件都可以用文本方式打開,TXT只能打開以字元形式保存的文件,所以像一些視頻、音頻、圖片或者可執行文件都是不能用TXT打開的,最後星號是經過演算法加密的,你只能在輸入密碼的時候以明文方式查看。
⑶ 如何在一個文本文件里使用兩種不同的文字編碼
應該不行吧
打開一個文件就決定了這個文件的編碼
如果要在同一個文件中實現不同編碼的文本
這個文本編輯器
必須能夠識別文本
轉換後顯示
或者通過某個標識識別某段文字的編碼方式,通過程序去取
你要做什麼呢
如果是在一短代碼讀取不同編碼配置
用xml應該可以標識出來
⑷ 請問下,為什麼說word是二進制文件
英文:Binary files - 包含在 ASCII 及擴展 ASCII 字元中編寫的數據或程序指令的文件。計算機文件基本上分為二種:二進制文件和 ASCII(也稱純文本)文件,圖形文件及文字處理程序等計算機程序都屬於二進制文件。這些文件含有特殊的格式及計算機代碼。ASCII 則是可以用任何文字處理程序閱讀的簡單文本文件。
廣義的二進制文件即指文件,由文件在外部設備的存放形式為二進制而得名。狹義的二進制文件即除文本文件以外的文件。文本文件是一種由很多行字元構成的計算機文件。文本文件存在於計算機系統中,通常在文本文件最後一行放置文件結束標志。文本文件的編碼基於字元定長,解碼相對要容易一些;二進制文件編碼是變長的,靈活利用率要高,而解碼要難一些,不同的二進制文件解碼方式是不同的。 從本質上來說他們之間沒有什麼區別,因為他們在硬碟上都有一種的存放方式--二進制,但是如果要對他們有些區分的話,那可以這樣理解。我們現在的每個字元由一個或多個位元組組成,每個位元組都是用的-128—127之間的部分數值來表示的,也就是說,-128——127之間還有一些數據沒有對應任何字元的任何位元組。如果一個文件中的每個位元組的內容都是可以表示成字元的數據,我們就可以稱這個文件為文本文件,可見,文本文件只是二進制文件中的一種特例,為了與文本文件相區別,人們又把除了文本文件以外的文件稱為二進制文件,由於很難嚴格區分文本文件和二進制文件的概念,所以我們可以簡單地認為,如果一個文件專門用於存儲文本字元的數據,沒有包含字元以外的其他數據,我們就稱之為文本文件,除此之外的文件就是二進制文件。
以上是引用的二進制文件的說明,一般意義上講,文本文件你用記事本打開看到的都是正常的字元或文字,沒有任何的格式,只是一些字元或文字的集合。只要其中加了格式的話,或引用的表格、圖片等,就都是二進制文件了
⑸ 在C語言中,文件按存儲形式劃分可分為-----和-----
在C語言中文件按存儲形式可劃分為文本文件和二進制文件,文本文件又稱純文本文件。
文本文件是一種計算機文件,它是一種典型的順序文件,其文件的邏輯結構又屬於流式文件。文本文件是指以ASCII碼方式(也稱文本方式)存儲的文件,更確切地說,英文、數字等字元存儲的是ASCII碼,而漢字存儲的是機內碼。文本文件中除了存儲文件有效字元信息(包括能用ASCII碼字元表示的回車、換行等信息)外,不能存儲其他任何信息。
二進制文件是指包含在 ASCII及擴展 ASCII 字元中編寫的數據或程序指令的文件,廣義的二進制文件即指文件,由文件在外部設備的存放形式為二進制而得名。狹義的二進制文件即除文本文件以外的文件。文本文件是一種由很多行字元構成的計算機文件。文本文件存在於計算機系統中,通常在文本文件最後一行放置文件結束標志。文本文件的編碼基於字元定長,解碼相對要容易一些;二進制文件編碼是變長的,靈活利用率要高,而解碼要難一些,不同的二進制文件解碼方式是不同的。
⑹ 什麼是文本文件和文本文檔,它們有什麼不同嗎
一、主體不同
1、文本文件:是一種計算機文件,是一種典型的順序文件,其文件的邏輯結構又屬於流式文件。
2、文本文檔:以TXT後綴名的文件。
二、存儲方式不同
1、文本文件:以ASCII碼方式(也稱文本方式)存儲的文件,除了存儲文件有效字元信息(包括能用ASCII碼字元表示的回車、換行等信息)外,不能存儲其他任何信息。
2、文本文檔:是微軟在操作系統上附帶的一種文本格式,是最常見的一種文件格式,早在DOS時代應用就很多,主要存文本信息,即為文字信息。
三、特點不同
1、文本文件:在文本文件最後一行後放置文件結束標志來指明文件的結束。
2、文本文檔:由可列印字元組成,人可以直接閱讀和理解其形式。
⑺ 二進制文件與文本文件的區別
在定義和存取方式上二進制文件與文本文件存在區別。
1、定義上的區別
文本文件:文本文件是一種計算機文件,它是一種典型的順序文件,其文件的邏輯結構又屬於流式文件。簡單的說,文本文件是基於字元編碼的文件,常見的編碼有ASCII編碼,UNICODE編碼等等。
二進制文件:是基於值編碼的文件,你可以根據具體應用,指定某個值是什麼意思(這樣一個過程,可以看作是自定義編碼)。用戶一般不能直接讀懂它們,只有通過相應的軟體才能將其顯示出來。二進制文件一般是可執行程序、圖形、圖像、聲音等等。
從上面可以看出文本文件與二進制文件的區別並不是物理上的,而是邏輯上的。這兩者只是在編碼層次上有差異,文本文件基本上是定長編碼的(也有非定長的編碼如UTF-8)。而二進制文件則可看成是變長編碼,因為是值編碼,多少個比特代表一個值,完全由你決定。
2、存儲方式上的區別
文本工具打開一個文件,首先讀取文件物理上所對應的二進制比特流,然後按照所選擇的解碼方式來解釋這個流,然後將解釋結果顯示出來。
一般來說,你選取的解碼方式會是ASCII碼形式(ASCII碼的一個字元是8個比特),接下來,它8個比特8個比特地來解釋這個文件流。
記事本無論打開什麼文件都按既定的字元編碼工作(如ASCII碼),所以當他打開二進制文件時,出現亂碼也是很必然的一件事情了,解碼和解碼不對應。
文本文件的存儲與其讀取基本上是個逆過程。而二進制文件的存取與文本文件的存取差不多,只是編/解碼方式不同而已。
二進制文件就是把內存中的數據按其在內存中存儲的形式原樣輸出到磁碟中存放,即存放的是數據的原形式。文本文件是把數據的終端形式的二進制數據輸出到磁碟上存放,即存放的是數據的終端形式
(7)文本文件可以由多種編碼的字元組成嗎擴展閱讀
文本文件和二進制文件的優缺點:
一般認為,文本文件編碼基於字元定長,解碼容易些;二進制文件編碼是變長的,所以它靈活,存儲利用率要高些,解碼難一些(不同的二進制文件格式,有不同的解碼方式)。
關於空間利用率,想想看,二進制文件甚至可以用一個比特來代表一個意思(位操作),而文本文件任何一個意思至少是一個字元.
在windows下,文本文件不一定是以ASCII來存貯的,因為ASCII碼只能表示128的標識,你打開一個txt文檔,然後另存為,有個選項是編碼,可以選擇存貯格式,一般來說UTF-8編碼格式兼容性要好一些.而二進制用的計算機原始語言,不存在兼容性。
存儲方式的區別:
如果存儲的是字元數據,無論採用文本文件還是二進制文件都是沒有任何區別的。
如果存儲的是非字元數據,又要看我們使用的情況來決定:
1、如果是需要頻繁的保存和訪問數據,那麼應該採取二進制文件進行存放,這樣可以節省存儲空間和轉換時間。
2、如果需要頻繁的向終端顯示數據或從終端讀入數據,那麼應該採用文本文件進行存放,這樣可以節省轉換時間。
⑻ 文本文件和.txt文件是一回事嗎
廣義上是一樣的
文本文件是一種由若干行字元構成的計算機文件。
格式有
ASCII
MIME
.txt
.txt是包含極少格式信息的文字文件的擴展名。.txt格式並沒有明確的定義,它通常是指那些能夠被系統終端或者簡單的文本編輯器接受的格式。任何能讀取文字的程序都能讀取帶有.txt擴展名的文件,因此,通常認為這種文件是通用的、跨平台的。
在英文文本文件中,ASCII字元集是最為常見的格式,而且在許多場合,它也是默認的格式。對於帶重音符號的和其它的非ASCII字元,必須選擇一種字元編碼。在很多系統中,字元編碼是由計算機的區域設置決定的。常見的字元編碼包括支持許多歐洲語言的ISO 8859-1。
由於許多編碼只能表達有限的字元,通常它們只能用於表達幾種語言。Unicode制定了一種試圖能夠表達所有已知語言的標准,Unicode字元集非常大,它囊括了大多數已知的字元集。Unicode有多種字元編碼,其中最常見的是UTF-8,這種編碼能夠向後兼容ASCII,相同內容的的ASCII文本文件和UTF-8文本文件完全一致。
⑼ 什麼是純文本文件
問題一:什麼是純文本文件 純文本文件是只有文字的(.txt)文件
問題二:文本文件是什麼 文本文件是一種典型的順序文件,其文件的邏輯結構又屬於流式文件。
特別的是,文本文件是指以ASCII碼方式(也稱文本方式)存儲的文件,更確切地說,英文、數字等字元存儲的是ASCII碼,而漢字存儲的是機內碼。文本文件中除了存儲文件有效字元信息(包括能用ASCII碼字元表示的回車、換行等信息)外,不能存儲其他任何信息,因此文本文件不能存儲聲音、動畫、圖像、視頻等信息。
設某個文件的內容是下面一行文字:
中華人民共和國 CHINA 1949。
如果以文本方式存儲,機器中存儲的是下面的代碼(以十六進製表示,機器內部仍以二進制方式存儲):
D6 D0 BB AA C8 CB C3 F1?B9 B2 BA CD B9 FA 20 43
48 49 4E 41 20 31 39 34?39 A1 A3
其中,D6D0、BBAA、C8CB、C3F1、B9B2、BACD、B9FA分別是「中華人民共和國ABCD」 七個漢字的機內碼,20是空格的ASCII碼,43、48、49、4E、41分別是五個英文字母「CHINA」的ASCII碼,31、39、34、39分別是數字字元「1949」的ASCII編碼,A1A3是標點「。」的機內碼。
從上面可以看出,文本文件中信息是按單個字元編碼存儲的,如1949分別存儲「1」、「9」、「4」、「9」這四個字元的ASCII編碼,如果將1949存儲為079D(對應二進制為0000 0111 1001 1101,即十進制1949的等值數),則該文件一定不是文本文件。
問題三:文本文檔與文檔的區別是什麼? 文本文檔是以txt結尾的文件,只能記錄字元,基本沒有格式或其他功能。能用任何字處理軟體打開。
文檔是各類程序使用的記錄文件的統稱。一般都要加上程序名(或結尾表示文檔類型的字元)來詳細指明文檔類型。比如word文檔,excel文檔,pdf文檔,bmp文檔,等等。
文丹又叫文件,但一般文檔是指記錄文件,不包括可執行文件。文件是最大的概念,全部都是文件。
問題四:什麼是文本格式 就是TXT後綴的文件
也就是記事本里寫字後保存的格式文件。
問題五:什麼是TXT文件 TXT就是純文本格式,這種格式通俗來說就是存的都是普通文字。記事本確實典型的純文本編輯器,可以打開和創建TXT格式的文叮。當然,用記事本也可以創建其他格式的文檔,但原理上說只能以純文本的方式來創建。
問題六:文本文檔是什麼格式 這是個通稱啊廠常說的文本文檔都是指txt,但用於文本編輯目的的軟體創建的都叫文本文檔啊。在linux下的話,文本文檔就太多類型了,所以不用太執著於一種格式的。關鍵看文件性質。
問題七:純文本文件時什麼啊 純文本文件是只有文字的(.txt)文件 (能用記事本看到有意義的字元,都是文本文件)
簡單地說,格式化就是為磁碟做初始化的工作,以便我們能夠按部就班地往磁碟上記錄資料。好比我們有一所大房子要用來存放書籍,我們不會搬來書往屋裡地上一扔了事,而是要先在裡面支起書架,標上類別,把書分門別類地放好。
我們新購買的磁碟在使用之前,要能讓操作系統認得它,要先寫入一些磁性的記號到磁碟上的每一扇區,便可在該操作系統下取用磁碟上的數據,這個動作就稱為格式化。
問題八:什麼叫文本文件?????????????????????????? 文本文字就是只包含字元的文件,操作系統中,是以 .txt 為擴展名的,建立文本文件很簡單,在文件夾中或是桌面上,右擊,點新建,建立文本文件,將文件名改ip.txt.(如果你的文件夾屬性沒有將隱藏已知擴展名前面的勾去掉,那.txt你是看不見,只顯示文件名(即新建文本文件&礎uot;),你改成ip就可以了,如果改成ip.txt就不一樣了,因為文件的命名方式為:文件名.擴展名,因為你沒有顯示擴展名,你改成ip.txt的話,那文件的全名就是ip.txt.txt)
問題九:什麼是文本文件和文本文檔,它們有什麼不同嗎? 文本文件就是電腦上 開始 程序 附件 憨的「記事本」編輯的文件(擴展名為TXT)
文本文檔就是 開始 程序 附件 里的「寫字板」編輯的文件(擴展名為rtf或DOC)
問題十:文本文件和.txt文件是一回事嗎? 廣義上是一樣的
文本文件是一種由若干行字元構成的計算機文件。
格式有
ASCII
MIME
.txt
.txt是包含極少格式信息的文字文件的擴展名。.txt格式並沒有明確的定義,它通常是指那些能夠被系統終端或者簡單的文本編輯器接受的格式。任何能讀取文字的程序都能讀取帶有.txt擴展名的文件,因此,通常認為這種文件是通用的、跨平台的。
在英文文本文件中,ASCII字元集是最為常見的格式,而且在許多場合,它也是默認的格式。對於帶重音符號的和其它的非ASCII字元,必須選擇一種字元編碼。在很多系統中,字元編碼是由計算機的區域設置決定的。常見的字元編碼包括支持許多歐洲語言的ISO 8859-1。
由於許多編碼只能表達有限的字元,通常它們只能用於表達幾種語言。Unicode制定了一種試圖能夠表達所有已知語言的標准,Unicode字元集非常大,它囊括了大多數已知的字元集。Unicode有多種字元編碼,其中最常見的是UTF-8,這種編碼能夠向後兼容ASCII,相同內容的的ASCII文本文件和UTF-8文本文件完全一致。
⑽ 什麼是文本文件文本文件怎麼創建
1、文本文件即文本文檔,要創建文本文檔,首先,右擊電腦桌面的空白區域。
/iknow-pic.cdn.bcebos.com/342ac65c1038534304e4e79b9d13b07eca808865"target="_blank"title="點擊查看大圖"class="illustration_alink">/iknow-pic.cdn.bcebos.com/342ac65c1038534304e4e79b9d13b07eca808865?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_342ac65c1038534304e4e79b9d13b07eca808865"/>
2、然後在彈出的快捷菜單中點擊「新建」選項。
/iknow-pic.cdn.bcebos.com/a8773912b31bb0515f57d392387adab44aede01d"target="_blank"title="點擊查看大圖"class="illustration_alink">/iknow-pic.cdn.bcebos.com/a8773912b31bb0515f57d392387adab44aede01d?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_a8773912b31bb0515f57d392387adab44aede01d"/>
3、接著在子菜單中點擊「文本文檔」。
/iknow-pic.cdn.bcebos.com/574e9258d109b3dedf0384d2c2bf6c81810a4ccf"target="_blank"title="點擊查看大圖"class="illustration_alink">/iknow-pic.cdn.bcebos.com/574e9258d109b3dedf0384d2c2bf6c81810a4ccf?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_574e9258d109b3dedf0384d2c2bf6c81810a4ccf"/>
4、通過以上操作,我們就在電腦桌面上新建了一個文本文檔了。
/iknow-pic.cdn.bcebos.com/b3fb43166d224f4af59610a907f790529822d179"target="_blank"title="點擊查看大圖"class="illustration_alink">/iknow-pic.cdn.bcebos.com/b3fb43166d224f4af59610a907f790529822d179?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto"esrc="//www.yourecards.net/pic_b3fb43166d224f4af59610a907f790529822d179"/>