A. 計算機常用的信息編碼有哪幾種
計算機常用的編碼有:ASCII碼,漢字編碼等
字元編碼就是以二進制的數字來對應字元集的字元,目前用得最普遍的字元集是ANSI,對應ANSI字元集的二進制編碼就稱為ANSI碼,DOS和Windows系統都使用了ANSI碼,但在系統中使用的字元編碼要經過二進制轉換,稱為系統內碼。
漢字進入計算機的三種途徑:
①機器自動識別漢字:計算機通過「視覺」裝置(光學字元閱讀器或其他),用光電掃描等方法識別漢字。
②通過語音識別輸入:計算機利用人們給它配備的「聽覺器官」,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
③通過漢字編碼輸入:根據一定的編碼方法,由人藉助輸入設備將漢字輸入計算機。
以上內容參考:網路-漢字編碼
B. 文本編碼共有多少種有什麼用為什麼很多系統自動生成的文件都是亂碼
文本編碼常見的是UTF-8、ansi、Unicode等,一般UTF-8更常見,因為UTF-8支持中文字元,更多的我就不知道了,系統自動生成的文件編碼格式不一樣,所以如果沒有對應的打開方式就會出現亂碼,然後不是所有的文件都可以用文本方式打開,TXT只能打開以字元形式保存的文件,所以像一些視頻、音頻、圖片或者可執行文件都是不能用TXT打開的,最後星號是經過演算法加密的,你只能在輸入密碼的時候以明文方式查看。
C. 有關防偽稅控開票系統的客戶編碼,超過100個客戶要怎樣編碼
1、有關防偽稅控開票系統的客戶編碼,超過100個客戶的編碼是:
企業初設置編碼可以從001開始,到了100個,就是100;到了900個,就是900。
2、防偽稅控系統集計算機、微電子、光電技術以及數據加密等技術為一體。取消了手工開票的方法,使用防偽稅控開票子系統電腦開具增值稅專用發票。整個系統以增值稅專用發票為核心,從發售發票時的源頭控制,發票填開時的防偽與計稅、到發票抵扣時的識偽,以及增值稅專用發票的抄報稅等各個環節提供了強有力的監控手段,即通過票源、稅源控制和防偽、識偽技術達到對增值稅專用發票防偽和稅控的雙重功效。
D. 對於一種文字處理系統,漢字輸入碼可以多種多樣,而內碼__________。
應該是A,裡面提到對於一種文字處理系統,如果在不同的系統可以有不同的內碼,如GB碼,BIG5碼,Unicode碼等。Unicode碼也是一種國際標准編碼,採用二個位元組編碼,與ANSI碼不兼容。目前,在網路、Windows系統和很多大型軟體中得到應用。比如「碼」在word里的編碼是10位Unicode編碼,是30721,在TXT,excel文檔里的編碼是GB碼,是49899.
E. ERP系統物料編碼原則是什麼
大多數的ERP系統採用的是等級形式的分類編碼,例如003.01.1770.004。這種編碼運用了成組技術,按照物料的規格、特性、使用情況等相似性,把物料分門別類。
分類編碼之所以在ERP系統中被廣泛應用,是因為它具有很大的優點。易維護、易檢索、編碼格式簡潔一致,非常適合計算機處理,便於分析統計。由於物料編碼被歸類存儲,很容易找到相似的一批物料,給物料的管理帶來了很大的方便。但是分類編碼也存在著一些不足。
ERP系統中另外一種編碼,就是多屬性編碼。這種編碼的依據,是根據物料的各種屬性的唯一性,在此基礎上發展出來的一種組合型編碼。物料的屬性,包括規格、材質等基本參數,也可以是名稱、圖號等物料標識。
無論物料的名稱如何變化,其屬性永遠是唯一的,因此用屬性來作為編碼可以保證物料在系統中的唯一性。而且,多屬性編碼可以融合原有的編碼體系,使新舊編碼在ERP系統的實施過程中順利過渡。
(5)一個系統可以採取多種編碼擴展閱讀
編碼的目的在於將物料化繁為簡,便於物料的管理,如果編碼過於繁雜,則違反了編碼之目的。因此物料編碼在應用文字元號或數字上應力求簡單明了,這樣可節省閱讀、填寫、抄錄的時間與手續,並可減少其中的錯誤機會。
物料相當單純時,只要將物料簡單分類為幾項即可,物料分類項目多了,就顯得很不方便。若物料相當復雜時,就要將大分類再加以細分,這種分類展開也稱為多級分類。
F. 計算機中漢字系統的編碼都是什麼其作用各是什麼
編碼磁條是一種特殊結構的磁記錄數據帶,每一單位編碼磁條具有一組固定的、永久不可改變的編碼。每個固定編碼可以是唯一的編碼;固定唯一編碼是每一磁條卡折與銀行主機通訊時准確核實其合法性的鑰匙;製造時編碼永久固化在磁條結構中,且無法刪除、更改、復制、磁化;編碼磁條可用普通讀寫器讀寫磁條非編碼部分,使用方法與普通讀寫器完全相同,操作簡單。
G. 計算機字元編碼都有哪些
計算機通用的字元編碼:ASCII碼ASCII(American Standard Code for Information Interchange,美國信息互換標准代碼)是基於拉丁字母的一套電腦編碼系統。它主要用於顯示現代英語和其他西歐語言。它是現今最通用的單位元組編碼系統,並等同於國際標准ISO/IEC 646。H. wcdma系統中數據業務採用什麼信道編碼
一、wcdma系統中數據業務採用Turbo和卷積碼信道編碼
二、Turbo碼是Claude.Berrou等人在1993年首次提出的一種級聯碼。基本原理是編碼器通過交織器把兩個分量編碼器進行並行級聯,兩個分量編碼器分別輸出相應的校驗位比特;解碼器在兩個分量解碼器之間進行迭代解碼,分量解碼器之間傳遞去掉正反饋的外信息,這樣整個解碼過程類似渦輪(Turbo)工作。因此,這個編碼方法又被形象地稱為Turbo碼。
三、卷積碼將k個信息比特編成n個比特,但k和n通常很小,特別適合以串列形式進行傳輸,時延小。
四、Turbo碼具有卓越的糾錯性能,性能接近香農限,而且編解碼的復雜度不高。Turbo碼有一重要特點是其解碼較為復雜,比常規的卷積碼要復雜的多,這種復雜不僅在於其解碼要Turbo碼採用迭代的過程,而且採用的演算法本身也比較復雜。這些演算法的關鍵是不但要能夠對每比特進行解碼,而且還要伴隨著解碼給出每比特譯出的可靠性信息,有了這些信息,迭代才能進行下去。用於Turbo碼解碼的具體演算法有:MAP(Maximum A Posterior)
I. 在計算機系統內部使用的漢字編碼是_____
機內碼。
漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。
機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。
(9)一個系統可以採取多種編碼擴展閱讀
漢字進入計算機的三種途徑分別為:
1、機器自動識別漢字
計算機通過「視覺」裝置(光學字元閱讀器或其他),用光電掃描等方法識別漢字。
2、通過語音識別輸入
計算機利用人們給它配備的「聽覺器官」,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
3、通過漢字編碼輸入
根據一定的編碼方法,由人藉助輸入設備將漢字輸入計算機。
機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由於難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。
J. 計算機內部處理漢字所採用的編碼形式
什麼是 Unicode?
歷史上, 有兩個獨立的, 創立單一字元集的嘗試. 一個是國際標准化組織(ISO)的 ISO 10646 項目, 另一個是由(一開始大多是美國的)多語言軟體製造商組成的協會組織的 Unicode 項目. 幸運的是, 1991年前後, 兩個項目的參與者都認識到, 世界不需要兩個不同的單一字元集. 它們合並雙方的工作成果, 並為創立一個單一編碼表而協同工作. 兩個項目仍都存在並獨立地公布各自的標准, 但 Unicode 協會和 ISO/IEC JTC1/SC2 都同意保持 Unicode 和 ISO 10646 標準的碼表兼容, 並緊密地共同調整任何未來的擴展.
Unicode vs ISO 10646
Unicode 協會公布的 Unicode 標准 嚴密地包含了 ISO 10646-1 實現級別3的基本多語言面. 在兩個標准里所有的字元都在相同的位置並且有相同的名字.
Unicode 標准額外定義了許多與字元有關的語義符號學, 一般而言是對於實現高質量的印刷出版系統的更好的參考. Unicode 詳細說明了繪制某些語言(比如阿拉伯語)表達形式的演算法, 處理雙向文字(比如拉丁與希伯來文混合文字)的演算法和 排序與字元串比較 所需的演算法, 以及其他許多東西.
另一方面, ISO 10646 標准, 就象廣為人知的 ISO 8859 標准一樣, 只不過是一個簡單的字元集表. 它指定了一些與標准有關的術語, 定義了一些編碼的別名, 並包括了規范說明, 指定了怎樣使用 UCS 連接其他 ISO 標準的實現, 比如 ISO 6429 和 ISO 2022. 還有一些與 ISO 緊密相關的, 比如 ISO 14651 是關於 UCS 字元串排序的.
考慮到 Unicode 標准有一個易記的名字, 且在任何好的書店裡的 Addison-Wesley 里有, 只花費 ISO 版本的一小部分, 且包括更多的輔助信息, 因而它成為使用廣泛得多的參考也就不足為奇了. 然而, 一般認為, 用於列印 ISO 10646-1 標準的字體在某些方面的質量要高於用於列印 Unicode 2.0的. 專業字體設計者總是被建議說要兩個標准都實現, 但一些提供的樣例字形有顯著的區別. ISO 10646-1 標准同樣使用四種不同的風格變體來顯示表意文字如中文, 日文和韓文 (CJK), 而 Unicode 2.0 的表裡只有中文的變體. 這導致了普遍的認為 Unicode 對日本用戶來說是不可接收的傳說, 盡管是錯誤的.
ASCⅡ碼
計算機內部採用二進制的方式計數,那麼它為什麼又能識別十進制數和各種字元、圖形呢?其實,不論是數值數據還是文字、圖形等,在計算機內部都採用了一種編碼標准。通過編碼標准可以把它轉換成二進制數來進行處理,計算機將這些信息處理完畢再轉換成可視的信息顯示出來。常用的字元代碼是ASCII碼,它原來是美國的國家標准,1967年被定為國際標准。
ASCII碼由8位二進制數組成,其中最高位為較驗位,用於傳輸過程檢驗數據正確性。其餘7位二進制數表示一個字元,共有128種組合。如回車的ASCII碼為0001101(13),空格的ASCII碼為0100000(32),「0」 的ASCII碼為0110000(48),「A」 的ASCII碼為1000001(65),「a」的ASCII碼為1100001(97)。
Hanzi bianma漢字編碼Chinese character encoding
為漢字設計的一種便於輸入計算機的代碼。由於電子計算機現有的輸入鍵盤與英文打字機鍵盤完全兼容。因而如何輸入非拉丁字母的文字(包括漢字)便成了多年來人們研究的課題。
漢字信息處理系統一般包括編碼、輸入、存儲、編輯、輸出和傳輸。編碼是關鍵。不解決這個問題,漢字就不能進入計算機。
漢字進入計算機的三種途徑 分別為:
①機器自動識別漢字:計算機通過「視覺」裝置(光學字元閱讀器或其他),用光電掃描等方法識別漢字。
②通過語音識別輸入:計算機利用人們給它配備的「聽覺器官」,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
③通過漢字編碼輸入:根據一定的編碼方法,由人藉助輸入設備將漢字輸入計算機。
機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由於難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。
漢字編碼的困難點 漢字進入計算機,有許多困難,其原因主要有三點:
①數量龐大:隨著社會的發展,新字不斷出現,死字沒有淘汰,漢字總數不斷增多。一般認為,現在漢字總數已超過6萬個(包括簡化字)。雖有研究者主張規定3000多或4000字作為當代通用漢字,但仍比處理由二三十個字母組成的拼音文字要困難得多。
②字形復雜:有古體今體,繁體簡體,正體異體;而且筆畫相差懸殊,少的一筆,多的達36筆,簡化後平均為9.8筆。
③存在大量一音多字和一字多音的現象:漢語音節416個,分聲調後為1295個(根據《現代漢語詞典》統計,輕聲39個未計)。以1萬個漢字計算,每個不帶調的音節平均超過24個漢字,每個帶調音節平均超過7.7個漢字。有的同音同調字多達66個。一字多音現象也很普遍。
五種類型的編碼法 據粗略統計,現有400多種編碼方案,其中上機通過試驗的和已被採用作為輸入方式的也有數十種之多。歸納起來,不外5種類型:
①整字輸入法:前一階段,一般是將三四千個常用漢字排列在一個具有三四百個鍵位的大鍵盤上。近來,大多是將這些漢字按XY坐標排列在一張字表上,通常叫「 字表法」,或「筆觸字表法」。比如,X25行和Y90列交叉的字為「國」,當電筆點到字表上的「國」字時,機器自動將該字的代碼2590輸入。鍵盤上或字表中字按部首或按音序或按字義聯想而排列。不常用的字作為盤外字或表外字,另行編碼處理。
②字形分解法:將漢字的形體分解成筆畫或部件,按一定順序輸進機器。筆畫一般分成 8種:橫(一)、豎(丨)、撇(丿)、點(丶)、折(□)、彎(□)、叉(十)、方(口)。部件一般歸納出一二百個。由於一般鍵盤上只有42個鍵(包括數字和標點),容納不下這么多部件,因而有人設計中鍵盤,也有人利用部件形體上的相似點或出現概率的不同,而把100多個部件分布在26個字母鍵上。
③字形為主、字音為輔的編碼法:這種編碼法與字形分解法的不同在於還要利用某些字音信息。如有的方案為了簡化編碼規則,縮短碼長,在字形碼上附加字音碼,有的方案為了採用標准英文電傳機,將分解歸納出來的字素通過關系字的讀音轉化為拉丁字母。
④全拼音輸入法:絕大多數是以現行的漢語拼音方案為基礎進行設計。關鍵問題是區分同音字,因而有的方案提出「以詞定字」的方法,還有的方案提出「拼音-漢字轉換法」,即「漢語拼音輸入 ——機內軟體變換(實為查機器詞表)——漢字輸出」系統。
⑤拼音為主、字形為輔的編碼法:一般在拼音碼前面或後面再添加一些字形碼。拼音碼有用現行漢語拼音方案或稍加簡化的,還有的為了縮短碼長而把聲母和韻母都用單字母或單字鍵表示的「雙拼方案」或「雙打方案」。如F鍵既表聲母F,又表韻母ang,連擊兩下,便是Fang「方」字。區分同音字的字形碼也多種多樣。除了大部分採用偏旁部首的信息外,還有採用起末筆或採用語義類別的。
上述各種編碼法,各有短長。例如,字表法的特點是一字一格(鍵),無重碼,直觀性好,操作簡單。缺點是需特製鍵盤,速度較慢。字形分解法的好處是按形取碼,不涉及字音,因而不認識的字(包括生僻字、古字)也同樣可以編碼輸入;但漢字形體結構非常復雜,寫法也有許多差異,分解標准不易統一,因而不少方案規則較多。拼音輸入法(包括拼音-漢字轉換法)的優點是操作簡捷,可以「盲打」,不受漢字簡化、字形改變的影響,符合拼音化方向,並且還便於作進一步信息處理;缺點是不認識的字無法輸入;另外,如果不加字形碼或不用以詞定字法或顯式選擇法,同音字較難處理。
雙軌制編碼 漢語拼音推廣應用,並逐步過渡到漢字和漢語拼音文字並存並用,這是一種雙軌制。漢字信息處理領域中,音碼和形碼的並存並用,同樣是一種雙軌制。因此,不少人認為,採用雙軌制好,理由有以下5點:
①對掌握普通話的人來說,使用音碼比形碼方便,速度比較快。形碼雖然較慢,但能輸入任何漢字(包括古字)。採用雙軌,操作員認識的字可按音輸入,不認識的字按形輸入,會普通話的人可按音輸入,方音重的人可按形輸入。
②對於用字量少的單位,按音輸入無問題,但對用字量多的單位來說,按音輸入就不如按形輸入,因為一般人只能念出一部分漢字。
③按形輸入(尤其是整體輸入)對於中文信息處理的某類工作,如統計漢字,非常適合;但是對於其他類工作,例如統計漢語的音(聲韻調)則無能為力。按音輸入則正相反。雙軌正好是相輔相成。
④有的形碼可以照顧多種漢字(如日本的漢字、南朝鮮的漢字),而音碼能分詞連寫,便於作進一步的信息處理。
⑤適當的雙軌方案,不會增加設備上的麻煩。如不考慮採用整字輸入,一般均可使用現有的小鍵盤。
漢字編碼研究的新發展 除了單軌向雙軌發展之外,還有下列趨勢:
①混合式編碼法。筆觸字表示法中除整體字之外,增加一些部件或字元,可以解決盤外字問題,甚至能具有字形分解法的全部優點。而筆畫方案為了提高速度,一般也增加一些部件或整字。
②充分利用簡碼和詞彙碼。這樣可以提高輸入速度。因而人們為少量出現頻率高的字或詞設計了單字母和雙字母的簡碼。
詞彙碼也是提高速度的手段。有一種形碼方案的詞彙碼是根據每個字的部件規定的,如「漢字編碼」的詞彙碼是43、45、55、13(氵冖糹石)。另一種形碼方案的詞彙碼是利用計算機引導方式輸入的。例如,當「中」字輸入後,一按語詞鍵,屏幕上便顯示出「中國」、「中型」、「中性」、「中華」等雙音詞;選擇「 中國」後,如再按一下語詞鍵,便可顯示出「(中國)話」、「(中國)人民」、「(中國)共產黨、」、「(中國)工農紅軍」等詞或片語。音碼方案的詞彙碼實際上為片語碼,如 ZRG「中華人民共和國」,ZZXY「中國中文信息研究會」。詞彙碼不僅能提高速度,而且也能區別同碼。但是,如果用得太多,也會產生重碼。因此,有必要劃分通用詞彙碼和專業詞彙碼,以減少重碼。
③充分發揮「電腦」的作用,盡量減少「人腦」的負擔。上述計算機引導輸入法就是一例。還有的方案不斷以開窗口方式向操作員提供選擇的范圍。這樣,操作員不必再記憶大量的編碼規則。
編碼工作中的定型化和標准化編碼方案的定型化,即一般所說的選優工作,對計算機的普及應用非常重要。當然,定型或選優並不意味著只定一種或只選一種,而要照顧到多種用戶的需要。關於選優,曾提出多種評定標准,一般包括字碼無二義性、操作方便易學、輸入和處理效率高、存儲節省、傳輸可靠、設備經濟實用、組詞能力強。
編碼方案繁多,需要有一個統一的標准。1981年,國家標准局公布了《信息交換用漢字編碼字元集基本集》(簡稱漢字標准交換碼),共分兩級,一級3755 個字,二級3008個字,共6763個字。這種漢字標准交換碼是計算機的內部碼,可以為各種輸入輸出設備的設計提供統一的標准,使各種系統之間的信息交換有共同一致性,從而使信息資源的共享得以保證。目前,正在制定《信息交換用漢字編碼字元集輔助集》,以滿足少數用字量超過基本集的用戶和台灣、香港等地的需要。