生活妙招

當前位置 /首頁/生活妙招 > /列表

編碼有哪些

常用的編碼有以下方式:

編碼有哪些

1、ASCII碼。

ASCII碼,總共有128個,用一個字節的低7位表示,0到31是控制字符如換行回車刪除等。32到126是打印字符,可以通過鍵盤輸入並且能夠顯示出來。

2、ISO-8859-1。

128個字符顯然是不夠用的,於是ISO組織在ASCII碼基礎上又制定了一些列標準用來擴展ASCII編碼,它們是ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵蓋了大多數西歐語言字符,所有應用的最廣泛。ISO-8859-1仍然是單字節編碼,它總共能表示256個字符。

3、GB2312。

它的全稱是《信息交換用漢字編碼字符集基本集》,它是雙字節編碼,總的編碼範圍是A1到F7,其中從A到A9是符號區,總共包含682個符號,從B0到F7是漢字區,包含6763個漢字。

4、GBK。

全稱叫《漢字內碼擴展規範》,是國家技術監督局為windows95所制定的新的漢字內碼規範,它的出現是為了擴展GB2312,加入更多的漢字,它的編碼範圍是8140到FEFE(去掉XX7F)總共有23940個碼位,它能表示21003個漢字,它的編碼是和GB2312兼容的,也就是説用GB2312編碼的漢字可以用GBK來解碼,並且不會有亂碼。

5、GB18030。

全稱是《信息交換用漢字編碼字符集》,是我國的強制標準,它可能是單字節、雙字節或者四字節編碼,它的編碼與GB2312編碼兼容,這個雖然是國家標準,但是實際應用系統中使用的並不廣泛。

6、UTF-16。

UTF-16具體定義了Unicode字符在計算機中存取方法。UTF-16用兩個字節來表示Unicode轉化格式,這個是定長的表示方法,不論什麼字符都可以用兩個字節表示,兩個字節是16個bit,所以叫UTF-16。UTF-16表示字符非常方便,每兩個字節表示一個字符,這個在字符串操作時就大大簡化了操作,這也是Java以UTF-16作為內存的字符存儲格式的一個很重要的原因。

7、UTF-8。

UTF-16統一採用兩個字節表示一個字符,雖然在表示上非常簡單方便,但是也有其缺點,有很大一部分字符用一個字節就可以表示的現在要兩個字節表示,存儲空間放大了一倍,在現在的網絡帶寬還非常有限的今天,這樣會增大網絡傳輸的流量,而且也沒必要。而UTF-8採用了一種變長技術,每個編碼區域有不同的字碼長度。不同類型的字符可以是由1~6個字節組成。

TAG標籤:編碼 #