unicode編碼對照表,unicode編碼表查詢


unicode編碼對照表,unicode編碼表查詢

文章插圖
unicode編碼是什么?:
unicode編碼對照表,unicode編碼表查詢

文章插圖
Unicode是一種字符編碼方案,它為每種語言中的每個字符都設定了統一唯一的二進制編碼,以實現跨語言、跨平臺進行文本轉換、處理的要求 。
Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案 。目前的Unicode字符分為17組編排,0x0000至0x10FFFF,每組稱為平面,而每平面擁有65536個碼位,共1114112個 。
主要內容
為了使Unicode與已存在和廣泛使用的舊有編碼互相兼容,尤其是差不多所有電腦系統都支援的基本拉丁字母部分,所以Unicode的首256字符仍舊保留給ISO8859-1所定義的字符,使既有的西歐語系文字的轉換不需特別考量 。
另方面因相同的原因,Unicode把大量相同的字符重復編到不同的字符碼中去,使得舊有紛雜的編碼方式得以和Unicode編碼間互相直接轉換,而不會遺失任何資訊 。
舉例來說,全角格式區段包含了主要的拉丁字母的全角格式,在中文、日文、以及韓文字形當中,這些字符以全角的方式來呈現,而不以常見的半角形式顯示,這對豎排文字和等寬排列文字有重要作用 。
Unicode是什么???:
unicode編碼對照表,unicode編碼表查詢

文章插圖
Unicode是計算機科學領域里的一項業界標準,包括字符集、編碼方案等 。
Unicode 是為了解決傳統的字符編碼方案的局限而產生的,它為每種語言中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求 。1990年開始研發,1994年正式公布 。
Unicode通常用兩個字節表示一個字符,原有的英文編碼從單字節變成雙字節,只需要把高字節全部填為0就可以 。
因為Python的誕生比Unicode標準發布的時間還要早,所以最早的Python只支持ASCII編碼,普通的字符串'ABC'在Python內部都是ASCII編碼的 。
Unicode 是為了解決傳統的字符編碼方案的局限而產生的,例如ISO 8859所定義的字符雖然在不同的國家中廣泛地使用,可是在不同國家間卻經常出現不兼容的情況 。
很多傳統的編碼方式都有一個共同的問題,即容許電腦處理雙語環境,但卻無法同時支持多語言環境 。
擴展資料:
Unicode 兼容于 ASCII 字符并被大多數程序所支持,前128個 Unicode 碼同 ASCII 碼具有同樣的字節值;Unicode 字符從 U+0020 到 U+007E 等同與 ASCII 碼的 0x20 到 0x7E,不同于支持拉丁字母的7位 ASCII 。
Unicode 對每個字符進行16位值的編碼設置,它允許幾萬個字符,例如 Unicode 2.0 版包含 38,885 個字符,它也可以進行擴展,如UTF-16允許用16位字符組合為一百萬或更多的字符,UTF 將編碼轉換為真實的二進制位 。
Unicode 完全兼容于國際標準 ISO/IEC 10646-1; 1993,它是 ISO 10646 的一個子集,并支持用兩個八進制數的 ISO UCS-2 。
JavaScript 1.3 版本對 Unicode 的支持意味著您可以任意地在程序中使用本地的字符以及特殊的科學符號 。Unicode 提供了一種標準的方法來編碼多語言文本,并且因為它兼容于 ASCII,您也可以隨意使用 ASCII 字符 。
參考資料來源:百度百科-Unicode
unicode編碼是什么意思:
unicode編碼對照表,unicode編碼表查詢

文章插圖

到底什么是unicode 編碼?:
unicode編碼對照表,unicode編碼表查詢

文章插圖
這些東西沒用過,或者他們根本就不是unicode-16,而是UTF-8
unicode很容易和ASCII兼容,ASCII前面加1個等于0的字節就是unicode字符了 。
unicode并沒有全部漢字都收錄,而且是中文日文韓文中某些字是差不多的 。
最后中文日文韓文加起來就1萬多字符 。
所以2字節就幾乎收錄了世界上大部分的常用文字和符號 。
他還可以擴充到32字節,用以表示更多字符 。
第一個字節用特殊值作標記位,他告訴解析器,這個字節和后面三個應該當成一個字符處理 。這樣他就可以表示160多萬字符 。
Unicode字符列表的Unicode 編碼表:
unicode編碼對照表,unicode編碼表查詢

文章插圖
【unicode編碼對照表,unicode編碼表查詢】Unicode 編碼表 BMP SMP SIP SSP 0000—0FFF 8000—8FFF 10000—10FFF 20000—20FFF 28000—28FFF E0000—E0FFF 1000—1FFF 9000—9FFF 21000—21FFF 29000—29FFF 2000—2FFF A000—AFFF 12000—12FFF 22000—22FFF 2A000—2AFFF 3000—3FFF B000—BFFF 23000—23FFF 4000—4FFF C000—CFFF 24000—24FFF 2F000—2FFFF 5000—5FFF D000—DFFF 1D000—1DFFF 25000—25FFF 6000—6FFF E000—EFFF 26000—26FFF 7000—7FFF F000—FFFF 1F000—1FFFF 27000—27FFF

推薦閱讀