英文字母unicode編碼表,python中unicode編碼表


英文字母unicode編碼表,python中unicode編碼表

文章插圖
完整的unicode漢字編碼表:
英文字母unicode編碼表,python中unicode編碼表

文章插圖
65
怎樣查一個字符的unicode編碼:
英文字母unicode編碼表,python中unicode編碼表

文章插圖
現在有很多工具可以輔助查詢 。

可以通過這個工具:http://tool.oschina.net/encode
或者推薦這個網址: http://bianma.supfree.net/ Unicode
另外UNICODE官網上也提供了對照表的下載,只不過那個東西是PDF,可以搜索字的對應unicode
Unicode編碼表怎么看 。U+是指的什么?前面的數字是:
英文字母unicode編碼表,python中unicode編碼表

文章插圖
【英文字母unicode編碼表,python中unicode編碼表】U+指Unicode編碼,數字為十六進制 。
如何從編碼列表中選擇一個unicode選項:
英文字母unicode編碼表,python中unicode編碼表

文章插圖
將文本拷貝到記事本中,另存為一個Unicode格式文件即可 。
記事本【另存為】新文件時,【編碼】中缺省的是“ANSI”,在下拉菜單中選定“unicode”即可 。
什么是unicode編碼?:
英文字母unicode編碼表,python中unicode編碼表

文章插圖
Unicode碼擴展自ASCII字元集 。在嚴格的ASCII中,每個字元用7位元表示,或者電腦上普遍使用的每字元有8位元寬;而Unicode使用全16位元字元集 。這使得Unicode能夠表示世界上所有的書寫語言中可能用於電腦通訊的字元、象形文字和其他符號 。Unicode最初打算作為ASCII的補充,可能的話,最終將代替它 。考慮到ASCII是電腦中最具支配地位的標準,所以這的確是一個很高的目標 。
Unicode影響到了電腦工業的每個部分,但也許會對作業系統和程式設計語言的影響最大 。從這方面來看,我們已經上路了 。Windows NT從底層支援Unicode 。
目前計算機中用得最廣泛的字符集及其編碼,是由美國國家標準局(ANSI)制定的ASCII碼,它已被國際標準化組織定為國際標準,稱為ISO 646標準 。適用于所有拉丁文字字母,ASCII碼有7位碼和8位碼兩種形式 。
Unicode只有一個字符集,中、日、韓的三種文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用兩個字節來編碼一個字符,比如漢字"經"的編碼是0x7ECF,注意字符編碼一般用十六進制來 表示,為了與十進制區分,十六進制以0x開頭,0x7ECF轉換成十進制 就是32463,UCS-2用兩個字節來編碼字符,兩個字節就是16位二進制,2的16次方等于65536,所以UCS-2最多能編碼65536個字符 。編碼從0到127的字符與ASCII編碼的字符一樣,比如字母"a"的Unicode 編碼是0x0061,十進制是97,而"a"的ASCII編碼是0x61,十進制也是97, 對于漢字的編碼,事實上Unicode對漢字支持不怎么好,這也是沒辦法的,簡體和繁體總共有六七萬個漢字,而UCS-2最多能表示65536個,才六萬 多個,所以Unicode只能排除一些幾乎不用的漢字,好在常用的簡體漢字 也不過七千多個,為了能表示所有漢字,Unicode也有UCS-4規范,就是用 4個字節來編碼字符

    推薦閱讀