Unicode編碼介紹

先從ASCII說起。ASCII是用來表示英文字符的一種編碼規(guī)范，每個ASCII字符占用1個字節(jié)（8bits）?

因此，ASCII編碼可以表示的最大字符數(shù)是256，其實英文字符并沒有那么多，一般只用前128個（最高位為0），其中包括了控制字符、數(shù)字、大小寫字母和其他一些符號?。

而最高位為1的另128個字符被成為“擴展ASCII”，一般用來存放英文的制表符、部分音標(biāo)字符等等的一些其他符號?

這種字符編碼規(guī)范顯然用來處理英文沒有什么問題?。（實際上也可以用來處理法文、德文等一些其他的西歐字符，但是不能和英文通用），但是面對中文、阿拉伯文之類復(fù)雜的文字，255個字符顯然不夠用?

于是，各個國家紛紛制定了自己的文字編碼規(guī)范，其中中文的文字編碼規(guī)范叫做“GB2312-80”，它是和ASCII兼容的一種編碼規(guī)范，其實就是利用擴展ASCII沒有真正標(biāo)準(zhǔn)化這一點，把一個中文字符用兩個擴展ASCII字符來表示。?

但是這個方法有問題，最大的問題就是，中文文字沒有真正屬于自己的編碼，因為擴展ASCII碼雖然沒有真正的標(biāo)準(zhǔn)化，但是PC里的ASCII碼還是有一個事實標(biāo)準(zhǔn)的（存放著英文制表符），所以很多軟件利用這些符號來畫表格。這樣的軟件用到中文系統(tǒng)中，這些表格符就會被誤認(rèn)作中文字，破壞版面。而且，統(tǒng)計中英文混合字符串中的字?jǐn)?shù)，也是比較復(fù)雜的，我們必須判斷一個ASCII碼是否擴展，以及它的下一個ASCII是否擴展，然后才“猜”那可能是一個中文字?。

總之當(dāng)時處理中文是很痛苦的。而更痛苦的是GB2312是國家標(biāo)準(zhǔn)，***當(dāng)時有一個Big5編碼標(biāo)準(zhǔn)，很多編碼和GB是相同的，所以……，嘿嘿。?

這時候，我們就知道，要真正解決中文問題，不能從擴展ASCII的角度入手，也不能僅靠中國一家來解決。而必須有一個全新的編碼系統(tǒng)，這個系統(tǒng)要可以將中文、英文、法文、德文……等等所有的文字統(tǒng)一起來考慮，為每個文字都分配一個單獨的編碼，這樣才不會有上面那種現(xiàn)象出現(xiàn)。?

于是，Unicode誕生了。?

Unicode有兩套標(biāo)準(zhǔn)，一套叫UCS-2(Unicode-16)，用2個字節(jié)為字符編碼，另一套叫UCS-4(Unicode-32)，用4個字節(jié)為字符編碼。?

以目前常用的UCS-2為例，它可以表示的字符數(shù)為2^16=65535，基本上可以容納所有的歐美字符和絕大部分的亞洲字符?。

UTF-8的問題后面會提到?。

在Unicode里，所有的字符被一視同仁。漢字不再使用“兩個擴展ASCII”，而是使用“1個Unicode”，注意，現(xiàn)在的漢字是“一個字符”了，于是，拆字、統(tǒng)計字?jǐn)?shù)這些問題也就自然而然的解決了?。

但是，這個世界不是理想的，不可能在一夜之間所有的系統(tǒng)都使用Unicode來處理字符，所以Unicode在誕生之日，就必須考慮一個嚴(yán)峻的問題：和ASCII字符集之間的不兼容問題。?

我們知道，ASCII字符是單個字節(jié)的，比如“A”的ASCII是65。而Unicode是雙字節(jié)的，比如“A”的Unicode是0065，這就造成了一個非常大的問題：以前處理ASCII的那套機制不能被用來處理Unicode了?。

另一個更加嚴(yán)重的問題是，C語言使用'\0'作為字符串結(jié)尾，而Unicode里恰恰有很多字符都有一個字節(jié)為0，這樣一來，C語言的字符串函數(shù)將無法正常處理Unicode，除非把世界上所有用C寫的程序以及他們所用的函數(shù)庫全部換掉?。

于是，比Unicode更偉大的東東誕生了，之所以說它更偉大是因為它讓Unicode不再存在于紙上，而是真實的存在于我們大家的電腦中。那就是：UTF?。

UTF=?UCS?Transformation?Format?UCS轉(zhuǎn)換格式?

它是將Unicode編碼規(guī)則和計算機的實際編碼對應(yīng)起來的一個規(guī)則。現(xiàn)在流行的UTF有2種：UTF-8和UTF-16?。

其中UTF-16和上面提到的Unicode本身的編碼規(guī)范是一致的，這里不多說了。而UTF-8不同，它定義了一種“區(qū)間規(guī)則”，這種規(guī)則可以和ASCII編碼保持最大程度的兼容?。

UTF-8有點類似于Haffman編碼，它將Unicode編碼為00000000-0000007F的字符，用單個字節(jié)來表示；?

00000080-000007FF的字符用兩個字節(jié)表示?

00000800-0000FFFF的字符用3字節(jié)表示?

因為目前為止Unicode-16規(guī)范沒有指定FFFF以上的字符，所以UTF-8最多是使用3個字節(jié)來表示一個字符。但理論上來說，UTF-8最多需要用6字節(jié)表示一個字符。?

在UTF-8里，英文字符仍然跟ASCII編碼一樣，因此原先的函數(shù)庫可以繼續(xù)使用。而中文的編碼范圍是在0080-07FF之間，因此是2個字節(jié)表示（但這兩個字節(jié)和GB編碼的兩個字節(jié)是不同的），用專門的Unicode處理類可以對UTF編碼進(jìn)行處理。?

下面說說中文的問題。?

由于歷史的原因，在Unicode之前，一共存在過3套中文編碼標(biāo)準(zhǔn)。?

GB2312-80，是中國大陸使用的國家標(biāo)準(zhǔn)，其中一共編碼了6763個常用簡體漢字。Big5，是***使用的編碼標(biāo)準(zhǔn)，編碼了***使用的繁體漢字，大概有8千多個。HKSCS，是中國香港使用的編碼標(biāo)準(zhǔn)，字體也是繁體，但跟Big5有所不同。?

這3套編碼標(biāo)準(zhǔn)都采用了兩個擴展ASCII的方法，因此，幾套編碼互不兼容，而且編碼區(qū)間也各有不同?

因為其不兼容性，在同一個系統(tǒng)中同時顯示GB和Big5基本上是不可能的。當(dāng)時的南極星、RichWin等等軟件，在自動識別中文編碼、自動顯示正確編碼方面都做了很多努力?。

他們用了怎樣的技術(shù)我就不得而知了，我知道好像南極星曾經(jīng)以同屏顯示繁簡中文為賣點。?

后來，由于各方面的原因，國際上又制定了針對中文的統(tǒng)一字符集GBK和GB18030，其中GBK已經(jīng)在Windows、Linux等多種操作系統(tǒng)中被實現(xiàn)。?

GBK兼容GB2312，并增加了大量不常用漢字，還加入了幾乎所有的Big5中的繁體漢字。但是GBK中的繁體漢字和Big5中的幾乎不兼容。?

GB18030相當(dāng)于是GBK的超集，比GBK包含的字符更多。據(jù)我所知目前還沒有操作系統(tǒng)直接支持GB18030。?

談?wù)刄nicode編碼，簡要解釋UCS、UTF、BMP、BOM等名詞?
這是一篇程序員寫給程序員的趣味讀物。所謂趣味是指可以比較輕松地了解一些原來不清楚的概念，增進(jìn)知識，類似于打RPG游戲的升級。整理這篇文章的動機是兩個問題：

問題一：?
使用Windows記事本的“另存為”，可以在GBK、Unicode、Unicode?big?endian和UTF-8這幾種編碼方式間相互轉(zhuǎn)換。同樣是txt文件，Windows是怎樣識別編碼方式的呢？

我很早前就發(fā)現(xiàn)Unicode、Unicode?big?endian和UTF-8編碼的txt文件的開頭會多出幾個字節(jié)，分別是FF、FE（Unicode）,FE、FF（Unicode?big?endian）,EF、BB、BF（UTF-8）。但這些標(biāo)記是基于什么標(biāo)準(zhǔn)呢？

問題二：?
最近在網(wǎng)上看到一個ConvertUTF.c，實現(xiàn)了UTF-32、UTF-16和UTF-8這三種編碼方式的相互轉(zhuǎn)換。對于Unicode(UCS2)、GBK、UTF-8這些編碼方式，我原來就了解。但這個程序讓我有些糊涂，想不起來UTF-16和UCS2有什么關(guān)系。?
查了查相關(guān)資料，總算將這些問題弄清楚了，順帶也了解了一些Unicode的細(xì)節(jié)。寫成一篇文章，送給有過類似疑問的朋友。本文在寫作時盡量做到通俗易懂，但要求讀者知道什么是字節(jié)，什么是十六進(jìn)制。

0、big?endian和little?endian
big?endian和little?endian是CPU處理多字節(jié)數(shù)的不同方式。例如“漢”字的Unicode編碼是6C49。那么寫到文件里時，究竟是將6C寫在前面，還是將49寫在前面？如果將6C寫在前面，就是big?endian。還是將49寫在前面，就是little?endian。

“endian”這個詞出自《格列佛游記》。小人國的內(nèi)戰(zhàn)就源于吃雞蛋時是究竟從大頭(Big-Endian)敲開還是從小頭(Little-Endian)敲開，由此曾發(fā)生過六次叛亂，其中一個皇帝送了命，另一個丟了王位。

我們一般將endian翻譯成“字節(jié)序”，將big?endian和little?endian稱作“大尾”和“小尾”。

1、字符編碼、內(nèi)碼，順帶介紹漢字編碼
字符必須編碼后才能被計算機處理。計算機使用的缺省編碼方式就是計算機的內(nèi)碼。早期的計算機使用7位的ASCII編碼，為了處理漢字，程序員設(shè)計了用于簡體中文的GB2312和用于繁體中文的big5。

GB2312(1980年)一共收錄了7445個字符，包括6763個漢字和682個其它符號。漢字區(qū)的內(nèi)碼范圍高字節(jié)從B0-F7，低字節(jié)從A1-FE，占用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。

GB2312支持的漢字太少。1995年的漢字?jǐn)U展規(guī)范GBK1.0收錄了21886個符號，它分為漢字區(qū)和圖形符號區(qū)。漢字區(qū)包括21003個字符。2000年的GB18030是取代GBK1.0的正式國家標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)收錄了27484個漢字，同時還收錄了藏文、蒙文、維吾爾文等主要的少數(shù)民族文字?，F(xiàn)在的PC平臺必須支持GB18030，對嵌入式產(chǎn)品暫不作要求。所以手機、MP3一般只支持GB2312。

從ASCII、GB2312、GBK到GB18030，這些編碼方法是向下兼容的，即同一個字符在這些方案中總是有相同的編碼，后面的標(biāo)準(zhǔn)支持更多的字符。在這些編碼中，英文和中文可以統(tǒng)一地處理。區(qū)分中文編碼的方法是高字節(jié)的最高位不為0。按照程序員的稱呼，GB2312、GBK到GB18030都屬于雙字節(jié)字符集?(DBCS)。

有的中文Windows的缺省內(nèi)碼還是GBK，可以通過GB18030升級包升級到GB18030。不過GB18030相對GBK增加的字符，普通人是很難用到的，通常我們還是用GBK指代中文Windows內(nèi)碼。

這里還有一些細(xì)節(jié)：

GB2312的原文還是區(qū)位碼，從區(qū)位碼到內(nèi)碼，需要在高字節(jié)和低字節(jié)上分別加上A0。

在DBCS中，GB內(nèi)碼的存儲格式始終是big?endian，即高位在前。

GB2312的兩個字節(jié)的最高位都是1。但符合這個條件的碼位只有128*128=16384個。所以GBK和GB18030的低字節(jié)最高位都可能不是1。不過這不影響DBCS字符流的解析：在讀取DBCS字符流時，只要遇到高位為1的字節(jié)，就可以將下兩個字節(jié)作為一個雙字節(jié)編碼，而不用管低字節(jié)的高位是什么。

2、Unicode、UCS和UTF
前面提到從ASCII、GB2312、GBK到GB18030的編碼方法是向下兼容的。而Unicode只與ASCII兼容（更準(zhǔn)確地說，是與ISO-8859-1兼容），與GB碼不兼容。例如“漢”字的Unicode編碼是6C49，而GB碼是BABA。

Unicode也是一種字符編碼方法，不過它是由國際組織設(shè)計，可以容納全世界所有語言文字的編碼方案。Unicode的學(xué)名是"Universal?Multiple-Octet?Coded?Character?Set"，簡稱為UCS。UCS可以看作是"Unicode?Character?Set"的縮寫。

根據(jù)維基百科全書的記載：歷史上存在兩個試圖獨立設(shè)計Unicode的組織，即國際標(biāo)準(zhǔn)化組織（ISO）和一個軟件制造商的協(xié)會（unicode.org）。ISO開發(fā)了ISO?10646項目，Unicode協(xié)會開發(fā)了Unicode項目。

在1991年前后，雙方都認(rèn)識到世界不需要兩個不兼容的字符集。于是它們開始合并雙方的工作成果，并為創(chuàng)立一個單一編碼表而協(xié)同工作。從Unicode2.0開始，Unicode項目采用了與ISO?10646-1相同的字庫和字碼。

目前兩個項目仍都存在，并獨立地公布各自的標(biāo)準(zhǔn)。Unicode協(xié)會現(xiàn)在的最新版本是2005年的Unicode?4.1.0。ISO的最新標(biāo)準(zhǔn)是10646-3:2003。

UCS規(guī)定了怎么用多個字節(jié)表示各種文字。怎樣傳輸這些編碼，是由UTF(UCS?Transformation?Format)規(guī)范規(guī)定的，常見的UTF規(guī)范包括UTF-8、UTF-7、UTF-16。

IETF的RFC2781和RFC3629以RFC的一貫風(fēng)格，清晰、明快又不失嚴(yán)謹(jǐn)?shù)孛枋隽薝TF-16和UTF-8的編碼方法。我總是記不得IETF是Internet?Engineering?Task?Force的縮寫。但I(xiàn)ETF負(fù)責(zé)維護的RFC是Internet上一切規(guī)范的基礎(chǔ)。

3、UCS-2、UCS-4、BMP

UCS有兩種格式：UCS-2和UCS-4。顧名思義，UCS-2就是用兩個字節(jié)編碼，UCS-4就是用4個字節(jié)（實際上只用了31位，最高位必須為0）編碼。下面讓我們做一些簡單的數(shù)學(xué)游戲：

UCS-2有2^16=65536個碼位，UCS-4有2^31=2147483648個碼位。

UCS-4根據(jù)最高位為0的最高字節(jié)分成2^7=128個group。每個group再根據(jù)次高字節(jié)分為256個plane。每個plane根據(jù)第3個字節(jié)分為256行?(rows)，每行包含256個cells。當(dāng)然同一行的cells只是最后一個字節(jié)不同，其余都相同。

group?0的plane?0被稱作Basic?Multilingual?Plane,?即BMP?；蛘哒fUCS-4中，高兩個字節(jié)為0的碼位被稱作BMP。

將UCS-4的BMP去掉前面的兩個零字節(jié)就得到了UCS-2。在UCS-2的兩個字節(jié)前加上兩個零字節(jié)，就得到了UCS-4的BMP。而目前的UCS-4規(guī)范中還沒有任何字符被分配在BMP之外。

4、UTF編碼

UTF-8就是以8位為單元對UCS進(jìn)行編碼。從UCS-2到UTF-8的編碼方式如下：

UCS-2編碼(16進(jìn)制)?UTF-8?字節(jié)流(二進(jìn)制)?
0000?-?007F?0xxxxxxx?
0080?-?07FF?110xxxxx?10xxxxxx?
0800?-?FFFF?1110xxxx?10xxxxxx?10xxxxxx?

例如“漢”字的Unicode編碼是6C49。6C49在0800-FFFF之間，所以肯定要用3字節(jié)模板了：1110xxxx?10xxxxxx?10xxxxxx。將6C49寫成二進(jìn)制是：0110?110001?001001，?用這個比特流依次代替模板中的x，得到：11100110?10110001?10001001，即E6?B1?89。

讀者可以用記事本測試一下我們的編碼是否正確。

UTF-16以16位為單元對UCS進(jìn)行編碼。對于小于0x10000的UCS碼，UTF-16編碼就等于UCS碼對應(yīng)的16位無符號整數(shù)。對于不小于0x10000的UCS碼，定義了一個算法。不過由于實際使用的UCS2，或者UCS4的BMP必然小于0x10000，所以就目前而言，可以認(rèn)為UTF-16和UCS-2基本相同。但UCS-2只是一個編碼方案，UTF-16卻要用于實際的傳輸，所以就不得不考慮字節(jié)序的問題。

5、UTF的字節(jié)序和BOM
UTF-8以字節(jié)為編碼單元，沒有字節(jié)序的問題。UTF-16以兩個字節(jié)為編碼單元，在解釋一個UTF-16文本前，首先要弄清楚每個編碼單元的字節(jié)序。例如收到一個“奎”的Unicode編碼是594E，“乙”的Unicode編碼是4E59。如果我們收到UTF-16字節(jié)流“594E”，那么這是“奎”還是“乙”？

Unicode規(guī)范中推薦的標(biāo)記字節(jié)順序的方法是BOM。BOM不是“Bill?Of?Material”的BOM表，而是Byte?Order?Mark。BOM是一個有點小聰明的想法：

在UCS編碼中有一個叫做"ZERO?WIDTH?NO-BREAK?SPACE"的字符，它的編碼是FEFF。而FFFE在UCS中是不存在的字符，所以不應(yīng)該出現(xiàn)在實際傳輸中。UCS規(guī)范建議我們在傳輸字節(jié)流前，先傳輸字符"ZERO?WIDTH?NO-BREAK?SPACE"。

這樣如果接收者收到FEFF，就表明這個字節(jié)流是Big-Endian的；如果收到FFFE，就表明這個字節(jié)流是Little-Endian的。因此字符"ZERO?WIDTH?NO-BREAK?SPACE"又被稱作BOM。

UTF-8不需要BOM來表明字節(jié)順序，但可以用BOM來表明編碼方式。字符"ZERO?WIDTH?NO-BREAK?SPACE"的UTF-8編碼是EF?BB?BF（讀者可以用我們前面介紹的編碼方法驗證一下）。所以如果接收者收到以EF?BB?BF開頭的字節(jié)流，就知道這是UTF-8編碼了。

Windows就是使用BOM來標(biāo)記文本文件的編碼方式的。

6、進(jìn)一步的參考資料
本文主要參考的資料是?"Short?overview?of?ISO-IEC?10646?and?Unicode"?

我還找了兩篇看上去不錯的資料，不過因為我開始的疑問都找到了答案，所以就沒有看：

"Understanding?Unicode?A?general?introduction?to?the?Unicode?Standard"?(http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter04a)?
"Character?set?encoding?basics?Understanding?character?set?encodings?and?legacy?encodings"?(http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter03)??
?

閱讀全文

編碼(54429) 編碼(54429)
Unicode(12497) Unicode(12497)

C++字符編碼轉(zhuǎn)換的基本方法

這篇文章介紹了如何在最常見的編碼方式(Unicode, UTF-8, ANSI)之間進(jìn)行轉(zhuǎn)換，結(jié)合代碼實例，清晰明了，方便讀者理解，例子也可以直接拿來使用。本文推薦給經(jīng)常對文字字符串進(jìn)行處理的程序員閱讀，使其掌握字符轉(zhuǎn)換的一些基本方法。

2022-09-20 09:50:49

1561

UNICODE與GB2312編碼互轉(zhuǎn),GSM編程

UNICODE與GB2312編碼互轉(zhuǎn),GSM編程可用unicode轉(zhuǎn)GB2312.zip

2018-07-02 08:16:30

UNICODE與GBK的相互轉(zhuǎn)化

UNICODE與GBK的相互轉(zhuǎn)化，在一些應(yīng)用場景可能只有UNICODE編碼然后中文形式顯示在LCD屏上，這時可能需要轉(zhuǎn)換為GBK編碼。GBK與UNICODE沒有直接對應(yīng)的關(guān)系，通過查表方式將兩者聯(lián)系起來，具體實...

2022-01-12 06:58:13

Unicode、UTF－8 和 ISO8859-1到底有什么區(qū)別

Unicode、UTF－8 和 ISO8859-1到底有什么區(qū)別1.本文主要包括以下幾個方面：編碼基本知識，java，系統(tǒng)軟件，url，工具軟件等。在下面的描述中，將以"中文"

2019-07-16 06:05:03

Unicode和GB2312編碼互轉(zhuǎn)VI

因為在寫GSM短信收發(fā)數(shù)據(jù)上位機軟件，需要用到Unicode和GB2312編碼轉(zhuǎn)換。搞了很長時間，一直沒頭序。后來參考網(wǎng)上一個例程，基于查表方式，自己修改了終于成功了?，F(xiàn)在上傳大家看看，交流一下。

2016-03-21 17:09:56

Unicode和UTF 8和ISO8859-1的區(qū)別

cec4"，Unicode編碼為"4e2d 6587"，UTF編碼就是"e4b8ad e69687"。注意，這兩個字沒有iso8859-1編碼，但可以用iso8859-1編碼來"表示"。

2019-07-12 07:33:38

介紹一下視頻編碼標(biāo)準(zhǔn)的發(fā)展過程

本文按照ITU-T視頻編碼標(biāo)準(zhǔn)的發(fā)展過程，介紹H.261、H.263及H.264。

2021-06-07 06:31:20

介紹一種基于小波域的分形圖像編碼改進(jìn)算法

本文介紹了一種基于小波域的分形圖像編碼改進(jìn)算法。

2021-06-03 07:28:54

介紹下編碼器的原理

平衡車編碼器最近在開始研究平衡小車但在編碼器的使用上就遇到了許多的麻煩，后來在網(wǎng)上查閱了眾多資料和大佬的講解，終于有一點明白。首先，我使用得是電機自帶的編碼器。這里介紹下編碼器的原理。編碼器的核心

2021-08-26 14:42:10

Cheap_flash_fs(高端版--unicode版本--支持硬盤多分區(qū)版本)--嵌入式FAT16/32文件系統(tǒng)免費源碼下載

Cheap_flash_fs(高端版--unicode版本--支持硬盤多分區(qū)版本)--嵌入式FAT16/32文件系統(tǒng)免費源碼下載本代碼兼容FAT16/FAT32文件系統(tǒng)共計兩種格式，兼容微軟的長文

2023-02-14 09:16:13

JAVA字符編碼系列主要包括以下幾個方面

;d6d0 cec4"，Unicode編碼為"4e2d 6587"，UTF編碼就是"e4b8ad e69687"。注意，這兩個字沒有iso8859-1編碼，但可以用iso8859-1編碼來"表示"。

2019-07-11 07:05:56

Java及相關(guān)字符集編碼主要包括了以下幾個方面

;d6d0 cec4"，Unicode編碼為"4e2d 6587"，UTF編碼就是"e4b8ad e69687".注重，這兩個字沒有iso8859-1編碼，但可以用iso8859-1編碼來"表示".

2019-07-11 08:19:42

LCD是怎樣顯示GBK字庫里面的漢字呢

LCD顯示GBK字庫里面的漢字文章目錄LCD顯示GBK字庫里面的漢字前言一、編碼規(guī)則二、使用步驟1.需燒錄的字庫2.轉(zhuǎn)碼3.函數(shù)體3.顯示漢字前言本文介紹如何把字庫文件寫入單片機的flash后，在

2022-01-26 06:42:52

LabVIEW文本控件的中英文編碼問題？

Unicode，當(dāng)然文本要在控件中正常顯示，而不是顯示編碼的十六進(jìn)制。主要是為了對中英文混合的字符串進(jìn)行操作。最好能提供實例的程序供我參考,謝謝！

2015-04-29 09:32:05

Labview GBK字符轉(zhuǎn)Unicode編碼（支持混合字符）

labview字符控件中的漢字編碼是GBK，應(yīng)用中如需用到Unicode編碼，labview沒有直接的函數(shù)可以調(diào)用，現(xiàn)分享下我編寫的基于查表方式實現(xiàn)互轉(zhuǎn)的程序。先前做的版本只支持純中文，經(jīng)過一段時間的修改，現(xiàn)在這個版本支持混合字符啦。搭配字符串顯示格式轉(zhuǎn)換VI就可以直接用于VISA了

2019-10-28 11:50:48

OLED顯示漢字實驗問題的解決辦法？

使用的是Unicode編碼，而Unicode編碼是不兼容GBK的，所以我們在程序中寫的中文字符串并不能像ASCII這樣的字符一樣直接用來查找GKB點陣數(shù)據(jù)的，必須通過程序?qū)?b class="flag-6" style="color: red">Unicode表示的漢字轉(zhuǎn)換到GBK才

2020-08-12 08:00:27

QT如何獲取當(dāng)前光標(biāo)所在編輯界面中的編碼方式？

T如何獲取當(dāng)前光標(biāo)所在編輯界面中的編碼方式呢？如當(dāng)前編輯界面到底是unicode編碼、UTF-8編碼還是GB2312編碼的...

2022-06-17 15:23:47

STM32是否支持漢字的Unicode碼儲存？？

在STM32里儲存一個“中”字，是不是按Unicode碼儲存的？例如“冰”字，是不是51B0？如果是，那是不是分開51與B0兩個字節(jié)來儲存？如果不支持，那它支持哪一種編碼？

2012-08-18 15:50:40

java字符編碼知識概述

cec4"，Unicode編碼為"4e2d 6587"，UTF編碼就是"e4b8ad e69687"。注意，這兩個字沒有iso8859-1編碼，但可以用iso8859-1編碼來"表示"。

2019-07-12 08:00:37

labview 中文字符與Unicode互轉(zhuǎn)

本帖最后由 cht_236 于 2019-3-29 11:29 編輯 labview字符控件中的漢字編碼是GBK，應(yīng)用中如需用到Unicode編碼，labview沒有直接的函數(shù)可以調(diào)用，現(xiàn)分享下我編寫的基于查表方式實現(xiàn)互轉(zhuǎn)的程序。

2019-03-28 09:31:02

labview將unicode碼轉(zhuǎn)換為中文

求助各位大神，誰會將在labview中將接收到的Unicode碼轉(zhuǎn)換為漢字！謝謝~

2014-06-29 21:11:25

labview要有字符串轉(zhuǎn)UNICODE的函數(shù)就好了。大家覺得哩！

labview要有字符串轉(zhuǎn)UNICODE的函數(shù)就好了。大家覺得哩！

2013-09-14 21:06:44

labview采用TCP傳輸數(shù)據(jù)時轉(zhuǎn)化字符串的編碼格式是哪種？

labview采用TCP傳輸數(shù)據(jù)，需要先進(jìn)行字符串轉(zhuǎn)化，平化或者強制轉(zhuǎn)換，請問轉(zhuǎn)換的字符串采用哪種編碼格式:ASCII、GBK、Unicode、UTF-8。網(wǎng)上查資料有兩種觀點:（1）默認(rèn)情況下

2019-08-22 13:35:28

linux下改變文件的編碼格式

轉(zhuǎn) 1.在Vim中直接進(jìn)行轉(zhuǎn)換文件編碼,比如將一個文件轉(zhuǎn)換成utf-8格式 :set fileencoding=utf-8 2. enconv 轉(zhuǎn)換文件編碼，比如要將一個GBK編碼的文件

2019-07-12 06:05:22

stm32f0讀取unicode編碼的點陣字庫字母顯示間隔很寬怎么處理

flash 裝的是unicode 24*24的點陣字庫，非等寬字庫?，F(xiàn)在我要讀出字庫送給打印機，熱敏打印機一行是384個點也就是48字節(jié)。漢字寬是24，字母 i 寬是7w寬是19 其他字母數(shù)字

2014-11-01 12:17:22

【emWin實戰(zhàn)教程V2.0】第20章字符編碼和點陣字體基礎(chǔ)知識（重要）

轉(zhuǎn)最新版本教程本章節(jié)主要為大家講解ASCII字符集，ASCII擴展字符集，GB2312字符集，GBK字符集和Unicode字符集。其中，字符編碼這塊涉及到的知識點非常多，特別是Unicode字符集

2017-01-19 11:45:16

【emWin實戰(zhàn)教程V2.0】第22章 C文件格式的漢字生成和實現(xiàn)（Unicode編碼）

。FontCvt全稱FontConverter。 22.1 初學(xué)者重要提示 22.2使用FontCvt生成字庫C文件的方法22.3 C文件格式漢字的使用方法 22..4生成的是Unicode編碼

2017-01-19 14:39:57

【emWin實戰(zhàn)教程V2.0】第23章 XBF格式全字庫生成和使用方法（Unicode編碼）

。XBF格式字體也是用FontCvt生成的，編碼為Unicode。本章節(jié)以SPI Flash為例給大家進(jìn)行講解（SPIFlash就是SPI接口的Flash存儲芯片）。 23.1初學(xué)者重要提示 23.2XBF

2017-01-20 17:13:55

【基礎(chǔ)介紹】Encode 編碼器介紹與使用DAQ擷取

`此篇主要介紹在一般在 “位置偵測／運動控制”的應(yīng)用場合中，扮演重要角色的傳感器元件。它就是編碼器ENCODE。下文將描述ENCODE的動作原理及種類介紹，與在DAQ資擷取上的配接方式／擷取程序

2015-06-12 14:51:14

【安富萊STemWin教程】第18章漢字顯示方式一（FontCvt的使用）

的小軟件得到“安富萊電子”這5個字的unicode編碼我這里在百度上面找了一個網(wǎng)頁應(yīng)用。18.1.5 第五步：在FontCvt上使能這個五個字的編碼在Font Converter軟件上面使能這個五個字

2015-04-03 11:42:38

中文編碼的基礎(chǔ)知識

是"d6d0 cec4"，Unicode編碼為"4e2d 6587"，UTF編碼就是"e4b8ad e69687"。注意，這兩個字沒有iso8859-1編碼，但可以用iso8859-1編碼來"表示"。

2019-07-11 06:45:02

為什么要進(jìn)行國標(biāo)碼和unicode碼的轉(zhuǎn)換？

用的是SIM900A模塊，使用串口調(diào)試助手設(shè)置成Text模式后，發(fā)送unicode碼的中文短信能發(fā)出去。那么為什么好多文章都說Text模式不支持中文短信，一定要用PDU模式呢。還有就是在具體使用中，為什么要進(jìn)行國標(biāo)碼和unicode碼的轉(zhuǎn)換。謝謝

2019-10-25 00:28:46

如何將UTF-8轉(zhuǎn)換為GBK編碼

概述我們在單片機開發(fā)中常會遇到需要將UTF-8轉(zhuǎn)換為GBK編碼的需求。在我們了解各種編碼格式的情況下可知，UFT-8不能直接轉(zhuǎn)成GBK，需中轉(zhuǎn)成unicode再轉(zhuǎn)換為gbk。而unicode和gbk

2021-12-09 07:39:10

旋轉(zhuǎn)編碼器的作用及工作原理

準(zhǔn)確解析編碼器的數(shù)字輸出。本文將介紹旋轉(zhuǎn)編碼器的作用及其工作原理。然后說明如何解釋其信號，最后再介紹幾個編碼器解決方案及其實際應(yīng)用。

2021-02-22 06:09:31

直流電機與編碼器介紹

文章目錄一、模塊概述二、直流電機2.1 直流電機介紹2.2 直流電機外圍設(shè)備介紹2.2.1 減速器2.2.2 控制PWM的單片機2.2.3 編碼器三、編碼器3.1 編碼器介紹3.1.1 編碼

2021-09-03 08:02:08

第17章 STemWin外語支持

。本章將介紹一些基本知識，比如定義全球所有可用字符的Unicode標(biāo)準(zhǔn)，以及UTF-8編碼方案，emWin使用該方案來解碼以Unicode字符編寫的文本。同時還將說明如何啟用阿拉伯語支持，以及如何采用

2016-10-14 08:01:17

萌新求助，求大佬詳細(xì)介紹霍爾信號/編碼器信號與電機轉(zhuǎn)向的知識點

2021-10-19 06:31:26

請問touchGFX如何使用Hangul（韓語）Unicode字體？

你好呀親愛的。的我正在制作 QWERTY 韓語輸入法。使用 touchGFX 設(shè)計器確認(rèn)使用 Unicode 來表達(dá)字符。但是，F(xiàn)ont 只能輸出 EUC_KR 中的代碼。在韓文輸入法的情況下，通過

2023-02-07 07:27:26

需要包含什么文件才能使用“touchgfx ::Unicode::UnicodeChar”和 strncpy？

在我的代碼中，當(dāng)我使用 touchgfx::Unicode::UnicodeChar 時，它顯示預(yù)期的表達(dá)式....我應(yīng)該包含哪些文件來解決此錯誤

2023-01-11 06:48:05

漢字Unicode碼生成軟件

漢字Unicode碼生成軟件

2009-03-15 12:35:39

漢字ASCII碼-Unicode碼轉(zhuǎn)化器（轉(zhuǎn)換工具）

漢字ASCII碼--Unicode碼轉(zhuǎn)化器（轉(zhuǎn)換工具）

2009-03-15 12:41:51

633

Unicode數(shù)據(jù)倉庫ETL的設(shè)計與實現(xiàn)

在Unicode數(shù)據(jù)裝載過程中，如源字符集中的某個字符在目標(biāo)字符集中沒有定義，將會出現(xiàn)錯誤，產(chǎn)生信息丟失的現(xiàn)象。針對這種情況，該文提出一種從源Oracle數(shù)據(jù)庫到目標(biāo)Teradata數(shù)據(jù)

2009-04-21 09:34:51

MP3編碼原理

主要探討MP3編碼法介紹MP3音訊編碼標(biāo)準(zhǔn)的原理

2010-09-09 15:32:39

網(wǎng)屏編碼技術(shù)介紹

網(wǎng)屏編碼是一種可在使用打印機和印刷機等在介質(zhì)上打印或印刷文字或圖像的同時，大量埋入不同文字或圖像的編碼新技術(shù)。網(wǎng)屏編碼與目前常用于物品識別的二維碼、水印技術(shù)、RF

2010-11-17 11:48:37

使用Java語言進(jìn)行Unicode代理編程

早期 Java 版本使用 16 位 char 數(shù)據(jù)類型表示 Unicode 字符。這種設(shè)計方法有時比較合理，因為所有 Unicode 字符擁有的值都小于 65,535 (0xFFFF)，可以通過 16 位表示。但是，Unicode 后來將

2010-11-25 18:18:35

FKC光電編碼器

FKC光電編碼器 FKC光電編碼器產(chǎn)品參數(shù)/介紹：

2009-10-30 07:55:39

1039

編碼器,編碼器是什么意思

編碼器,編碼器是什么意思編碼器編碼器（encoder）是將信號

2010-03-08 15:04:26

2868

UNICODE,GBK,UTF-8區(qū)別

Unicode編碼，簡要解釋UCS、UTF、BMP、BOM等名詞。這是一篇程序員寫給程序員的趣味讀物

2011-03-28 10:28:50

2298

字符Unicode標(biāo)準(zhǔn)編碼計算器免費下載

字符標(biāo)準(zhǔn)編碼計算器可以計算出任意字符的Unicode碼，尤其是漢字的Unicode碼計算對我們的實際開發(fā)有一定的幫助意義。使用此軟件可以方便得到我們想要的一段漢字的Unicode碼，并且可以

2012-09-16 10:14:52

歐姆龍_脈沖編碼器的使用介紹

歐姆龍_脈沖編碼器的使用介紹以及資料內(nèi)容詳細(xì)說明。

2016-03-04 15:56:10

基于SEW的編碼器系統(tǒng)介紹

本文檔內(nèi)容介紹了基于SEW的編碼器系統(tǒng)介紹，包含了系統(tǒng)框架圖以及產(chǎn)品參數(shù)等。

2017-09-25 15:33:19

NEC、三菱和東芝等6種紅外遙控器編碼及程序的介紹與分析

本文介紹了NEC，三菱，索尼，飛利普，東芝等6種紅外遙控器編碼及程序。

2017-11-16 13:14:40

數(shù)字通信系統(tǒng)及糾錯編碼技術(shù)的介紹

本文介紹了數(shù)字通信系統(tǒng)及糾錯編碼技術(shù)相關(guān)知識的詳述。

2017-11-17 14:27:39

數(shù)字調(diào)制與編碼

本文詳細(xì)介紹了數(shù)字的調(diào)制與編碼。

2017-11-17 15:46:03

unicode和ascii的區(qū)別是什么

Euc-kr里，各國有各國的標(biāo)準(zhǔn)，就會不可避免地出現(xiàn)沖突，結(jié)果就是，在多語言混合的文本中，顯示出來會有亂碼。因此，Unicode應(yīng)運而生。Unicode把所有語言都統(tǒng)一到一套編碼里，這樣就不會再有亂碼問題了。

2017-12-12 14:02:44

23180

unicode與javascript詳解

Unicode源于一個很簡單的想法：將全世界所有的字符包含在一個集合里，計算機只要支持這一個字符集，就能顯示所有的字符，再也不會有亂碼了。JavaScript一種直譯式腳本語言，是一種動態(tài)類型

2017-12-12 14:31:15

2693

ascii和utf8的區(qū)別_ASCII編碼與UTF-8的關(guān)系

UTF-8是一種針對Unicode的可變長度字符編碼，又稱萬國碼。由Ken Thompson于1992年創(chuàng)建?，F(xiàn)在已經(jīng)標(biāo)準(zhǔn)化為RFC 3629。UTF-8用1到6個字節(jié)編碼Unicode字符。ASCII是基于拉丁字母的一套電腦編碼系統(tǒng)，主要用于顯示現(xiàn)代英語和其他西歐語言。

2018-01-30 13:34:11

26812

關(guān)于 Unicode 所有開發(fā)者都應(yīng)該知道的前五件事并用來防止欺詐

Unicode 是極其有價值的標(biāo)準(zhǔn)，使得電腦、智能手機和手表，在全球范圍內(nèi)以同樣的方式顯示同樣的消息。不幸的是，它的復(fù)雜性使其成為了騙子和惡作劇者的金礦。如果像 Google 這樣的巨頭都不能抵御

2018-02-02 11:41:13

3172

正余弦編碼器介紹及細(xì)分技術(shù)詳解

介紹正余弦編碼器前，先來回顧一下方波增量編碼器。方波增量編碼器的輸出為正交的AB脈沖信號，即高電平或者低電平。我們把信號從低電平到高電平的變化，稱作為一個上升沿。編碼器的輸出，就是從一個上升

2018-02-11 04:38:00

55407

步進(jìn)電機有沒有編碼器?步進(jìn)電機如何加編碼器

本文開始介紹了步進(jìn)電機工作原理，其次介紹了三款步進(jìn)電機電路圖，最后介紹了步進(jìn)電機是否有編碼器以及步進(jìn)電機加編碼器的方法和重要意義。

2018-04-25 12:48:41

50524

電位器和編碼器的區(qū)別

本文首先介紹了電位器和編碼器是什么，其次介紹了電位器和編碼器在旋轉(zhuǎn)角度、工作原理上的不同。

2018-10-17 17:10:45

28337

TensorFlow現(xiàn)在可以支持Unicode，這是一種標(biāo)準(zhǔn)編碼系統(tǒng)

定義字符及其編碼的最常用標(biāo)準(zhǔn)是 Unicode，它幾乎支持所有語言。對于 Unicode，每個字符使用唯一的整數(shù) code point 表示，其值介于 0 和 0x10FFFF 之間。當(dāng)按順序放置 code point 時，將形成 Unicode 字符串。

2018-12-31 11:37:00

2836

如何進(jìn)行GB2312、 BIG5、UTF8和Unicode之間的互換

本文檔的主要內(nèi)容詳細(xì)介紹的是如何進(jìn)行GB2312、 BIG5、UTF8和Unicode之間的互換。先轉(zhuǎn)成寬字符

2019-04-16 17:27:37

使用SMS短信進(jìn)行PDU編碼的詳細(xì)資料和程序免費下載

發(fā)送Unicode字符。一般的PDU編碼由A B C D E F G H I J K L M十三項組成。

2019-06-21 17:43:00

如何進(jìn)行SMS短信的PDU編碼詳細(xì)資料說明

發(fā)送Unicode字符。一般的 PDU編碼由A B C D E F G H I J K L M十三項組成。

2019-05-08 18:18:00

漢字轉(zhuǎn)換Unicode碼的小工具應(yīng)用程序免費下載

本文檔的主要內(nèi)容詳細(xì)介紹的是漢字轉(zhuǎn)換Unicode碼的小工具應(yīng)用程序免費下載。

2019-04-30 08:00:00

視頻編碼器的介紹以及視頻編碼器的應(yīng)用領(lǐng)域

視頻編碼器行業(yè)根據(jù)接口的不同而有著不同的分類，例如：HDMI編碼器、RTMP編碼器、4G編碼器等，今天我們一起來了解邁拓MT-VIKI科技新推出的一款HDMI視頻編碼器MT-BM001。HDMI視頻

2020-07-02 11:49:29

1707

旋轉(zhuǎn)編碼器拆卸方法_旋轉(zhuǎn)編碼器型號說明

本文首先介紹了旋轉(zhuǎn)編碼器拆卸方法，其次闡述了旋轉(zhuǎn)編碼器更換步驟，最后介紹了旋轉(zhuǎn)編碼器型號說明。

2019-08-06 11:48:33

16766

旋轉(zhuǎn)編碼器能直接換嗎_旋轉(zhuǎn)編碼器更換注意事項

本文首先介紹了旋轉(zhuǎn)編碼器更換步驟，其次介紹了旋轉(zhuǎn)編碼器更換注意事項，最后介紹了旋轉(zhuǎn)編碼器替換原則。

2019-08-06 14:18:38

8799

從ASCII碼->Unicode-> UTF-8歷史變遷，及其差異

從ASCII碼->Unicode->UTF-8歷史變遷，及其差異

2020-02-27 15:56:19

2010

Unicode碼轉(zhuǎn)中文顯示GT20L16讀寫的源代碼免費下載

本文檔的主要內(nèi)容詳細(xì)介紹的是Unicode碼轉(zhuǎn)中文顯示GT20L16讀寫的源代碼免費下載。

2020-06-12 08:00:00

unicode如何轉(zhuǎn)GBK字庫制作

UTF-8（8 位元，Universal Character Set/Unicode Transformation Format）是針對 Unicode 的一種可變長度字符編碼。UCS 字符

2023-08-14 10:45:22

信道編碼中的誤碼率曲線與編碼增益及編碼設(shè)計的誤碼率分析

本文檔的主要內(nèi)容詳細(xì)介紹的是信道編碼中的誤碼率曲線與編碼增益及編碼設(shè)計的誤碼率分析

2020-06-03 08:00:00

漢字與Unicode碼轉(zhuǎn)換軟件免費下載

本文檔的主要內(nèi)容詳細(xì)介紹的是漢字與Unicode碼轉(zhuǎn)換軟件免費下載。

2020-06-15 18:00:14

如何使用FPGA實現(xiàn)信道編碼

信道編碼發(fā)展迅速，應(yīng)用越來越廣泛，而信道編碼的好壞對眾多工程技術(shù)領(lǐng)域的發(fā)展有著重要影響，所以對信道編碼的研究工作有著非常重要的意義。本論文從闡述信道編碼理論出發(fā)，介紹了編碼理論的背景和其發(fā)展

2020-08-18 17:11:10

C++中字符編碼的轉(zhuǎn)換

。這篇文章介紹了如何在最常見的編碼方式（Unicode， UTF-8， ANSI）之間進(jìn)行轉(zhuǎn)換，結(jié)合代碼實例，清晰明了，方便讀者理解，例子也可以直接拿來使用。本文推薦給經(jīng)常對文字字符串進(jìn)行處理的程序員閱讀，使其掌握字符轉(zhuǎn)換的一些基本方法。正文 C++的項目

2020-10-15 10:21:36

1945

關(guān)于C++編碼的轉(zhuǎn)換

2020-10-16 11:57:46

1343

信道編碼的發(fā)展歷程介紹

介紹下信道編碼的發(fā)展，希望能起到借鑒的作用。信道編碼，也叫差錯控制編碼，是所有現(xiàn)代通信系統(tǒng)的基石。幾十年來，信道編碼技術(shù)不斷逼近香農(nóng)極限，波瀾壯闊般推動著人類通信邁過一個又一個頂峰。5G到來，我們

2021-02-23 15:16:06

5333

SINAMICS-S120系統(tǒng)中的編碼器轉(zhuǎn)換模塊介紹

SINAMICS-S120系統(tǒng)中的編碼器轉(zhuǎn)換模塊介紹說明。

2021-04-25 11:28:42

單片機中UTF-8如何轉(zhuǎn)換得到GBK編碼

概述我們在單片機開發(fā)中常會遇到需要將UTF-8轉(zhuǎn)換為GBK編碼的需求。在我們了解各種編碼格式的情況下可知，UFT-8不能直接轉(zhuǎn)成GBK，需中轉(zhuǎn)成unicode再轉(zhuǎn)換為gbk。而unicode

2021-11-26 10:51:04

交流異步電機編碼器介紹

2022-01-14 15:25:59

編碼器是什么，對于編碼器的組成和認(rèn)識

介紹對編碼的認(rèn)識和結(jié)構(gòu)組成。

2022-02-20 16:15:57

12125

Openerp PyChart Unicode Report

openerp-pychart-unicode-report.zip

2022-04-18 10:29:53

增量式編碼器的三種類型介紹

增量式編碼器一般分為3種類型：單通道增量式編碼器，雙通道增量式編碼器，三通道增量式編碼器。

2023-04-17 09:43:14

3776

Python編碼與解碼

先做下科普：UNICODE字符編碼，也是一張字符與數(shù)字的映射，但是這里的數(shù)字被稱為代碼點（code point），實際上就是十六進(jìn)制的數(shù)字。 Python官方文檔中對Unicode字符串、字節(jié)

2023-07-05 15:59:49

507

Python字符編碼轉(zhuǎn)換

UNICODE字符串可以與任意字符編碼的字節(jié)進(jìn)行相互轉(zhuǎn)換，如圖：那么大家很容易想到一個問題，就是不同的字符編碼的字節(jié)可以通過Unicode相互轉(zhuǎn)換嗎？答案是肯定的。 Python2中的字符串進(jìn)行

2023-07-05 16:25:23

791

信息編碼技術(shù)詳解

前面介紹過，調(diào)制解調(diào)之前還需要編碼，但編碼根據(jù)用途來分有信源編碼與信道編碼。本編的主要內(nèi)容是介紹幾種信源編碼技術(shù)，需要注意的是用于信源編碼的技術(shù)有些也可以用于信道編碼，比如最后一點介紹的循環(huán)碼。感覺有些別扭的是，居然順便科普了一下加密技術(shù)。

2023-11-27 10:05:07

226

詳細(xì)介紹磁性編碼器的工作原理

磁性編碼器是一種常見的測量裝置，用于測量物體的位置和運動。它可以通過檢測磁性材料的變化來進(jìn)行精確的測量。本文將詳細(xì)介紹磁性編碼器的工作原理。

2024-01-15 09:53:33

380

哈夫曼編碼怎么算哈夫曼編碼左邊是0還是1

二叉樹，將出現(xiàn)頻率高的字符用較短的編碼表示，而出現(xiàn)頻率低的字符則用較長的編碼表示。通過這種方式，可以實現(xiàn)對數(shù)據(jù)進(jìn)行高效的編碼和解碼。下面我們將詳細(xì)介紹哈夫曼編碼的算法過程。統(tǒng)計字符頻率在進(jìn)行哈夫曼編碼前，首先需

2024-01-30 11:27:10

316

已全部加載完成

搜索歷史

Unicode編碼介紹

評論