1.計算機存儲字符的本質(zhì)原理
計算機存儲字符型數(shù)據(jù)的本質(zhì):將字符轉(zhuǎn)為對應(yīng)碼值,然后將碼值轉(zhuǎn)換為二進制,最后存到計算機中。
2. 常用編碼介紹
2.1 概括
采用不同的編碼方式,則字符對應(yīng)的碼值就不同。目前常見的編碼方式有:
1. ASCII碼。固定使用1個字節(jié)來表示字符,可以表示128個字符。
2. Unicode碼。固定使用2個字節(jié)來表示字符(字母和漢字都是)。
3. utf-8。字母用1個字節(jié)表示,漢字用3個字節(jié)表示。
4. GBK。字母用1個字節(jié)表示,漢字用2個字節(jié)表示。
2.2 ASCII編碼
ASCII ((American Standard Code for Information Interchange): 美國信息交換標準代碼。
【優(yōu)點】只用1個字節(jié)表示字符。
【缺點】最多只表示127個字符,表示字符數(shù)量有限。
2.3 Unicode編碼
Unicode,統(tǒng)一碼,又叫萬國碼。
是為了解決傳統(tǒng)的字符編碼方案的局限而產(chǎn)生的,它為每種語言中的每個字符設(shè)定了統(tǒng)一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求。
【優(yōu)點】不會出現(xiàn)亂碼現(xiàn)象。
【缺點】固定使用2個字節(jié)表示一個字符(包括字母、漢字),比較占用存儲空間。
【注】Unicode碼向下兼容ASCII碼的。
字符'a'的ASCII碼值是97,對應(yīng)的Unicode碼值是0x0061(十進制表示就是97)
2.4 UTF-8編碼
UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是針對Unicode的一種可變長度字符編碼。(可以理解為是對Unicode編碼的改進)
它可以用來表示Unicode編碼中的任何字符,而且其編碼中的第一個字節(jié)仍與ASCII相容(即同樣向下兼容ASCII編碼),使得原來處理ASCII字符的軟件無須或只進行少部分修改后,便可繼續(xù)使用。因此,它逐漸成為電子郵件、網(wǎng)頁及其他存儲或傳送文字的應(yīng)用中,優(yōu)先采用的編碼。文章來源:http://www.zghlxwxcb.cn/news/detail-404316.html
【特點】字母用1個字節(jié)表示,漢字用3個字節(jié)。文章來源地址http://www.zghlxwxcb.cn/news/detail-404316.html
到了這里,關(guān)于【Java】計算機如何存儲字符&&常用編碼介紹的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!