国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

字符集詳解

這篇具有很好參考價(jià)值的文章主要介紹了字符集詳解。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

常見字符集介紹

字符集基礎(chǔ)知識(shí):

計(jì)算機(jī)底層不可以直接存儲(chǔ)字符的。

計(jì)算機(jī)中底層只能存儲(chǔ)二進(jìn)制(0、1) 。

二進(jìn)制是可以轉(zhuǎn)換成十進(jìn)制的。

結(jié)論:計(jì)算機(jī)底層可以表示成十進(jìn)制編號(hào)。計(jì)算機(jī)可以給人類字符進(jìn)行編號(hào)存儲(chǔ),這套編號(hào)規(guī)則就是字符集。

ASCII字符集:

ASCII(American Standard Code for Information Interchange,美國(guó)信息交換標(biāo)準(zhǔn)代碼):包括了數(shù)字、英文、符號(hào)。

ASCII使用1個(gè)字節(jié)存儲(chǔ)一個(gè)字符,一個(gè)字節(jié)是8位,首位為0,總共可以表示128個(gè)字符信息,對(duì)于英文,數(shù)字來說是夠用的。

GBK:

window系統(tǒng)默認(rèn)的碼表。兼容ASCII碼表,也包含了幾萬個(gè)漢字,并支持繁體漢字以及部分日韓文字。

注意:GBK是中國(guó)的碼表,一個(gè)中文以兩個(gè)字節(jié)的形式存儲(chǔ)。但不包含世界上所有國(guó)家的文字。

Unicode碼表:

?unicode(又稱統(tǒng)一碼、萬國(guó)碼、單一碼)是計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界字符編碼標(biāo)準(zhǔn)。

容納世界上大多數(shù)國(guó)家的所有常見文字和符號(hào)。

Unicode會(huì)先通過UTF-8,UTF-16,以及 UTF-32編碼成二進(jìn)制后再存儲(chǔ)到計(jì)算機(jī),其中最為常見的就是UTF-8。

注意

Unicode是萬國(guó)碼,以UTF-8編碼后一個(gè)中文一般以三個(gè)字節(jié)的形式存儲(chǔ)。

UTF-8也要兼容ASCII編碼表。

技術(shù)人員都應(yīng)該使用UTF-8的字符集編碼。

編碼前和編碼后的字符集需要一致,否則會(huì)出現(xiàn)中文亂碼。

漢字存儲(chǔ)和展示過程解析

字符集詳解,java,java,開發(fā)語言

總結(jié)

1、字符串常見的字符底層組成是什么樣的?

英文和數(shù)字等在任何國(guó)家的字符集中都占1個(gè)字節(jié)。

GBK字符中一個(gè)中文字符占2個(gè)字節(jié)。

UTF-8編碼中一個(gè)中文1般占3個(gè)字節(jié)。

2、編碼前的字符集和編碼好的字符集有什么要求?

必須一致,否則會(huì)出現(xiàn)中文字符亂碼。

英文和數(shù)字在任何國(guó)家的編碼中都不會(huì)亂碼?。

字符集的編碼、解碼操作

String編碼

byte[] getBytes?()?使用平臺(tái)的默認(rèn)字符集將該 String編碼為一系列字節(jié),將結(jié)果存儲(chǔ)到新的字節(jié)數(shù)組中。

byte[] getBytes?(String charsetName)

String解碼

String?(byte[] bytes)?通過使用平臺(tái)的默認(rèn)字符集解碼指定的字節(jié)數(shù)組來構(gòu)造新的 String。

String?(byte[] bytes, String charsetName)?文章來源地址http://www.zghlxwxcb.cn/news/detail-731911.html

案例

public class Test {
    public static void main(String[] args) throws Exception {
        // 1、編碼:把文字轉(zhuǎn)換成字節(jié)(使用指定的編碼)
        String name = "abc我愛你中國(guó)";
        // byte[] bytes = name.getBytes(); // 以當(dāng)前代碼默認(rèn)字符集進(jìn)行編碼 (UTF-8)
        byte[] bytes = name.getBytes("GBK"); // 指定編碼
        System.out.println(bytes.length);
        System.out.println(Arrays.toString(bytes));

        // 2、解碼:把字節(jié)轉(zhuǎn)換成對(duì)應(yīng)的中文形式(編碼前 和 編碼后的字符集必須一致,否則亂碼 )
        // String rs = new String(bytes); // 默認(rèn)的UTF-8
        String rs = new String(bytes, "GBK"); // 指定GBK解碼
        System.out.println(rs);
    }
}

到了這里,關(guān)于字符集詳解的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Java基礎(chǔ)——IO流之字符集

    (1)IO前置內(nèi)容:字符集 1.字符集基礎(chǔ)知識(shí): 計(jì)算機(jī)底層不可以直接存儲(chǔ)字符,只能存儲(chǔ)二進(jìn)制(0,1)。 二進(jìn)制可以轉(zhuǎn)換成十進(jìn)制。 計(jì)算機(jī)底層可以表示十進(jìn)制編號(hào)。計(jì)算機(jī)可給人類字符進(jìn)行編號(hào)存儲(chǔ),這套編號(hào)規(guī)則就是字符集。 2.ASCII字符集:(1字節(jié)) ASCII(American S

    2023年04月17日
    瀏覽(24)
  • MySQL數(shù)據(jù)庫(kù)——MySQL字符集和校對(duì)規(guī)則詳解

    MySQL數(shù)據(jù)庫(kù)——MySQL字符集和校對(duì)規(guī)則詳解

    在講解字符集和校對(duì)規(guī)則之前,我們先來簡(jiǎn)單了解一下字符、字符集和字符編碼。 字符(Character) 是計(jì)算機(jī)中字母、數(shù)字、符號(hào)的統(tǒng)稱,一個(gè)字符可以是一個(gè)中文漢字、一個(gè)英文字母、一個(gè)阿拉伯?dāng)?shù)字、一個(gè)標(biāo)點(diǎn)符號(hào)等。 計(jì)算機(jī)是以二進(jìn)制的形式來存儲(chǔ)數(shù)據(jù)的。平時(shí)我們?cè)?/p>

    2024年02月05日
    瀏覽(20)
  • java中http請(qǐng)求,記得加字符集 UTF-8,StringEntity

    http請(qǐng)求經(jīng)常會(huì)遇到一些奇怪的問題,例如發(fā)送請(qǐng)求失敗,或者response出現(xiàn)問題,或者參數(shù)中帶了url調(diào)接口失敗,調(diào)用微信接口失敗,調(diào)用nginx轉(zhuǎn)發(fā)失敗,等等。 但用postman調(diào)用不會(huì)有問題。 這說明參數(shù)本身沒有問題,服務(wù)器也沒有問題,是客戶端的問題。在你的代碼里面,客

    2024年02月07日
    瀏覽(24)
  • 華為OD機(jī)試之全量和已占用字符集(Java源碼)

    華為OD機(jī)試之全量和已占用字符集(Java源碼)

    題目描述 給定兩個(gè)字符集合,一個(gè)是全量字符集,一個(gè)是已占用字符集,已占用字符集中的字符不能再使用。 輸入描述 輸入一個(gè)字符串 一定包含@,@前為全量字符集 @后的為已占用字符集 已占用字符集中的字符一定是全量字符集中的字符 字符集中的字符跟字符之間使用英文

    2024年02月07日
    瀏覽(21)
  • 【華為OD機(jī)試】全量和已占用字符集(python, java, c++, js)

    前言 :本專欄將持續(xù)更新華為OD機(jī)試題目,并進(jìn)行詳細(xì)的分析與解答,包含完整的代碼實(shí)現(xiàn),希望可以幫助到正在努力的你。關(guān)于OD機(jī)試流程、面經(jīng)、面試指導(dǎo)等,如有任何疑問,歡迎聯(lián)系我,wechat:steven_moda;email:nansun0903@163.com;備注:CSDN。 給定兩個(gè)字符集合,一個(gè)為全

    2024年02月11日
    瀏覽(22)
  • linux修改locale字符集編碼為UTF-8/GBK,修改語言區(qū)域?yàn)閦h-CN(中文-中國(guó))

    linux系統(tǒng)的語言、區(qū)域、字符集編碼由`locale’ [lo??k?l] 決定。 對(duì)應(yīng)配置文件路徑: centos7 /etc/locale.conf centos6 /etc/sysconfig/i18n 以下以centos&為例 LANG= LC_CTYPE=“POSIX” LC_NUMERIC=“POSIX” LC_TIME=“POSIX” LC_COLLATE=“POSIX” LC_MONETARY=“POSIX” LC_MESSAGES=“POSIX” LC_PAPER=“POSIX” LC_NAME=“

    2024年02月13日
    瀏覽(24)
  • 【華為OD機(jī)考 統(tǒng)一考試機(jī)試C卷】 全量和已占用字符集 、字符串統(tǒng)計(jì)(C++ Java JavaScript Python)

    2023年11月份,華為官方已經(jīng)將 華為OD機(jī)考:OD統(tǒng)一考試(A卷 / B卷)切換到 OD統(tǒng)一考試(C卷)和 OD統(tǒng)一考試(D卷) 。根據(jù)考友反饋:目前抽到的試卷為B卷或C卷/D卷,其中C卷居多 ,按照之前的經(jīng)驗(yàn)C卷部分考題會(huì)復(fù)用A卷,B卷題,博主正積極從考過的同學(xué)收集C卷和D卷真題。

    2024年02月05日
    瀏覽(25)
  • (二)java.sql.SQLException: 不支持的字符集 (在類路徑中添加 orai18n.jar): ZHS16GBK

    (二)java.sql.SQLException: 不支持的字符集 (在類路徑中添加 orai18n.jar): ZHS16GBK

    不支持的字符集 (在類路徑中添加 orai18n.jar): ZHS16GBK (一)SQL state [99999]; error code [17056]; 不支持的字符集 (在類路徑中添加 orai18n.jar): ZHS16GBK; nested exception (二)java.sql.SQLException: 不支持的字符集 (在類路徑中添加 orai18n.jar): ZHS16GBK java.sql.SQLException: 不支持的字符集 (在類路

    2024年02月09日
    瀏覽(22)
  • 算法加密與解密、字符編碼與字符集

    算法加密與解密、字符編碼與字符集

    加密保證數(shù)據(jù)不會(huì)被竊取或者修改 哈希算法 壓縮映射 :散列又稱為哈希,是把任意長(zhǎng)度的輸入通過散列算法變換成固定長(zhǎng)度的輸出,該輸出就是散列值。 哈希算法(Hash)又稱摘要算法(Digest),哈希算法的目的就是為了驗(yàn)證原始數(shù)據(jù)是否被篡改。 主流的散列算法有MD5和

    2024年02月03日
    瀏覽(26)
  • 有限字符集的字符串壓縮算法

    在開發(fā)中,經(jīng)常有上報(bào)線上堆棧來分析處理線上問題的場(chǎng)景,所以,對(duì)堆棧的壓縮和加密也是必不可少的。加密:可以使用AES對(duì)稱加密算法,壓縮:可以在上傳時(shí)利用protobuf天生的壓縮性對(duì)字符串進(jìn)行壓縮。 不過,出于對(duì)流量的節(jié)省和傳輸效率的提升,可以通過在堆棧上傳前

    2024年02月11日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包