數(shù)據(jù)類型介紹
內置類型(C語言本身就具有的類型):
char //字符數(shù)據(jù)類型
short //短整型
int //整形
long //長整型
long long //更長的整形
float //單精度浮點型
double //雙精度浮點型
類型的意義:
1.使用這個類型開辟內存空間的大?。ù笮Q定了使用的范圍)
2.如何看待內存空間的視角
類型的基本歸類
整形家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
注:字符類型底層存儲的是這個字符的ASCII值,ASCII值是個整數(shù)
浮點數(shù)家族:
float
double
構造類型(自定義類型):
- 數(shù)組類型
#include<stdio.h>
int main()
{
int arr[10]; // int [10]是arr的類型
int arr2[5]; //int [5]是arr2的類型
//這兩個數(shù)組的類型是不同的
return 0;
}
注:數(shù)組類型是一種自定義類型數(shù)組放幾個元素自己指定,數(shù)組的類型也可以自己指定
- 結構體類型 struct
- 枚舉類型 enum
- 聯(lián)合類型 union
指針類型:
int *pi
char *pc
float *pf
void *pv
空類型
void 表示空類型(無類型)
通常應用于:
函數(shù)的返回類型 void test();
函數(shù)的參數(shù) void test(void);
指針類型 void *pv;
整形在內存中的存儲
注:
- 數(shù)據(jù)在內存中以二進制的形式存儲
- 對于整數(shù)而言整數(shù)的二進制表示有三種表示形式:原碼、反碼、補碼
- 對正整數(shù)而言正整數(shù)的原碼、反碼、補碼相同
- 對負整數(shù)而言負整數(shù)的原碼、反碼、補碼不同,原碼、反碼、補碼是要進行計算的
- 對負整數(shù)而言負整數(shù)的原碼、反碼、補碼有三種表示方法均有三種符號位和數(shù)值為兩部分,符號位(二進制中的最高位)都是用0表示的正,用1表示負,而數(shù)值位三種表示方法個不相同。按照數(shù)據(jù)的數(shù)值直接寫出的二進制序列就是原碼。原碼的符號位不變,其他位按位取反,得到的就是反碼。反碼+1得到的就是補碼。
- 整數(shù)在內存中是以二進制補碼的形式存儲的
總結:
原碼、反碼、補碼
計算機中的有符號數(shù)有三種表示方法,即原碼、反碼和補碼。
三種表示方法均有符號位和數(shù)值位兩部分,符號位都是用0表示“正”,用1表示“負”,而數(shù)值位三種表示方法各不相同。
原碼:直接將二進制按照正負數(shù)的形式翻譯成二進制就可以。
反碼:將原碼的符號位不變,其他位依次按位取反就可以得到了。
補碼:反碼+1就得到補碼。
正數(shù)的原、反、補碼都相同。
對于整形來說:數(shù)據(jù)存放內存中其實存放的是補碼。
使用補碼存儲數(shù)據(jù)的原因:
內存中的數(shù)據(jù)是以補碼的形式存儲的,這樣CPU使用補碼進行計算才能得出正確的結果
在計算機中,數(shù)值一律用補碼來表示和存儲。原因在于,使用補碼,可以將符號位和數(shù)值域統(tǒng)一處理;同時,加法和減法也可以統(tǒng)一處理(CPU只有加法器)此外,補碼與原碼相互轉換,其運算過程是相同的(即取反,在+1),不需要額外的硬件電路。
大小端介紹
實例一:
不管是整數(shù)里面的正整數(shù)還是負整數(shù),發(fā)現(xiàn)在當前編譯器底下,這些補碼都是倒著存儲的
大小端定義:
- 大端(存儲)模式(大端字節(jié)序),是指數(shù)據(jù)的低位保存在內存的高地址中,而數(shù)據(jù)的高位,保存在內存的低地址中。
- 小端(存儲)模式(小端字節(jié)序),是指數(shù)據(jù)的低位保存在內存的低地址中,而數(shù)據(jù)的高位,保存在內存的高地址中。
當前編譯器采用的是小端字節(jié)序的存儲模式
大端字節(jié)序和小端字節(jié)序存在的意義
在計算機系統(tǒng)中,我們是以字節(jié)為單位的,每個地址單元都對應著一個字節(jié),一個字節(jié)為8bit。但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對于位數(shù)大于8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個字節(jié),那么必然存在著一個如果將多個字節(jié)安排的問題。因此就導致了大端存儲模式和小端存儲模式。
例如一個 16bit 的 short 型 x ,在內存中的地址為 0x0010 , x 的值為 0x1122 ,那么 0x11為高字節(jié), 0x22為低字節(jié)。對于大端模式,就將 0x11 放在低地址中,即 0x0010 中,0x22 放在高地址中,即 0x0011 中。小端模式,剛好相反。我們常用的 X86 結構是小端模式,而 KEIL C51 則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來選擇是大端模式還是小端模式。
實例二(經典面試題):
請簡述大端字節(jié)序和小端字節(jié)序的概念,設計一個小程序來判斷當前機器的字節(jié)序。
優(yōu)化:
int check_sys()
{
int a = 1;
return *(char*)&a;//返回1表示小段,返回0表示大段
}
int main()
{
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
整形在內存中的存儲的相關練習
實例一:
//輸出的是什么
#include<stdio.h>
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("a=%d\nb=%d\nc=%d\n", a, b, c);
return 0;
}
運行結果
分析
注:
- %d打印是以原碼的形式進行打印的。
- char類型到底是unsigned char類型還是signed char類型,C語言標準并沒有規(guī)定取決于編譯器,但是大部分編譯器底下char類型指的是signed char類型
- int類型指的是signed char類型
- short類型指的是signed short類型
實例二:
#include<stdio.h>
int main()
{
char a = -128;
printf("%u\n", a); //%u表示打印的是無符號數(shù)
return 0;
}
運行結果
分析
注:無符號整數(shù)的原、反、補碼相同
實例三:
#include<stdio.h>
int main()
{
char a = 128;
printf("%u\n", a);
return 0;
}
運行結果
分析
補充:
- char類型如果在內存中存儲的是10000000二進制序列,這個數(shù)字是不能計算的因為這個二進制序列不能再減一了,這個二進制序列直接就會被當成-128(直接被解析成-128)。
- 有符號char類型的取值范圍是[-128,127]
- 無符號char類型的取值范圍是[0,255]
實例四:
#include<stdio.h>
int main()
{
int i = -20;
unsigned int j = 10;
printf("%d\n", i + j);
return 0;
}
運行結果
分析
實例五:
#include<stdio.h>
int main()
{
unsigned int i;
for (i = 9;i >= 0;i--)
{
printf("%u\n", i);
}
return 0;
}
運行結果:死循環(huán)
分析:
當i為unsigned int類型時,它是恒大于等于零的,for循環(huán)中的判斷條件是i>=0是恒為真的,因此該循環(huán)為死循環(huán)。(因為當i為負數(shù)時會將i轉化為較大的正整數(shù)(因為i為unsigned int類型))
實例六:
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
int main()
{
char a[1000];
int i;
for (i = 0;i < 1000;i++)
{
a[i] = -1 - i;
}
printf("%d", strlen(a));
return 0;
}
運行結果
分析
補充
實例七:
#include<stdio.h>
unsigned char i=0;
int main()
{
for (i = 0;i <=255;i++)
{
printf("hello world\n");
}
return 0;
}
運行結果:死循環(huán)
分析
當i為unsigned char類型時,它的范圍是[0,255],它是恒小于等于255的,for循環(huán)中的判斷條件是i<=255是恒為真的,無論i為何值判斷條件恒為真,因此該循環(huán)為死循環(huán)。(當i=256(i最大為255)是會把i轉化為0(i為unsigned char類型)從而進行死循環(huán)。)
浮點型在內存中的存儲
常見的浮點數(shù):
3.14159
1E10 //1.0*10^10
浮點數(shù)家族包括: float、double、long double 類型。
注:大多數(shù)編譯器不支持long double 類型,這是C99中才引入的類型
浮點數(shù)表示的范圍:float.h中定義
整形表示的范圍:limits.h中定義
注:
- 對于整形家族它們的取值范圍定義在limits.h的頭文件里
- 對于浮點型家族這些變量創(chuàng)建類型和取值范圍是定義在float.h的頭文件里
- C語言中,雙精度浮點(double)型,占8 個字節(jié)(64位)內存空間。其數(shù)值范圍為1.7E-308~1.7E+308,雙精度完全保證的有效數(shù)字是15位,16位只是部分數(shù)值有保證,而單精度保證7位有效數(shù)字,部分數(shù)值有8位有效數(shù)。
- 單精度浮點數(shù)%f輸出float類型,輸出6位小數(shù);雙精度浮點數(shù)用%lf格式輸出,輸出6位小數(shù)。
浮點數(shù)的存儲
注:浮點數(shù)和整數(shù)在內存中存儲的方式一定是有區(qū)別的
浮點型在內存中的存儲相關介紹
根據(jù)國際標準IEEE(電氣和電子工程協(xié)會) 754,任意一個二進制浮點數(shù)V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s表示符號位,當s=0,V為正數(shù);當s=1,V為負數(shù)。
M表示有效數(shù)字,大于等于1,小于2。
2^E表示指數(shù)位
舉例:
-
十進制的5.0,寫成二進制是 101.0 ,相當于 1.01×2^2 。 那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。
-
十進制的-5.0,寫成二進制是 -101.0 ,相當于 -1.01×2^2 。那么,s=1,M=1.01,E=2。
-
十進制的5.5,寫成二進制是 101.1 ,相當于 1.011×2^2 。那么,s=0,M=1.011,E=2。
IEEE 754規(guī)定對于32位的浮點數(shù)(float類型),最高的1位是符號位s,接著的8位是指數(shù)E,剩下的23位為有效數(shù)字M。
對于64位的浮點數(shù)(double類型),最高的1位是符號位S,接著的11位是指數(shù)E,剩下的52位為有效數(shù)字M。
浮點數(shù)在內存中存儲:
IEEE 754對有效數(shù)字M和指數(shù)E,還有一些特別規(guī)定。 前面說過, 1≤M<2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數(shù)部分。
IEEE 754規(guī)定,在計算機內部保存M時,默認這個數(shù)的第一位總是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節(jié)省1位有效數(shù)字。以32位浮點數(shù)為例,留給M只有23位,將第一位的1舍去以后,等于可以保存24位有效數(shù)字。
至于指數(shù)E,情況就比較復雜。
首先,E為一個無符號整數(shù)(unsigned int) 這意味著,如果E為8位,它的取值范圍為0~ 255;如果E為11位,它的取值范圍為0~2047。但是,我們知道,科學計數(shù)法中的E是可以出現(xiàn)負數(shù)的,所以IEEE 754規(guī)定,存入內存時E的真實值必須再加上一個中間數(shù),對于8位的E,這個中間數(shù)是127;對于11位的E,這個中間數(shù)是1023。比如,2^10的E是10,所以保存成32位浮點數(shù)時,必須保存成10+127=137,即10001001。
浮點數(shù)在內存中取出:
然后,指數(shù)E從內存中取出還可以再分成三種情況:
E不全為0或不全為1
這時,浮點數(shù)就采用下面的規(guī)則表示,即指數(shù)E的計算值減去127(或1023),得到真實值,再將有效數(shù)字M前加上第一位的1。 比如: 0.5(1/2)的二進制形式為0.1,由于規(guī)定正數(shù)部分必須為1,即將小數(shù)點右移1位,則為1.0*2^(-1),其階碼為-1+127=126,表示為01111110,而尾數(shù)1.0去掉整數(shù)部分為0,補齊0到23位00000000000000000000000,則其二進制表示形式為
0 01111110 00000000000000000000000
E全為0
這時,浮點數(shù)的指數(shù)E等于1-127(或者1-1023)即為真實值, 有效數(shù)字M不再加上第一位的1,而是還原為0.xxxxxx的小數(shù)。這樣做是為了表示±0,以及接近于0的很小的數(shù)字。
E全為1
這時,如果有效數(shù)字M全為0,表示±無窮大(正負取決于符號位s)。
注:IEEE 754規(guī)定浮點數(shù)可以這樣拆分而C語言是按照IEEE 754這樣的方式進行存儲的,其中C++也是這樣存儲的(其他語言不確定)。
實例一:
實例二:
分析:
- 0x00000009 還原成浮點數(shù)就成了 0.000000 :首先將 0x00000009 拆分,得到第一位符號位s=0,后面8位的指數(shù) E=00000000 ,最后23位的有效數(shù)字M=000 0000 0000 0000 00001001。
9 -> 0000 0000 0000 0000 0000 0000 0000 1001
- 由于指數(shù)E全為0,所以符合上面的第二種情況。因此浮點數(shù)V就寫成: V=(-1)^0 ×0.00000000000000000001001×2^(-126)=1.001×2 ^ (-146) ,顯然V是一個很小的接近于0的正數(shù),所以用十進制小數(shù)表示就是0.000000。
- 第二部分中浮點數(shù)9.0還原成整數(shù)就成了1091567616:首先,浮點數(shù)9.0等于二進制的1001.0,即1.001×2^3。
9.0 -> 1001.0 ->(-1)^01.0012^3 -> s=0, M=1.001,E=3+127=130
- 那么,第一位的符號位s=0,有效數(shù)字M等于001后面再加20個0,湊滿23位,指數(shù)E等于3+127=130,即10000010。 所以,寫成二進制形式,應該是s+E+M,即
0 10000010 001 0000 0000 0000 0000 0000
- 這個32位的二進制數(shù),還原成十進制,正是 1091567616
注: %f打印浮點數(shù)時只打印小數(shù)點后面的六位
補充:上面的代碼思路是按整數(shù)或者浮點數(shù)的形式存儲到內存,再以浮點數(shù)或者整數(shù)的形式從內存中取出。但是這種思路將整數(shù)或者浮點數(shù)的形式存儲到內存,再以整數(shù)或者浮點數(shù)的形式從內存中取出,再以浮點數(shù)或者整數(shù)的形式進行打印這樣的思路是不對的。
eg:文章來源:http://www.zghlxwxcb.cn/news/detail-437514.html
int main()
{
float f=9.0f;
printf("%d\n",f);
return 0;
}
注:C語言中printf用%d輸出float類型數(shù)據(jù),或以%f輸出int型數(shù)據(jù)的結果文章來源地址http://www.zghlxwxcb.cn/news/detail-437514.html
到了這里,關于C語言—深度剖析數(shù)據(jù)在內存中的存儲的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!