1.數據類型介紹
C語言中的基本內置類型如下:
char //字符數據類型
short //短整型
int //整型
long //長整型
long long //更長的整型
float //單精度浮點數
double //雙精度浮點數
類型的意義:
1.使用這個類型開辟內存空間的大?。ù笮Q定了使用范圍)。
2.如何看待內存空間的視角。
1.1 類型的基本歸類
整型家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
注意:char有些編譯器沒有規(guī)定是unsigned還是signed
浮點數家族:
float
double
構造類型:
> 數組類型
> 結構體類型 struct
> 枚舉類型 enum
> 聯(lián)合類型 union
指針類型:
int *pi;
char *pc;
float* pf;
void* pv;
空類型:
void 表示空類型(無類型)
通常應用于函數的返回類型、函數的參數、指針類型。
2.整型在內存中的存儲
整型在內存中的存儲通常采用二進制的表示方式。整型變量被分配一定的內存空間來存儲其值,這個內存空間的大小由整型的數據類型決定,例如
int
類型通常使用4個字節(jié)(32位)或者8個字節(jié)(64位)。
我們知道為int類型分配四個字節(jié)的空間。 那如何存儲?
2.1 原碼、反碼、補碼
在計算機中,原碼、反碼和補碼是用來表示有符號整數的不同編碼方式。
原碼: 原碼是最簡單的表示有符號整數的方式。在原碼中,整數的最高位(最左邊的位)用于表示符號,0表示正數,1表示負數,其余位用二進制表示整數的絕對值。例如,用8位表示一個有符號整數,-5的原碼為 10000101,+5的原碼為 00000101。
反碼: 反碼是將正數的原碼保持不變,負數的原碼按位取反得到的。即負數的反碼是將其原碼中的每一位取反(0變?yōu)?,1變?yōu)?)。例如,用8位表示一個有符號整數,-5的反碼為 11111010,+5的反碼為 00000101。
補碼: 補碼是計算機中最常用的表示有符號整數的方式。在補碼中,正數的補碼與原碼相同,而負數的補碼是其反碼加1。即負數的補碼是將其反碼中的每一位取反(0變?yōu)?,1變?yōu)?),然后再加1。例如,用8位表示一個有符號整數,-5的補碼為 11111011,+5的補碼為 00000101。
總結:
正數的原、反、補碼都相同。
負整數的三種表示方法各不相同。
原碼:直接將數值按照正負數的形式翻譯成二進制就可以得到原碼。
反碼:將原碼的符號位不變,其他位依次按位取反就可以得到反碼。
補碼:反碼+1就得到補碼。
對于整型來說:數據存放內存中其實存放的是補碼。
為什么呢?
為什么要使用補碼表示有符號整數?補碼的一個重要特點是,它使得整數的加法和減法可以通過相同的硬件電路來實現(xiàn)**(CPU只有加法器)**,簡化了計算機的設計。此外,補碼還解決了原碼和反碼的一個問題,即加法運算的進位問題。
舉例說明加法運算: 以用8位表示的補碼為例,考慮計算 +5(補碼:00000101) + (-3,補碼:11111101)。
00000101 (+5)
11111101 (-3)
00000010 (+2)
通過補碼的加法運算,我們得到了正確的結果+2。這里沒有出現(xiàn)進位問題,因為補碼表示方式使得減法可以用加法的規(guī)則來進行。
我們看看在內存中的存儲:
我們可以看到對于a和b分別存儲的是16進制的補碼。但是我們發(fā)現(xiàn)順序有點不對勁。
這又是為什么?答案是大小端問題
2.2 大小端
在計算機體系結構中,大小端問題涉及到多字節(jié)數據(例如整數、浮點數)在內存中存儲的順序。具體來說,大小端問題涉及到多字節(jié)數據的最低有效字節(jié)和最高有效字節(jié)在內存中的存放順序。
大端: 在大端存儲方式中,多字節(jié)數據的最高有效字節(jié)(高位字節(jié))存儲在低地址處,而最低有效字節(jié)(低位字節(jié))存儲在高地址處。
小端: 在小端存儲方式中,多字節(jié)數據的最低有效字節(jié)(低位字節(jié))存儲在低地址處,而最高有效字節(jié)(高位字節(jié))存儲在高地址處。這種方式正好與大端相反/
為什么有大端和小端:
歷史背景: 計算機體系結構的發(fā)展始于20世紀50年代和60年代,那時不同的計算機制造商開發(fā)出了各自的計算機系統(tǒng)。這些計算機系統(tǒng)在硬件設計上有很多不同之處,其中包括數據在內存中的存儲方式。最初,并沒有一個統(tǒng)一的標準來定義多字節(jié)數據的存儲順序,因此出現(xiàn)了不同的字節(jié)序方式。
硬件設計差異: 大小端的差異主要源于計算機中多字節(jié)數據的存儲方式。在計算機中,數據通常按字節(jié)存儲在內存中,而多字節(jié)數據(如整數、浮點數)由多個字節(jié)組成。問題在于,這些字節(jié)應該以什么順序存儲。
大端方式: 早期的一些計算機采用了大端方式,將多字節(jié)數據的最高有效字節(jié)存儲在低地址處,最低有效字節(jié)存儲在高地址處。這樣設計的計算機在處理多字節(jié)數據時,能夠按照與人們閱讀數字相同的順序進行操作,比較直觀。例如,16位整數0x1234在內存中存儲為 12 34。
小端方式: 隨著計算機技術的發(fā)展,有些計算機制造商采用了小端方式,將多字節(jié)數據的最低有效字節(jié)存儲在低地址處,最高有效字節(jié)存儲在高地址處。小端方式與大端方式相反,但同樣合理。小端方式在處理多字節(jié)數據時,能夠直接使用低地址來表示數據的低位部分,這樣設計有助于一些特定操作的實現(xiàn)。例如,16位整數0x1234在內存中存儲為 34 12。
VS中就是采用的小端方式存儲:
百度2015年系統(tǒng)工程師筆試題:
請簡述大端字節(jié)序和小端字節(jié)序的概念,設計一個小程序來判斷當前機器的字節(jié)序。(10分)
//代碼1
#include <stdio.h>
int check_sys() {
int i = 1;
return (*(char *) &i);
}
int main() {
int ret = check_sys();
if (ret == 1) {
printf("小端\n");
} else {
printf("大端\n");
}
return 0;
}
//代碼2
int check_sys() {
union {
int i;
char c;
} un;
un.i = 1;
return un.c;
}
2.3 練習
//練習1
int main() {
char a = -1;// -1截斷后存儲在a中
//1000000000000000000000000000001 - 原碼
//1111111111111111111111111111110 - 反碼
//1111111111111111111111111111111 - 補碼
//11111111 - 截斷(從右往左截斷)
//還原成原碼-1 取反得10000001 = -1
signed char b = -1;
//1111111111111111111111111111111 - 補碼
//11111111 - 截斷后
//還原成原碼-1 取反得10000001 = -1
unsigned char c = -1;
//其實一眼就能看出來 -1的補碼是11111111 無符號就是255 8位二進制最高的表示范圍
//1111111111111111111111111111111 - 補碼
//11111111
printf("a=%d,b=%d,c=%d", a, b, c);//a=-1,b=-1,c=255
//c因為是以%d打印,所以還會涉及整型提升
//11111111
//0000000000000000000000011111111 - 整型提升 無符號 補0后 為正數 補碼 原碼相同 直接計算
//有符號整型提升補首位字符 無符號直接高位補0
return 0;
}
//練習2
//%u是打印無符號整數,認為內存中存放的補碼對應的是一個無符號整數
int main(){
char a = -128;
//10000000000000000000000010000000
//11111111111111111111111101111111
//11111111111111111111111110000000 - 補碼
//10000000 - 截斷
//11111111111111111111111110000000 - 帶符號整型提升高位補符號位
printf("%u\n", a); //4294967168
char b = 128;
//00000000000000000000000010000000 - 正數 原 反 補 一樣
//10000000 - 截斷
//11111111111111111111111110000000 - 整型提升
printf("%u\n", b); //4294967168
return 0;
}
//練習3
int main(){
int i = -20;
//10000000000000000000000000010100 - 原碼
//11111111111111111111111111101011 - 反碼
//11111111111111111111111111101100 - 補碼
unsigned int j = 10;
//00000000000000000000000000001010
printf("%d\n", i + j); //-10
//11111111111111111111111111101100 - 補碼
//00000000000000000000000000001010 - 補碼
//11111111111111111111111111110110 - 補碼+補碼
//10000000000000000000000000001001 - 取反后+1得到下面的
//10000000000000000000000000001010 - -10
return 0;
}
//練習4
int main(){
unsigned int i; //無符號整型 沒有負數
for (i = 9; i >= 0; i--) //無符號整數一定大于0 所以循環(huán)一直進行
{
printf("%u\n", i); //死循環(huán)
}
return 0;
}
//練習5
int main(){
char a[1000]; //范圍-128-127
//0 -1 -2 -3 -4...-128 127 126....1 0 一個圓,一共255個值
int i;
for (i = 0; i < 1000; i++)
{
a[i] = -1 - i;
}
printf("%d", strlen(a)); //255
return 0;
}
//練習6
unsigned char i = 0; //0-255
int main(){
for (i = 0; i <= 255; i++) //255后i++之后i變成了0 char的值最大為255
{
printf("hello world\n"); //死循環(huán)
}
return 0;
}
3.浮點數在內存中的存儲
常見的浮點數:3.14159 1E10
浮點數家族包括: float
、double、long double
類型。
浮點數表示的范圍:float.h
中定義
整型類型的取值范圍:limits.h
中定義
浮點數存儲的例子:
#include <stdio.h>
int main() {
int n = 9;
float *pFloat = (float *) &n;
printf("n的值為:%d\n", n);
printf("*pFloat的值為:%f\n", *pFloat);
*pFloat = 9.0;
printf("num的值為:%d\n", n);
printf("*pFloat的值為:%f\n", *pFloat);
return 0;
}
輸出結果:
n的值為:9
*pFloat的值為:0.000000
num的值為:1091567616
*pFloat的值為:9.000000
讓我們解釋每一步輸出的原因:
n的值為:9
:這是正確的輸出,打印了變量n
的值,它是整數9。
*pFloat的值為:0.000000
:這里出現(xiàn)了問題。通過將pFloat
指針解釋為float*
,它嘗試將n
的內存(整數類型的內存)解釋為浮點數。由于浮點數和整數的內部表示方式不同,以這種方式訪問n
的值會導致不正確的浮點數值(通常是未初始化的值)。所以,打印出來的值是錯誤的。
num的值為:1091567616
:這個輸出是由于前面的*pFloat = 9.0;
操作,它將浮點數值9.0寫入了n
的內存中,導致了n
的值被修改為1091567616。這個值是浮點數9.0在內存中的二進制表示轉換成整數形式的結果。
*pFloat的值為:9.000000
:在上一步中,我們將浮點數值9.0寫入了n
的內存中,所以現(xiàn)在pFloat
指向的內存被解釋為浮點數9.0。因此,打印出的結果是9.0。
3.1 浮點數存儲規(guī)則
根據國際標準IEEE(電氣和電子工程協(xié)會) 754,任意一個二進制浮點數V可以表示成下面的形式:
(-1) ^ S * M * 2 ^ E
(-1) ^ S表示符號位,當S = 0,V為正數;當S = 1,V為負數。
M表示有效數字,大于等于1,小于2。
2 ^ E表示指數位。
舉例來說:
十進制的5.0,寫成二進制是 101.0 ,相當于 1.01×2^2 。
那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。
十進制的-5.0,寫成二進制是 -101.0 ,相當于 -1.01×2^2 。那么,S=1,M=1.01,E=2。
IEEE 754規(guī)定:
對于32位的浮點數,最高的1位是符號位s,接著的8位是指數E,剩下的23位為有效數字M。
對于64位的浮點數,最高的1位是符號位S,接著的11位是指數E,剩下的52位為有效數字M。
IEEE 754對有效數字M和指數E,還有一些特別規(guī)定。
前面說過, 1≤M<2
,也就是說,M可以寫成 1.xxxxxx
的形式,其中xxxxxx表示小數部分。
IEEE 754規(guī)定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節(jié)省1位有效數字。以32位浮點數為例,留給M只有23位, 將第一位的1舍去以后,等于可以保存24位有效數字。
至于指數E,情況就比較復雜。
首先,E為一個無符號整數(unsigned int)
這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。但是,我們 知道,科學計數法中的E是可以出現(xiàn)負數的,所以IEEE 754規(guī)定,存入內存時E的真實值必須再加上一個中間數,對于8位的E,這個中間數 是127;對于11位的E,這個中間 數是1023。比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即 10001001。
然后,指數E從內存中取出還可以再分成三種情況:
E不全為0或不全為1
這時,浮點數就采用下面的規(guī)則表示,即指數E的計算值減去127(或1023),得到真實值,再將 有效數字M前加上第一位的1。
比如: 0.5(1/2)的二進制形式為0.1,由于規(guī)定正數部分必須為1,即將小數點右移1位,則為 1.0*2^(-1),其階碼為-1+127=126,表示為 01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,則其二進制表示形式為:
0 01111110 00000000000000000000000
E全為0
這時,浮點數的指數E等于1-127(或者1-1023)即為真實值, 有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。這樣做是為了表示±0,以及接近于0的很小的數字。
E全為1
這時,如果有效數字M全為0,表示±無窮大(正負取決于符號位s)
解釋前面的題目:
下面,讓我們回到一開始的問題:為什么 0x00000009 還原成浮點數,就成了 0.000000 ?
首先,將 0x00000009 拆分,得到第一位符號位s=0,后面8位的指數 E=00000000 , 最后23位的有效數字M=000 0000 0000 0000 0000 1001。
9 -> 0000 0000 0000 0000 0000 0000 0000 1001
由于指數E全為0,所以符合上一節(jié)的第二種情況。因此,浮點數V就寫成:
V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)
顯然,V是一個很小的接近于0的正數,所以用十進制小數表示就是0.000000。
再看例題的第二部分。 請問浮點數9.0,如何用二進制表示?還原成十進制又是多少?
首先,浮點數9.0等于二進制的1001.0,即1.001×2^3。
9.0 -> 1001.0 ->(-1)^01.0012^3 -> s=0, M=1.001,E=3+127=130
那么,第一位的符號位s=0,有效數字M等于001后面再加20個0,湊滿23位,指數E等于3+127=130, 即10000010。
所以,寫成二進制形式,應該是s+E+M,即文章來源:http://www.zghlxwxcb.cn/news/detail-600617.html
0 10000010 001 0000 0000 0000 0000 0000
這個32位的二進制數,還原成十進制,正是1091567616 。文章來源地址http://www.zghlxwxcb.cn/news/detail-600617.html
V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)
顯然,V是一個很小的接近于0的正數,所以用十進制小數表示就是0.000000。
再看例題的第二部分。 請問浮點數9.0,如何用二進制表示?還原成十進制又是多少?
首先,浮點數9.0等于二進制的1001.0,即1.001×2^3。
9.0 -> 1001.0 ->(-1)^01.0012^3 -> s=0, M=1.001,E=3+127=130
那么,第一位的符號位s=0,有效數字M等于001后面再加20個0,湊滿23位,指數E等于3+127=130, 即10000010。
所以,寫成二進制形式,應該是s+E+M,即
0 10000010 001 0000 0000 0000 0000 0000
這個32位的二進制數,還原成十進制,正是1091567616 。
到了這里,關于<C語言> 數據在內存中的存儲的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!