저는 알고 있습니다. 왜냐하면 sizeof는 컴파일러용 매크로로 알고 있기 때문입니다.
주제라서 [우와우와우왕]님이 올리신 글을 보고 본격적으로 함 파 보기로 했습니다.
수정해야 하니까 무척 난잡 해 질 것입니다.
있어야 할 것 입니다.
없다면 할당 테이블을 관리하는 것으로 간주를 해도 무방하다는 가설을 세웠습니다.
전후를 찍어서 분석을 해 보기로 했습니다.
* 참고로 본 작업은 32bit Win7에서 Visual Studio로 작업을 했습니다.
* OS와 컴파일러마다 다를 것이라고 생각을 합니다.
######[ 할당받은 포인터 전후의 메모리를 Dump하도록 수정된 소스코드 ]#########################
#include<stdlib.h>
#include<memory.h>
int _tmain(int argc, _TCHAR* argv[])
{
char *pTmp;
char *ar[3];
char *arr[3] = { "AAA" , "BBBB" , "CCCCC" };
char arrr[3][20] = { "AAA", "BBBB", "CCCCC" };
int num[3];
int i;
int LP01,iMax;
#define MEM_ALLOC_SIZE 2 //메모리 할당 바이트수
ar[0] = (char *)malloc(MEM_ALLOC_SIZE);
ar[1] = (char *)malloc(MEM_ALLOC_SIZE);
ar[2] = (char *)malloc(MEM_ALLOC_SIZE);
for (i = 0; i < 3; i++)
{
printf("------[ LOOP %d ]--------------\r\n",i);
printf("SizeOfAR> %d \n", sizeof(ar[i]));
printf("SizeOfARR> %d \n", sizeof(arr[i]));
printf("SizeOfARRR>%d \n", sizeof(arrr[i]));
}
printf("------[ LOOP END ]------------\r\n");
printf("------[ Pointer Address ]--------------\r\n",i);
printf("PointerOfAR[0]> %p \n", ar[0]);
printf("PointerOfAR[1]> %p : Gap=%d // %d\n", ar[1], ar[1]-ar[0],MEM_ALLOC_SIZE);
printf("PointerOfAR[2]>%p : Gap=%d // %d\n", ar[2], ar[2]-ar[1],MEM_ALLOC_SIZE);
memset(ar[0],0x11,MEM_ALLOC_SIZE);
memset(ar[1],0x22,MEM_ALLOC_SIZE);
memset(ar[2],0x33,MEM_ALLOC_SIZE);
printf("------[ Pointer Header ]--------------\r\n",i);
for(i=0;i<3;i++)
{
pTmp=ar[i];
iMax=48; //헤더영역을 찾기위해서는 48바이트 이전부터 덤프한다.
pTmp-=iMax;
printf("PointerOfAr[%d]=%08p :",i,ar[i]);
for(LP01=0;LP01<(iMax+MEM_ALLOC_SIZE+16);LP01++) //뒤쪽 데이터 확인을 위하여 +16을 함.
{
printf(" %02X",pTmp[LP01]&0x000000FF);
}
printf("\r\n");
}
for (i = 0; i < 3; i++)
{
free(ar[i]);
}
// getchar();
return 0;
}
#############################################################################################
먼저 헤더영역의 정확한 사이즈를 알기 위해서 각 array에 4바이트만 할당을 하고
헤더영역 탐색 포인터를 -48에 옮겨 놓았을 때의 결과
------[ LOOP 0 ]--------------
SizeOfAR> 4
SizeOfARR> 4
SizeOfARRR>20
------[ LOOP 1 ]--------------
SizeOfAR> 4
SizeOfARR> 4
SizeOfARRR>20
------[ LOOP 2 ]--------------
SizeOfAR> 4
SizeOfARR> 4
SizeOfARRR>20
------[ LOOP END ]------------
------[ Pointer Address ]-------------- //이부분이 연속적이지 않을 수 있다.
PointerOfAR[0]> 006FE6B0
PointerOfAR[1]> 006FE6E0 : Gap=48 // 4
PointerOfAR[2]> 006FE710 : Gap=48 // 4
------[ Pointer Header ]--------------
PointerOfAr[0]=006FE6B0 : 67 00 00 00 FD FD FD FD 7C 7B 1F 27 75 6C 00 08 D8 E5 6F 00 C0 E6 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11 11 11
PointerOfAr[1]=006FE6E0 : 11 11 11 11 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 90 E6 6F 00 F0 E6 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22 22 22
PointerOfAr[2]=006FE710 : 22 22 22 22 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 C0 E6 6F 00 20 E7 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33 33 33
PointerOfAr[0]=006FE6B0 : // 0x11가 채워지기 시작하는 곳(포인터값)
67 00 00 00 //???
FD FD FD FD
7C 7B 1F 27
75 6C 00 08
D8 E5 6F 00
C0 E6 6F 00
00 00 00 00
00 00 00 00
04 00 00 00
01 00 00 00
BD 00 00 00
FD FD FD FD
11 11 11 11 //자기 버퍼(arr[0])에 채운 값
PointerOfAr[0]=006FE6E0 : // 0x22가 채워지기 시작하는 곳(포인터값)
11 11 11 11 //이전 할당버퍼 arr[0]에 채운 값
//----[ 헤더 추정부분 44bytes ]-------
FD FD FD FD
7C 7B 1F 27
64 6C 00 08
90 E6 6F 00
F0 E6 6F 00
00 00 00 00
00 00 00 00
04 00 00 00 //이 부분이 Size로 추측이 됨.
01 00 00 00
BE 00 00 00
FD FD FD FD
//-----------------------
22 22 22 22 //자기 버퍼(arr[1])에 채운 값
PointerOfAr[0]=006FE710 : // 0x33가 채워지기 시작하는 곳(포인터값)
22 22 22 22 //이전 할당버퍼 arr[1]에 채운 값
FD FD FD FD
7C 7B 1F 27
64 6C 00 08
C0 E6 6F 00
20 E7 6F 00
00 00 00 00
00 00 00 00
04 00 00 00
01 00 00 00
BF 00 00 00
FD FD FD FD
33 33 33 33 //자기 버퍼(arr[2])에 채운값
********************************************************
//1~4바이트까지는 포인터값 일정
PointerOfAR[0]> 006FE6B0
PointerOfAR[1]> 006FE6E0 : Gap=48 // 4
PointerOfAR[2]>006FE710 : Gap=48 // 4
********************************************************
######[ 할당 1바이트, 포인터 감소-48]################################################
PointerOfAr[0]=0020E6B0 : 67 00 00 00 FD FD FD FD 49 FC 37 6E 82 62 00 0B D8 E5 20 00 C0 E6 20 00 00 00 00 00 00 00 00 00 01 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11
PointerOfAr[1]=0020E6E0 : 11 FD FD FD FD 00 00 00 49 FC 37 6E 93 62 00 0B 90 E6 20 00 F0 E6 20 00 00 00 00 00 00 00 00 00 01 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22
PointerOfAr[2]=0020E710 : 22 FD FD FD FD 00 00 00 49 FC 37 6E 93 62 00 0B C0 E6 20 00 20 E7 20 00 00 00 00 00 00 00 00 00 01 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33
######[ 할당 2바이트, 포인터 감소-48]################################################
PointerOfAr[0]=006BE6B0 : 67 00 00 00 FD FD FD FD 7E C9 BB 24 93 A5 00 0A D8 E5 6B 00 C0 E6 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11
PointerOfAr[1]=006BE6E0 : 11 11 FD FD FD FD 00 00 7E C9 BB 24 82 A5 00 0A 90 E6 6B 00 F0 E6 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22
PointerOfAr[2]=006BE710 : 22 22 FD FD FD FD 00 00 7E C9 BB 24 82 A5 00 0A C0 E6 6B 00 20 E7 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33
######[ 할당 3바이트, 포인터 감소-48]################################################
PointerOfAr[0]=0049E6B0 : 67 00 00 00 FD FD FD FD A8 6C 56 3A AE 58 00 09 D8 E5 49 00 C0 E6 49 00 00 00 00 00 00 00 00 00 03 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11 11
PointerOfAr[1]=0049E6E0 : 11 11 11 FD FD FD FD 00 A8 6C 56 3A BF 58 00 09 90 E6 49 00 F0 E6 49 00 00 00 00 00 00 00 00 00 03 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22 22
PointerOfAr[2]=0049E710 : 22 22 22 FD FD FD FD 00 A8 6C 56 3A BF 58 00 09 C0 E6 49 00 20 E7 49 00 00 00 00 00 00 00 00 00 03 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33 33
######[ 할당 4바이트, 포인터 감소-48]################################################
PointerOfAr[0]=006FE6B0 : 67 00 00 00 FD FD FD FD 7C 7B 1F 27 75 6C 00 08 D8 E5 6F 00 C0 E6 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11 11 11
PointerOfAr[1]=006FE6E0 : 11 11 11 11 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 90 E6 6F 00 F0 E6 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22 22 22
PointerOfAr[2]=006FE710 : 22 22 22 22 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 C0 E6 6F 00 20 E7 6F 00 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33 33 33
********************************************************
//5바이트 할당시 포인터값 변경
PointerOfAR[0]> 0050E6B0
PointerOfAR[1]> 0050E6E8 : Gap=56 // 5
PointerOfAR[2]>0050E720 : Gap=56 // 5
********************************************************
######[ 할당 5바이트, 포인터 감소-48]################################################
PointerOfAr[0]=0050E6B0 : 67 00 00 00 FD FD FD FD A2 30 DD 06 6F 63 00 0F D8 E5 50 00 C8 E6 50 00 00 00 00 00 00 00 00 00 05 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11 11 11 11
PointerOfAr[1]=0050E6E8 : FD 00 00 00 00 00 00 00 A2 30 DD 06 7F 63 00 0F 90 E6 50 00 00 E7 50 00 00 00 00 00 00 00 00 00 05 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22 22 22 22
PointerOfAr[2]=0050E720 : FD 00 00 00 00 00 00 00 A2 30 DD 06 7F 63 00 0F C8 E6 50 00 38 E7 50 00 00 00 00 00 00 00 00 00 05 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33 33 33 33
********************************************************
//6바이트 할당시 포인터값 변경
PointerOfAR[0]> 0007E6B0
PointerOfAR[1]> 0007E6E8 : Gap=56 // 6
PointerOfAR[2]>0007E720 : Gap=56 // 6
********************************************************
######[ 할당 6바이트, 포인터 감소-48]################################################
PointerOfAr[0]=0007E6B0 : 67 00 00 00 FD FD FD FD 8A 98 BA 07 5D 91 00 0E D8 E5 07 00 C8 E6 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11 11 11 11 11
PointerOfAr[1]=0007E6E8 : FD FD 00 00 00 00 00 00 8A 98 BA 07 4D 91 00 0E 90 E6 07 00 00 E7 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22 22 22 22 22
PointerOfAr[2]=0007E720 : FD FD 00 00 00 00 00 00 8A 98 BA 07 4D 91 00 0E C8 E6 07 00 38 E7 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33 33 33 33 33
>>>>>>>>>>>>>>>>>>>
* 규칙성을 보이는 구간 (6바이트 할당시 예)
PointerOfAr[0]=0007E6B0 : 67 00 00 00 FD FD FD FD <8A 98 BA 07 5D 91 00 0E D8 E5 07 00 C8 E6 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD> 11 11 11 11 11 11
PointerOfAr[1]=0007E6E8 : FD FD 00 00 00 00 00 00 <8A 98 BA 07 4D 91 00 0E 90 E6 07 00 00 E7 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD> 22 22 22 22 22 22
PointerOfAr[2]=0007E720 : FD FD 00 00 00 00 00 00 <8A 98 BA 07 4D 91 00 0E C8 E6 07 00 38 E7 07 00 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD> 33 33 33 33 33 33
* 결국 malloc해서 받은 포인터 이전 40바이트가 header와 연관성이 있음을 추측 할 수 있다.
<
8A 98 BA 07
5D 91 00 0E
D8 E5 07 00
C8 E6 07 00
00 00 00 00
00 00 00 00
06 00 00 00 // 할당된 size
01 00 00 00
BD 00 00 00
FD FD FD FD //채움문자로 추측
>
* 포인터 변수로 보이는 데이터들(6바이트 할당시 예) : []내부값은 해당 위치 포인터 값임.
PointerOfAr[0]> [0007E688] : 8A 98 BA 07 5D 91 00 0E [0007E690] : <D8 E5 07 00> <C8 E6 07 00> 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD [0007E6B0] : 11 11 11 11 11 11
PointerOfAr[1]> [0007E6C0] : 8A 98 BA 07 4D 91 00 0E [0007E6C8] : <90 E6 07 00> <00 E7 07 00> 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD [0007E6E8] : 22 22 22 22 22 22
PointerOfAr[2]> [0007E6F8] : 8A 98 BA 07 4D 91 00 0E [0007E700] : <C8 E6 07 00> <38 E7 07 00> 00 00 00 00 00 00 00 00 06 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD [0007E720] : 33 33 33 33 33 33
* 포인터 변수로 보이는 데이터들(4바이트 할당시 예) : []내부값은 해당 위치 포인터 값임.
PointerOfAr[0]=67 00 00 00 FD FD FD FD 7C 7B 1F 27 75 6C 00 08 [006FE690] : <D8 E5 6F 00> <C0 E6 6F 00> 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD [006FE6B0] : 11 11 11 11
PointerOfAr[1]=11 11 11 11 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 [006FE6C0] : <90 E6 6F 00> <F0 E6 6F 00> 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD [006FE6E0] : 22 22 22 22
PointerOfAr[2]=22 22 22 22 FD FD FD FD 7C 7B 1F 27 64 6C 00 08 [006FE6F0] : <C0 E6 6F 00> <20 E7 6F 00> 00 00 00 00 00 00 00 00 04 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD [006FE710] : 33 33 33 33
* 따라서 다음과 같은 사실을 확인 할 수 있다.(32비트 Win7상의 Visual C의 경우에)
- 메모리 할당은 Linked List로 관리되고 있다.
- 연결리스트의 시작 포인터는 메모리 할당 포인터로 넘겨 받는 포인터에 0x20(32)를 뺀 값이다.
* 이제 마지막 남은 한가지 의문은 연결리스트 연결용 포인터 앞부분의 12바이트가
이전 리스트의 마지막 데이터인지 현재 리스트의 앞부분인에 대한 것이다.
코드를 수정해서 마지막 포인터 뒷부분을 찍어 보기전에 2바이트 할당을 살펴 보면...
######[ 할당 2바이트, 포인터 감소-48]################################################
PointerOfAr[0]=006BE6B0 : 67 00 00 00 <FD FD FD FD> <7E C9 BB 24 93 A5 00 0A> D8 E5 6B 00 C0 E6 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD 11 11
PointerOfAr[1]=006BE6E0 : 11 11 <FD FD FD FD> <00 00> <7E C9 BB 24 82 A5 00 0A> 90 E6 6B 00 F0 E6 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD 22 22
PointerOfAr[2]=006BE710 : 22 22 <FD FD FD FD> <00 00> <7E C9 BB 24 82 A5 00 0A> C0 E6 6B 00 20 E7 6B 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD 33 33
이전 포인터에 채워 넣었던 <11 11>이나 <22 22> 다음에 반드시 <FD FD FD FD>이 오고
4바이트 정렬을 위해서 <00 00>이 채워졌음을 알 수 있다.
따라서 적어도 이전 리스트로의 포인터 앞에 오는 <FD FD FD FD>는 이전 리스트의 마지막 데이터임을 알 수 있다.
이제 2바이트 할당시 뒤쪽으로 더 읽었을 때 <7E C9 BB 24 82 A5 00 0A>이 나오는지 보면 메모리 할당 구조체의
뒤쪽 데이터인지 앞쪽 데이터인지 알 수가 있을 것이다.
그 결과는 다음과 같다.
------[ Pointer Address ]--------------
PointerOfAR[0]> 0040E6B0
PointerOfAR[1]> 0040E6E0 : Gap=48 // 2
PointerOfAR[2]>0040E710 : Gap=48 // 2
------[ Pointer Header ]--------------
PointerOfAr[0]=67 00 00 00 FD FD FD FD
<69 7C B6 62 23 1F 00 0A>
D8 E5 40 00 C0 E6 40 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BD 00 00 00 FD FD FD FD
[0040E6B0] : 11 11 FD FD FD FD 00 00
<69 7C B6 62 32 1F 00 0A> 90 E6
PointerOfAr[1]=11 11 FD FD FD FD 00 00
<69 7C B6 62 32 1F 00 0A>
90 E6 40 00 F0 E6 40 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BE 00 00 00 FD FD FD FD
[0040E6E0] : 22 22 FD FD FD FD 00 00
<69 7C B6 62 32 1F 00 0A> C0 E6
PointerOfAr[2]=22 22 FD FD FD FD 00 00
<69 7C B6 62 32 1F 00 0A>
C0 E6 40 00 20 E7 40 00 00 00 00 00 00 00 00 00 02 00 00 00 01 00 00 00 BF 00 00 00 FD FD FD FD
[0040E710] : 33 33 FD FD FD FD 00 00
<69 7E B6 60 32 1F 00 0C> F0 E6
즉 다음과 같이 완전히 다른 값이 온다.
<69 7C B6 62 23 1F 00 0A> arr[0] 앞부분 // 5번째 23이 다르다.
<69 7C B6 62 32 1F 00 0A> arr[1] 앞부분
<69 7C B6 62 32 1F 00 0A> arr[2] 앞부분
<69 7E B6 60 32 1F 00 0C> arr[2] 뒷부분 //바이트 7E, 60, 0C가 다르다.
완전히 단정지을 수는 없지만 이전 리스트를 가리키는 포인터 앞의 8바이트는
현재 자기자신의 리스트와 과련된 데이터로 보인다.
이상의 결과 정리해서 Structure로 정의하면 대략 다음과 같지 않을까 싶네요...
<69 7C B6 62 32 1F 00 0A> //Current Node Info
90 E6 40 00 //Previous Node
F0 E6 40 00 //Next Node
00 00 00 00 //???
00 00 00 00 //???
02 00 00 00 //데이터사이즈
01 00 00 00 //???
BE 00 00 00 //???
FD FD FD FD //Fixed 문자
22 22 FD FD //Data + Fixed문자
FD FD 00 00 //Fixed문자 + 4바이트 정렬용 채움문자
typedef struct tagLinkedList{
char NodeInfo[8]; //
struct tagLinkedList *PreNode;
struct tagLinkedList *NextNode;
char Unknown1[4]; // or int32
char Unknown2[4]; // or int32
UINT32 SizeOfData;
char Unknown3[4]; // or int32
char Unknown4[4]; // or int32
UINT32 Reserved1; //0xFDFDFDFD
char DataBuff[x];
UINT32 Reserved2; //0xFDFDFDFD
char Dummy[n]; //4바이트 정렬용 문자
}
-------------------------------------------------------------------------
* 3줄요약
- OS 및 컴파일러마다 다르겠지만 Visual Studio의 경우는 할당된 메모리를 연결리스트처럼 관리한다.
- 메모리 할당 함수로 넘겨 받은 포인터의 앞부분에 헤더가 있으며 그곳에 할당된 메모리의 크기정보가 들어 있다.
- 실무에 유용한 것은 아니지만 그냥 호기심에서 분석을 해 본 것이다.
-------------------------------------------------------------------------