Great Code 독후감 - 7~8장

gurugio의 이미지


7,8장은 페이지 수는 많지만 대부분의 컴퓨터 구조나 C 언어 시간에 배울 수 있는
정렬, 변수 생성/범위 등에 대한 설명을 하고 있어서 크게 볼 내용은 없었습니다.

이런 내용을 실제 어셈블리 코드로 확인해보신 분들이 별로 없으시겠지만
그렇게 꼭 눈으로 확인할 만큼 심각한 내용은 아니고
경력이 조금만 쌓여도 충분히 이해하고 체득하는 주제들인것 같습니다.

-------------

7장

아래 소스는 상수로 선언된 문자열과 배열로 정적 선언된 문자열의 차이를 확인하기 위한 소스이다.

먼저 상수로 선언한 문자열의 메모리 위치를 출력하고, 그 다음에는 전역 배열로 선언한 문자열의 메모리 위치를 출력한다.

  1
  2 #include <stdio.h>
  3
  4
  5 #define strconst "A string constant"
  6
  7 char strstatic[] = "A static string";
  8
  9
 10 int main(void)
 11 {
 12     char *sptr;
 13
 14     printf("const string: %s\n", strconst);
 15
 16     // 항상 실행할 때마다 같은 값임
 17     printf("value of constant string = %p\n", strconst);
 18     printf("address of constant string = %p\n", &strconst);
 19
 20     sptr = strconst;
 21
 22     // strconst 와 같은 값임
 23     printf("value of pointer variable = %p\n", sptr);
 24     // 지역 변수이므로 실행 할 때마다 다른 주소 값을 가짐
 25     printf("address of pointer variable = %p\n", &sptr);
 26
 27
 28     printf("------------------------------------\n");
 29     //-------------------------------------------
 30
 31     printf("static string: %s\n", strstatic);
 32
 33     printf("value of static string = %p\n", strstatic);
 34     printf("address of static string = %p\n", &strstatic);
 35
 36     sptr = strstatic;
 37
 38     printf("value of pointer variable = %p\n", sptr);
 39     printf("address of pointer variable = %p\n", &sptr);
 40
 41     return 0;
 42 }
 43
 44

실행 파일을 실행할 때마다 문자열의 주소 값이 변하지 않는다는 것을 확인할 수 있다. 즉 상수 변수나 전역 변수는 정적으로 메모리를 할당된다는 것을 확인했다. 물론 지역 변수는 실행때마다 스택 위치가 바뀌므로 메모리 주소도 계속 변한다.

gurugio@giolinux:~/src/tmp$ gcc a.c
gurugio@giolinux:~/src/tmp$ ./a.out
const string: A string constant
value of constant string = 0x4006d0           ---> rodata 섹션에 있는 메모리 포인터
address of constant string = 0x4006d0         ---> 배열이므로 값과 포인터가 동일함
value of pointer variable = 0x4006d0          ---> 포인터 값은 strconst의 메모리 포인터와 같음
address of pointer variable = 0x7fffbf2debd8  ---> sptr 변수 자체의 메모리 위치, 스택 영역의 주소
------------------------------------
static string: A static string
value of static string = 0x600af0             ---> data 섹션
address of static string = 0x600af0           ---> 동일한 값
value of pointer variable = 0x600af0          ---> 포인터 값은 변수의 주소
address of pointer variable = 0x7fffbf2debd8  

각 문자열이 어느 섹션이 저장되는지 확인하기 위해 readelf -S a.out 명령으로 각 섹션의 주소 범위 확인 해본다. 다음은 출력된 결과 중에 필요한 부분만 복사한 것이다.

[Nr] Name              Type             Address           Offset            Size
 
[15] .rodata           PROGBITS         00000000004006c8  000006c8          0000000000000137
 
[24] .data             PROGBITS         0000000000600ad0  00000ad0         0000000000000030

.rodata 섹션은 0x4006c8 ~ 0x4007ff 이고 .data 섹션은 0x600ad0 ~ 0x600aff 인 것을 확인할 수 있다.

만약 다음과 같이 rodata 섹션에 저장된 데이터를 수정하면 어떻게 될까?
컴파일 에러는 나지 않지만 실행 중 Segmentation fault 에러가 발생한다.

  1
  2 #include <stdio.h>
  3
  4
  5 #define strconst "A string constant"
  6
  7 char strstatic[] = "A static string";
  8
  9
 10 int main(void)
 11 {
 12     char *sptr;
 13
 14     printf("const string: %s\n", strconst);
 15
 16     // 항상 실행할 때마다 같은 값임
 17     printf("value of constant string = %p\n", strconst);
 18     printf("address of constant string = %p\n", &strconst);
 19
 20     sptr = strconst;
 21
 22     // strconst 와 같은 값임
 23     printf("value of pointer variable = %p\n", sptr);
 24     // 지역 변수이므로 실행 할 때마다 다른 주소 값을 가짐
 25     printf("address of pointer variable = %p\n", &sptr);
 26
 27     *(sptr+2) = 'X';
 28
 29     printf("------------------------------------\n");
 30     //-------------------------------------------
 31
 32     printf("static string: %s\n", strstatic);
 33
 34     printf("value of static string = %p\n", strstatic);
 35     printf("address of static string = %p\n", &strstatic);
 36
 37     sptr = strstatic;
 38
 39     printf("value of pointer variable = %p\n", sptr);
 40     printf("address of pointer variable = %p\n", &sptr);
 41
 42
 43
 44
 45     return 0;
 46 }
 47
 48

gurugio@giolinux:~/src/tmp$ gcc a.c
gurugio@giolinux:~/src/tmp$ ./a.out
const string: A string constant
value of constant string = 0x4006d0
address of constant string = 0x4006d0
value of pointer variable = 0x4006d0
address of pointer variable = 0x7fff8014ca48
Segmentation fault (core dumped)
gurugio@giolinux:~/src/tmp$

정확히 어떤 에러가 발생했는지 알아보기 위해 dmesg로 확인해보니 다음과 같은 에러 메시지가 출력되었다.

[ 2770.669461] a.out[13149]: segfault at 00000000004006d2 rip 0000000000400562 rsp 00007fff8014ca40 error 7

이 메시지를 google님께 물어보니 do_page_fault() 커널 함수에서 출력하는 메시지라고 하는데 커널 코드를 보니 장황하게 설명해서 뭔지는 모르겠다. (귀차니즘이...)

리눅스 커널에서는 세그먼트 단위의 읽기/쓰기 속성을 사용하지 않는다. 커널 코드에서 GDT 설정을 확인하면 알 수 있다. 페이지 단위의 메모리 보호 기법을 사용하는데 읽기 전용 페이지에 값을 쓰면 이런 에러가 발생하는 것이다.

rodata라는 섹션도 결국은 여러 개의 페이지에 저장되는 것이고 이 페이지들의 페이지 테이블에서 읽기 전용으로 플래그를 설정될 것이다.

어쨌든 결론은 읽기 전용의 rodata 섹션에 값을 쓰면 14번 exception - Page-Fault Exception 이 발생하고 에러 코드는 7이 된다. 인텔 x86 프로세서 메뉴얼을 찾아보면 Page-Fault Exception 이 발생한 경우의 에러 코드 포맷은 다음과 같다. (Vol-3A System Programming Guide 에서 Figure 5-9)

0번 비트가 1 = 페이지 레벨 보호 위반 에러
1번 비트가 1 = 쓰기 동작 에러
2번 비트가 1 = 유저 모드에서 실행하다가 에러 발생

내가 유저 모드 프로세스에서 뭔가 쓰면 안되는 메모리 영역에 값을 썼다는 것을 알 수 있고, 0x4006d2 메모리 번지에 값을 쓰다가 예외가 발생했다는 것을 알 수 있다. IP 주소며 스택 주소까지 출력해주니 디버깅하기가 매우매우매우 쉬워진다. 섹션 정보와 스택 주소 몇개를 확인해보면 대강 어느 위치인지 알 수 있게 될것 같다.

물론 실제 프로젝트에서는 확인할게 수백개가 넘겠지만...그래도 이게 어딘가!

8장

변수의 속성에 따라 접근하는 방식이 달라진다.

정적 변수인 경우, 즉 전역 변수이면서 값이 할당된 경우에는 다음과 같이 직접 주소 지정 방식으로 변수에 접근된다.

데이터 섹션에서

i: dword 5

라고 정의하고 값을 읽거나 쓸 때는 다음과 같이 메모리의 값을 곧바로 레지스터로 읽어온다.

mov eax, dword [i]
mov dword[i], eax

자동 변수인 경우, 즉 특정 프로시저나 코드 블록 내에서만 동적으로 주소가 바인딩된 변수는 스택 포인터를 이용하여 접근된다.

우선 메모리 영역을 할당하기 위해 다음과 같이 스택에 빈 공간을 만든다. 여기에서 어떤 레지스터의 값을 스택에 넣느냐가 중요한 것이 아니라 스택 포인터를 움직인다는 것이 중요하다. 컴파일러나 상황에 따라서 어떤 값이 스택에 들어갈지 알 수 없으므로 지역 변수는 명시적인 초기화가 없으면 항상 쓰레기 값으로 초기화된다.

push ecx

그리고 스택 포인터나 베이스 포인터를 이용해서 값을 읽거나 쓴다.

mov dword [esp-4], 1
mov eax, dword [esp-4]

마지막으로 프로시저나 코드 블록이 끝난 후, 혹은 끝나기 직전에 스택 포인터를 원래 지점으로 복구한다.

pop ecx

스택 포인터를 복구하는 시점에 대한 여러 가지 규약이 있는데 이를 Calling Convention 이라고 부른다.

마지막으로 동적 바인딩되는 동적 변수가 있다. 프로그램 실행 중간에 데이터의 크기가 결정되고 동적으로 메모리를 할당받아서 생성되는 변수이다.

동적 변수를 사용하는 데는 몇가지 오버헤드가 있다.

1. 동적 변수를 관리하는데 추가적인 공간이 필요하다. 동적 객체를 참조하기 위한 포인터 변수가 필요하고, 시스템에서 동적 객체를 추적하기 위한 데이터 구조가 필요해진다.
2. 보통 레지스터의 크기보다 큰 데이터가 할당되므로 접근할 때마다 메모리에 접근해야 하고, 포인터를 읽고 그 다음 데이터에 접근하기 때문에 메모리 접근 시간이 길어진다. (하드웨어 캐시 사용으로 대부분 보완이 가능하지만..)
3. 메모리 요청이 있을 때마다 빈 메모리 공간을 찾기 위한 시간이 필요해진다. 다양한 메모리 관리 알고리즘이 있어서 보완할 수 있지만 커널-유저 모드 스위칭이나 검색 등의 시간이 소모된다.

실제 코드를 살펴보면 먼저 malloc 함수를 호출해서 반환된 포인터 값을 특정 변수에 저장하게 된다.

push 4 ; 데이터 크기
call malloc
pop ecx
mov dword [j], eax ; j 변수에 포인터가 저장됨

그리고 할당받은 데이터에 접근하기 위해서는 먼저 포인터를 읽고, 그 다음에 메모리에 접근하게 된다.

mov eax, dword [j]
mov dowrd [eax], 0xff

(물론 이러한 접근 방식도 하드웨어 캐시 등을 활용하면 충분히 보완할 수 있지만, 프로파일링 등을 통해서 병목 지점을 찾을 때 주의해야 할 포인트가 된다. 병목 지점에서는 동적 할당을 줄이고, 생성자나 파괴자를 두어서 따로 동적 할당을 관리시키는 것도 하나의 방법이 된다.)

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.