[CS] 메모리 구조
1. 메모리 구조
프로그램이 실행되기 위해서는 먼저 프로그램이 메모리에 로드(load)되어야 합니다.
또한, 프로그램에서 사용되는 변수들을 저장할 메모리도 필요합니다.
따라서 컴퓨터의 운영체제는 프로그램의 실행을 위해 다양한 메모리 공간을 제공하고 있습니다.
프로그램이 운영체제로부터 할당받는 대표적인 메모리 공간은 다음과 같습니다.
1. 코드(code) 영역
2. 데이터(data) 영역
3. 스택(stack) 영역
4. 힙(heap) 영역
다음 그림은 운영체제가 제공하는 메모리 공간을 표현하고 있습니다.
2. 코드(code) 영역
메모리의 코드(code) 영역은 실행할 프로그램의 코드가 저장되는 영역으로 텍스트(code) 영역이라고도 부릅니다.
CPU는 코드 영역에 저장된 명령어를 하나씩 가져가서 처리하게 됩니다.
3. 데이터(data) 영역
메모리의 데이터(data) 영역은 프로그램의 전역 변수와 정적(static) 변수가 저장되는 영역입니다.
데이터 영역은 프로그램의 시작과 함께 할당되며, 프로그램이 종료되면 소멸합니다.
4. 스택(stack) 영역
메모리의 스택(stack) 영역은 함수의 호출과 관계되는 지역 변수와 매개변수가 저장되는 영역입니다.
스택 영역은 함수의 호출과 함께 할당되며, 함수의 호출이 완료되면 소멸합니다.
함수가 호출되면 스택에는 함수의 매개변수, 호출이 끝난 뒤 돌아갈 반환 주소 값, 함수에서 선언된 지역 변수 등이 저장됩니다.
이렇게 스택 영역에 차례대로 저장되는 함수의 호출 정보를 스택 프레임(stack frame)이라고 합니다.
이러한 스택 프레임 덕분에 함수의 호출이 모두 끝난 뒤에, 해당 함수가 호출되기 이전 상태로 되돌아갈 수 있습니다.
4-1. 스택 프레임의 동작 방식
예제
int main(void)
{
func1(); // func1() 호출
return 0;
}
void func1()
{
func2(); // func2() 호출
}
void func2()
{
}
다음 그림은 위 예제 코드에서 함수 호출에 의한 스택 프레임의 변화를 보여주고 있습니다.
Step 1. 프로그램이 실행되면, 가장 먼저 main() 함수가 호출되어 main() 함수의 스택 프레임이 스택에 저장됩니다.
Step 2. func1() 함수를 호출하면 해당 함수의 매개변수, 반환 주소값, 지역 변수 등의 스택 프레임이 스택에 저장됩니다.
Step 3. func2() 함수를 호출하면 해당 함수의 스택 프레임이 추가로 스택에 저장됩니다.
Step 4. func2() 함수의 모든 작업이 완료되어 반환되면, func2() 함수의 스택 프레임만이 스택에서 제거됩니다.
Step 5. func1() 함수의 호출이 종료되면, func1() 함수의 스택 프레임이 스택에서 제거됩니다.
Step 6. main() 함수의 모든 작업이 완료되면, main() 함수의 스택 프레임이 스택에서 제거되면서 프로그램이 종료됩니다.
이처럼 스택은 가장 나중에 저장된 데이터가 가장 먼저 인출되는 방식으로 동작합니다.
이러한 방식을 후입선출(LIFO, Last-In First-Out) 방식이라고 합니다.
이때 스택은 푸시(push) 동작으로 데이터를 저장하고, 팝(pop) 동작으로 데이터를 인출합니다.
메모리의 높은 주소에서 낮은 주소의 방향으로 할당됩니다.
4-2. 스택 오버플로우
앞서 함수의 재귀 호출이 무한히 반복되면, 해당 프로그램은 스택 오버플로우(stack overflow)에 의해 종료된다고 했습니다. 만약 재귀 호출이 무한히 반복되면, 위 그림에서 Step 3 이후로는 재귀 호출에 의한 스택 프레임이 계속해서 쌓여만 갈 것입니다.
이렇게 스택의 모든 공간을 다 차지하고 난 후 더 이상의 여유 공간이 없을 때 또다시 스택 프레임을 저장하게 되면, 해당 데이터는 스택 영역을 넘어가서 저장되게 됩니다.
이렇게 해당 스택 영역을 넘어가도 데이터가 저장될 수 있으면, 해당 프로그램은 오동작을 하게 되거나 보안상의 크나큰 취약점을 가지게 됩니다.
따라서 C언어에서는 실행 중인 프로그램에서 스택 오버플로우가 발생하면, 에러를 발생하고 곧바로 강제 종료시킵니다.
5. 힙(heap) 영역
메모리의 힙(heap) 영역은 사용자가 직접 관리할 수 있는 '그리고 해야만 하는' 메모리 영역입니다.
힙 영역은 사용자에 의해 메모리 공간이 동적으로 할당되고 해제됩니다.
힙 영역은 메모리의 낮은 주소에서 높은 주소의 방향으로 할당됩니다.
6. 장단점 비교
스택(stack)
장점
- 스택은 Push, Pop을 통해 메모리를 할당/해제하는 선형적인 데이터 구조다. 단순하고 효율적이다.
- 데이터 엑세스 속도가 빠르다
- 변수를 명시적으로 할당 해제할 필요가 없다.
단점
- 변수의 크기를 조정할 수 없다.
- 스택이 끝나면 해제되어 버리기 때문에 다른 객체에서 데이터에 접근하기가 어렵다.
- 스택의 크기는 컴파일 시 결정되기 때문에 컴파일 타임에 스택에 필요한 메모리 크기를 미리 알 수 있어야 한다. 하나의 스택이 올라갔을 때 그 크기를 확정할 수 있어야, 다음 스택이 생길 때 할당할 메모리를 알 수 있다.
힙(heap)
장점
- 메모리 크기에 제한이 없다.
- 런타임에 메모리 할당 크기가 변할 수 있고, 여러 객체나 스코프에서 참조 값을 통해 데이터에 접근이 가능하다.
단점
- 데이터 엑세스가 상대적으로 느린 편이다.
- 메모리를 관리해야 하기 때문에 변수를 할당하고 해제하는 책임을 갖는다.
- 메모리 할당을 할 때 순차적인 탐색이 필요한데, 더 이상 사용하지 않는 데이터를 탐지하기 위해 참조 카운팅을 해야 한다. 이때 부하가 커지거나 오류가 발생할 수 있다.
- 스택보다 할당/해제에 드는 오버헤드가 크다
※ 오버헤드 (Overhead) : 어떤 처리를 하기 위해 들어가는 간접적인 처리 시간이나 메모리 등을 말한다.
※ 참조 횟수 계산 방식 (Reference counting) : 메모리 관리 기법 중 하나로, GC(garbage collection)의 한 방식이다. 어떤 한 동적 단위가 참조값을 가지고 이 단위 객체가 참조되면 참조값을 늘리고 참조한 다음 더 이상 사용하지 않게 되면 참조값을 줄이면 된다. 보통 참조값이 0이 되면 더 이상 유효한 단위 객체로 보지 않아 메모리에서 제거한다. 매번 참조할 때마다 참조 값을 검색해야 하므로 많은 수의 단위 객체를 사용하면 그 검사에 대한 부하가 커질 수 있고, 순환 참조 오류가 발생할 수 있다.
출처