DarkNet 시리즈 - Normalize Layer
normalize layer
forward_normalization_layer
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
void forward_normalization_layer(const layer layer, network net)
{
int k,b;
int w = layer.w;
int h = layer.h;
int c = layer.c;
scal_cpu(w*h*c*layer.batch, 0, layer.squared, 1);
for(b = 0; b < layer.batch; ++b){
float *squared = layer.squared + w*h*c*b;
float *norms = layer.norms + w*h*c*b;
float *input = net.input + w*h*c*b;
pow_cpu(w*h*c, 2, input, 1, squared, 1);
const_cpu(w*h, layer.kappa, norms, 1);
for(k = 0; k < layer.size/2; ++k){
axpy_cpu(w*h, layer.alpha, squared + w*h*k, 1, norms, 1);
}
for(k = 1; k < layer.c; ++k){
copy_cpu(w*h, norms + w*h*(k-1), 1, norms + w*h*k, 1);
int prev = k - ((layer.size-1)/2) - 1;
int next = k + (layer.size/2);
if(prev >= 0) axpy_cpu(w*h, -layer.alpha, squared + w*h*prev, 1, norms + w*h*k, 1);
if(next < layer.c) axpy_cpu(w*h, layer.alpha, squared + w*h*next, 1, norms + w*h*k, 1);
}
}
pow_cpu(w*h*c*layer.batch, -layer.beta, layer.norms, 1, layer.output, 1);
mul_cpu(w*h*c*layer.batch, net.input, 1, layer.output, 1);
}
함수 이름: forward_normalization_layer
입력:
- layer (layer 구조체)
- net (network 구조체)
동작:
- 입력 데이터에 대한 정규화를 수행하는 함수입니다.
- 입력 데이터는 layer 구조체와 network 구조체에서 가져옵니다.
- 함수는 주어진 입력 데이터에서 입력 크기와 일치하는 정규화된 출력을 계산합니다.
- 계산에는 입력 데이터의 각 채널에 대해 스퀘어드 값, 노름, 입력 데이터의 텐서 값을 사용합니다.
- 계산이 완료되면 출력 데이터가 layer 구조체의 출력 포인터로 설정됩니다.
설명:
- layer: 정규화를 수행할 레이어의 정보를 담고 있는 layer 구조체입니다.
- net: 입력 데이터를 담고 있는 network 구조체입니다.
- w, h, c: layer 구조체의 너비, 높이, 채널 수입니다.
- batch: 입력 데이터의 배치 크기입니다.
- squared: 입력 데이터의 각 채널에 대한 스퀘어드 값입니다.
- norms: 입력 데이터의 각 채널에 대한 노름 값입니다.
- input: 입력 데이터의 텐서 값입니다.
- kappa: 노름 계산에 사용되는 값입니다.
- alpha: 노름 계산에 사용되는 값입니다.
- size: 노름 계산에 사용되는 필터 크기입니다.
- beta: 출력 데이터에 대한 승수 값입니다.
- output: 정규화된 출력 데이터의 포인터입니다.
- 입력 데이터의 각 채널에 대해 스퀘어드 값을 계산하고, 노름 값을 계산합니다. 그리고 나서 이 값들을 사용하여 입력 데이터를 정규화된 출력으로 계산합니다. 마지막으로, 계산된 출력 값이 layer 구조체의 출력 포인터로 설정됩니다.
backward_normalization_layer
1
2
3
4
5
6
7
8
9
10
11
void backward_normalization_layer(const layer layer, network net)
{
// TODO This is approximate ;-)
// Also this should add in to delta instead of overwritting.
int w = layer.w;
int h = layer.h;
int c = layer.c;
pow_cpu(w*h*c*layer.batch, -layer.beta, layer.norms, 1, net.delta, 1);
mul_cpu(w*h*c*layer.batch, layer.delta, 1, net.delta, 1);
}
함수 이름: backward_normalization_layer
입력:
- layer (정규화 레이어 구조체)
- net (신경망 구조체)
동작:
- 정규화 레이어의 역전파를 수행하고, 입력값에 대한 델타 값을 계산합니다.
설명:
- 이 함수는 정규화 레이어의 역전파를 수행하는 함수입니다.
- 입력으로는 정규화 레이어 구조체(layer)와 신경망 구조체(net)가 필요합니다.
- 함수 내부에서는 먼저 정규화 레이어의 베타 값에 대한 거듭제곱 계산을 수행합니다.
- 이후, 정규화 레이어의 델타 값과 거듭제곱 계산 결과를 곱한 뒤, 입력값에 대한 델타 값을 계산합니다.
- 계산된 결과는 net.delta에 덮어쓰기 되며, 정확도에는 약간의 오차가 있을 수 있습니다.
resize_normalization_layer
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
void resize_normalization_layer(layer *layer, int w, int h)
{
int c = layer->c;
int batch = layer->batch;
layer->h = h;
layer->w = w;
layer->out_h = h;
layer->out_w = w;
layer->inputs = w*h*c;
layer->outputs = layer->inputs;
layer->output = realloc(layer->output, h * w * c * batch * sizeof(float));
layer->delta = realloc(layer->delta, h * w * c * batch * sizeof(float));
layer->squared = realloc(layer->squared, h * w * c * batch * sizeof(float));
layer->norms = realloc(layer->norms, h * w * c * batch * sizeof(float));
}
함수 이름: resize_normalization_layer
입력:
- layer *layer: normalization_layer 구조체의 포인터
- int w: normalization_layer의 가로 크기
- int h: normalization_layer의 세로 크기
동작:
- 입력으로 받은 normalization_layer의 가로, 세로 크기를 업데이트합니다.
- layer의 출력 크기 및 입력 크기를 업데이트합니다.
- layer의 출력, 델타, 제곱, norms 배열을 새로운 크기에 맞게 다시 할당합니다.
설명:
- 이 함수는 normalization layer의 크기를 조정하기 위해 사용됩니다.
- 입력으로 받은 가로, 세로 크기를 이용해 layer 구조체의 필드 값을 업데이트합니다.
- 이 함수는 입력 크기, 출력 크기 및 출력 배열의 크기를 재할당합니다.
- realloc 함수를 사용하여 메모리를 재할당하므로, 이전에 할당되어 있던 메모리를 자동으로 해제합니다.
- 이 함수는 입력으로 받은 normalization_layer의 포인터를 직접 수정하므로, 반환 값은 없습니다.
make_normalization_layer
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
layer make_normalization_layer(int batch, int w, int h, int c, int size, float alpha, float beta, float kappa)
{
fprintf(stderr, "Local Response Normalization Layer: %d x %d x %d image, %d size\n", w,h,c,size);
layer layer = {0};
layer.type = NORMALIZATION;
layer.batch = batch;
layer.h = layer.out_h = h;
layer.w = layer.out_w = w;
layer.c = layer.out_c = c;
layer.kappa = kappa;
layer.size = size;
layer.alpha = alpha;
layer.beta = beta;
layer.output = calloc(h * w * c * batch, sizeof(float));
layer.delta = calloc(h * w * c * batch, sizeof(float));
layer.squared = calloc(h * w * c * batch, sizeof(float));
layer.norms = calloc(h * w * c * batch, sizeof(float));
layer.inputs = w*h*c;
layer.outputs = layer.inputs;
layer.forward = forward_normalization_layer;
layer.backward = backward_normalization_layer;
return layer;
}
함수 이름: make_normalization_layer
입력:
- int batch: 배치 크기
- int w: normalization_layer의 가로 크기
- int h: normalization_layer의 세로 크기
- int c: normalization_layer의 채널 수
- int size: normalization을 수행하는 윈도우의 크기
- float alpha: 정규화의 강도를 결정하는 매개변수
- float beta: 정규화 상수
- float kappa: 정규화를 수행할 때 추가하는 값
동작:
- 입력으로 받은 값들을 이용해 normalization_layer 구조체를 만듭니다.
- layer의 필드 값을 초기화합니다.
- 입력과 출력 배열을 할당합니다.
- layer의 forward, backward 함수를 설정합니다.
설명:
- 이 함수는 normalization layer를 만들기 위해 사용됩니다.
- 입력으로 받은 값들을 이용해 normalization_layer 구조체를 만듭니다.
- layer의 type 필드는 NORMALIZATION으로 설정됩니다.
- layer의 출력, 델타, 제곱, norms 배열을 초기화합니다.
- layer의 forward, backward 함수를 설정합니다.
- 이 함수는 normalization_layer 구조체를 반환합니다.
This post is licensed under CC BY 4.0 by the author.