- 일반적 기초 재생산 지수 식의 이해2023년 11월 26일 02시 30분 42초에 업로드 된 글입니다.작성자: Taeyong, Lee.
기초 재생산 지수(Basic reproduction number, $R_0$)는 감염병 연구에서 매우 중요한 지표 중 하나로, 감염병이 퍼질 것인지 판단하는 기준으로 쓰이는 수이다. 이 수에서 파생하여 각종 재생산 지수의 개념을 만들 수 있고, 각 상황에서 감염병의 퍼지는 정도를 알거나, 퍼질지 말지 알 수 있는 기준으로써 사용이 된다. 기초 재생산 지수는 아래와 같은 정의를 갖는다.
기초 재생산 지수란, 모든 개체가 감염될 수 있는(Susceptible) 집단에 감염력이 있는(Infectious) 개체 하나가 들어갔을 때, 그 개체가 감염력이 있는 기간 동안 감염시킬 수 있는 평균적인 수를 의미한다.
감염병의 수리 모델에서 위 지수를 식으로 나타내면 감염병에 대한 좋은 통찰을 얻을 수 있다. 예를 들어, 무작위로 접촉하고 감염되는 상황의 $R_0$는 아래와 같이 쓸 수 있는데, 이는 $R_0$가 질병의 감염성 특징들인 감염 계수, 감염 가능 기간에 비례하고, 전체 인구수에도 영향을 받는 것을 알 수 있다.
$$
R_0=\beta ND
$$
감염병 모델을 수리 모델로 구상했을 때, 감염의 여러 설명요소들을 추가하면서 모델이 상당히 복잡해지는 경우가 많다. 그럴 때, $R_0$ 식을 유도하여, 감염병의 특징을 명확하게 보여줄 수 있다. 그렇다면 일반적인 모델에서 수식으로 유도하는 방법은 무엇일까?모델의 가정
증명을 시작하기 전에, 감염병 수리 모델의 가정을 몇 가지 세우고 시작한다. 여기에서 다룰 모델은 에이전트 기반 모델(Agent-based model, ABM)이 아닌, DE(Differential equations)로 이루어진 감염병 모델이고, 가장 널리 사용되는, 구획 모델(Compartmental model)이다. 각 개별 개체들은 질병 상태(Disease state)와 인구를 나누는 특징에 따라 각 구획(Compartment)으로 나뉘게 되고, 질병 상태에 따라 $n$개의 질병 구획(Disease compartments), $x\in\mathbb{R}^n$, 과 $m$개의 비질병 구획(Nondisease compartments), $y\in\mathbb{R}^m$, 로 나뉜다. 이차감염으로 인해 $i$번째 질병 구획이 증가하는 속도를 $\mathscr{F}_i$, 질병의 진행, 죽음, 또는 치료로 인해 $i$번째 질병 구획이 감소하는 속도를 $\mathscr{V}_i$라고 하자. 그리고 비질병 구획이 변하는 것을 $g$라고 하면, 감염병의 수리 모델은 아래와 같이 정리할 수 있다.
$$
\begin{align*}
x'_i&=\mathscr{F}_i(x,y)-\mathscr{V}_i(x,y) & i =1,\cdots,n\\
y'_j&=g_j(x,y) & j =1,\cdots,m\\
\end{align*}
$$
하지만, 이런 단순한 모델로는 어떠한 전개를 하기가 어렵다. 그래서, 감염병 확산의 특징들을 몇 가지 반영한다.- 모든 새로운 감염자들은 기존의 감염자로부터 생기는 2차 감염으로만 생긴다. 다시 말해, 모델에서 고려하지 않는 대상은 갑자기 감염자로 등장하지 않는다. 이를 수식으로 적으면 아래와 같다.
$$
\forall y\geq0, \mathscr{F}_i(0,y)=0, \mathscr{V}_i(0,y)=0\text{ for }i=1,\cdots,n
$$ - $\mathcal{F}$는 음수일 수 없다(Nonnegative). 이는 감염자의 수가 감염으로 인해 숫자가 주는 경우가 없음을 의미한다. 지극히 당연한 가정이다.
$$
\forall x\geq0, \forall y\geq0, \mathscr{F}_i(x,y)\geq 0\text{ for }i=1,\cdots,n
$$ - 어떤 질병 구획이 비어있을 때, 증가하는 경우만 존재한다. 마찬가지로, 당연한 가정.
$$
\text{Whenever }x_i=0, i=1,\cdots,n, \mathscr{V}_i(x,y)\leq 0
$$ - 모든 질병 구획의 유출 속도를 합하면 0 이상이다. 마찬가지로 당연한 가정이다. 반대의 경우(질병 구획의 유입)는 감염으로 $\mathscr{F}$에 속한다.
$$
\forall x\geq 0, \forall y\geq 0, \sum^n_{i=1}\mathscr{V}_i(x,y)\geq 0
$$ - 초기에 $(0,y)$의 형태를 가지고 시작한 모든 해(Solution)들은 하나의 점 $(0,y_o)$로 결국 귀결되게 된다. 이 것을 질병 무질병 평형(Disease-free equilibrium, DFE)라고 부르며, 이 가정은 결국 무질병 시스템 $y'=g(0,y)$가 유일한 점근적으로 안정한(Aysmptotically stable) 평형을 가진다는 뜻이 된다.
위 가정들을 가지고, 감염병의 확산 여부를 판단할 수 있는 지표인 $R_0$를 구할 것이다.
Next generation matrix
$R_0$를 구하기 위해서는 초기 상태에서 다음에 얼마나 많은 사람이 2차 감염으로, 초기 상태에 의해, 걸리게 될지 계산해야 한다. 먼저 음수가 아닌 초기 상태의 질병 상태 $x_0$가 질병 상태인 개체가 없는 집단에 감염시키는 인원들을 구해야 한다. 그러기 위해서, DFE 주변에서의 모델을 선형화시켜서(Linearize) 살펴보자.
$$
\begin{bmatrix}
x\\y
\end{bmatrix}'= \begin{bmatrix}
\frac{\partial(\mathscr{F-V})}{\partial x} & \frac{\partial(\mathscr{F-V})}{\partial y}\\
\frac{\partial g}{\partial x} & \frac{\partial g}{\partial y}
\end{bmatrix}\begin{bmatrix}
x\\y
\end{bmatrix}=:\begin{bmatrix}
F-V & \emptyset\\
J_{21} & J_{22}
\end{bmatrix}\begin{bmatrix}
x\\y
\end{bmatrix}
$$
1번 가정에 의해서 무질병 상태 $(0,y)$들은 시간이 지나도 변하지 않을 것이다. 이는 모든 $i,j$에 대해, $\frac{\partial\mathscr{F}_i}{\partial y_j}(0,y_o)=0, \frac{\partial\mathscr{V}_i}{\partial y_j}(0,y_o)=0$임을 의미한다. 여기에서, 각 시간마다 남아있는 초기 감염자의 수는 아래 DE를 통해 구할 수 있을 것이다.
$$
x'=-Vx, x(0)=x_0
$$
위 식의 해를 $\phi(t,x_0)$라고 하면, $\int^\infty_0F\phi(t,x_0)dt$는 초기 감염자로 인해 걸린 사람 수를 의미하게 된다. 위 식의 해는 선형이기 때문에 아래와 같이 쉽게 구할 수 있고, $V$의 고윳값(Eigenvalue)이 양수라면, 간단하게 표현 가능하다.
$$
\phi(t,x_0)=e^{-Vt}x_0=V^{-1}x_0
$$
즉, 다음과 같이 초기 감염자로 인한 2차 감염자의 수를 구할 수 있다.
$$
\int^\infty_0Fe^{-Vt}x_0dt=FV^{-1}x_0
$$
여기에서 행렬 $K:=FV^{-1}$을 Next generation matrix라고 부르고, 여기에서 $R_0$를 다음과 같이 정의한다.
$$
R_0:=\rho(FV^{-1})
$$
$\rho(\cdot)$는 행렬의 스펙트럼 반지름(Spectral radius)을 의미한다.기초 재생산 지수가 Threshold가 되는가?
이렇게 정의한 $R_0$가 감염병 확산의 여부를 판단하는 지표로써 사용할 수 있을까? $R_0$ 값을 보고 감염자가 있을 때, DFE에서 벗어날지 아니면 다시 DFE로 돌아오게 될지 판단할 수 있다면, 지표로 사용할 수 있게 될 것이다.
Theorem. $R_0$를 이용하여, DFE가 점근적으로 안정한 점이 되는지, 불안정(Unstable)한 점이 되는 지를 결정할 수 있다. $R_0<1$이면, DFE가 점근적으로 안정한 평형점이 되고, $R_0>1$이면, 반대로, 불안정판 평형점이 된다.
DFE의 안정성을 파악하기 위해, 위의 선형화된 모델을 살펴보자. 아래와 같이 행렬 $J$를 정의하면,
$$
J:= \begin{bmatrix}
F-V & \emptyset\\
J_{21} & J_{22}
\end{bmatrix}
$$
$J$의 고윳값 실수부의 부호에 따라 안정성이 결정된다. 즉, 모든 고윳값 실수부가 음수라면 DFE가 점근적으로 안정적인 평형이 된다. $J_{22}$와 $F-V$의 고윳값들을 살펴보면 되는데, 우선 $J_{22}$의 고윳값의 실수부는 가정 5번에 의해, 이미 점근적으로 안정적인 평형을 가지므로, 음수이다. 반면, $F-V$의 고윳값은 조금 증명이 필요하다.$F-V$의 고윳값의 실수부는 음수이다.
먼저, 가정 1번과 2번에 의해, 행렬 $F$는 각 요소들이 Nonnegative이다. 또한, 가정 1번과 3번을 이용하면 행렬 $V$가 Z 행렬인 것을 보일 수 있다.
$$
V_{ij}=\frac{\partial\mathscr{V}_i}{\partial x_j}(0,y_o)=\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)-\mathscr{V}_i(0,y_o)}{h}=\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)}{h}
$$
$i\neq j$인 경우, $he_j$ 행렬의 $i$번째 요소는 0이므로, $\mathscr{V}_i(he_j,y_o)\leq 0$가 성립한다. 여기에서, $V_{ij}\leq0$이고, 이는 Z 행렬임을 의미한다. 또한, 가정 1번과 4번에 의해,
$$
\sum^n_{i=1} V_{ij}=\sum^n_{i=1}\frac{\partial\mathscr{V}_i}{\partial x_j}(0,y_o)=\sum^n_{i=1}\lim_{h\rightarrow0+}\frac{\mathscr{V}_i(he_j,y_o)}{h}=\lim_{h\rightarrow0+}\frac{\sum^n_{i=1}\mathscr{V}_i(he_j,y_o)}{h}\geq0
$$
이다. 여기에서, 아래 Lemma를 이용하여, 행렬 $V$가 M 행렬임을 알 수 있다.Lemma 1. 행렬 $V$가 Z 행렬이고, $\sum^n_{i=1}V_{ij}\geq0$이면, $V$는 M 행렬이다.
증명 과정에서 한 가지 가정을 하게 추가로 하게 되는데, 행렬 $V$가 가역(Invertible or nonsingular) M 행렬이라는 것이다. 많은 감염병 모델에서 이 가정은 맞기 때문에 크게 어색하진 않다. 이를 이용하면, $V^{-1}$의 각 요소가 Nonnegative임을 알 수 있고 (가역 M 행렬의 특징), 아래 계산 과정을 통해, $F-V$의 고윳값에 대한 결론을 낼 수 있다.
$FV^{-1}$이 Nonnegative이므로, $I-FV^{-1}$이 Z 행렬이다. 여기에서, $\rho(FV^{-1})<1$이라는 것은, $I-FV^{-1}$이 가역 M 행렬이라는 뜻이고, 이는 $(I-FV^{-1})^{-1}\geq 0$임을 의미한다.
$$
(I-FV^{-1})^{-1}=((V-F)V^{-1})^{-1}=V(V-F)^{-1}\geq 0
$$
위 전개를 통해서, $(V-F)^{-1}=V^{-1}(I-FV^{-1})^{-1}\geq0$임을 알 수 있고, 이는 $(V-F)$가 가역 M 행렬임을 알 수 있다. 가역 M 행렬의 모든 고윳값은 양수 실수부를 갖기 때문에, 아래 Lemma가 성립함을 알 수 있다.Lemma 2. $F-V$ 행렬은 음의 실수부를 갖는다.
정리하면, $R_0<1$이라는 명제와 DFE가 점근적으로 안정적인 평행점이라는 명제는 서로 같은 말이 된다.
이제, 반대의 경우를 증명해 보자. $R_0>1$의 경우에, 연속성(Continuity)을 사용하여 증명하게 된다. 만약, $R_0\leq1$이라면, 모든 $\varepsilon\geq0$에 대하여 $R_0:=\rho(FV^{-1})\leq 1<1+\varepsilon$이기 때문에, $(1+\varepsilon)I-FV^{-1}$은 가역 M 행렬이 된다. 즉, $((1+\varepsilon)I-FV^{-1})^{-1}\geq0$이 성립하고, 다른 면에서 $((1+\varepsilon)I-FV^{-1})=V((1+\varepsilon)V-F)^{-1}\geq0$이 성립함을 알 수 있다. 여기에서, 행렬 $(1+\varepsilon)V-F$는 가역 M 행렬이자 Z 행렬이기 때문에, 양의 실수부를 갖는 고윳값을 가진다. $\varepsilon>0$이 임의의 값이고, 행렬의 고윳값은 각 요소의 연속 함수이므로, $V-F$ 또한, Nonnegative 한 실수부를 갖는 고윳값만을 갖는다.
반대로, $V-F$가 Nonnegative 한 실수부를 갖는 고윳값만을 갖는다면, 모든 양수 $\varepsilon$에 대해, 행렬 $V+\varepsilon I-F$이, 아래 전개로, 가역 M 행렬이 된다.
$$
\det(V+\varepsilon I-F-\lambda I)=\det(V-F-(\lambda-\varepsilon)I)=0\rightarrow\mathfrak{R}(\lambda-\varepsilon)\geq0\rightarrow\mathfrak{R}(\lambda)\geq\varepsilon>0
$$
즉, Lemma 2. 의 전개를 이용하면, $\rho(F(V+\varepsilon I)^{-1})<1$임을 알 수 있다. 여기에서, $\varepsilon>0$이 임의이기 때문에, $R_0=\rho(FV^{-1})$은 1보다 작거나 같은 값을 가질 수 있다.
정리하면, $R_0\leq1$이라는 것은 행렬 $V-F$의 모든 고윳값이 Nonnegative 한 실수부를 갖는다는 것과 같은 의미가 된다. 다시 말해, $R_0>1$이라면, $F-V$의 고윳값 중 적어도 하나는 양의 실수부를 갖는다는 의미가 된다.$R_0$와 DFE의 관계
우리는 위 전개를 통해 $R_0$값이 1보다 작으면 $F-V$가 음의 실수부를 갖는 고윳값만을 가진다는 것을, 반면, $R_0$값이 1보다 크면, 양의 실수부를 갖는 고윳값을 적어도 하나 갖는다는 것을 보였다. 그렇다면, $R_0$는 선형화된 시스템에서 DFE의 평형점에 대한 결론을 내리는 기준점이 되어줄 수 있음을 의미한다. 즉, 아래와 같은 결론이 가능하다.
$$
\begin{align*}
R_0>1 \Rightarrow &\text{DFE는 점근적 안정적 평형이다.}\\
R_0<1 \Rightarrow &\text{DFE는 불안정한 평형이다.}
\end{align*}
$$정리
우리가 감염병 수리 모델을 구상할 때, 위 질병 구획과 비질병 구획을 구성하는 것은 조금씩 다를 수 있다. 즉, 같은 수리 모델에서도, 감염력을 가진 구획을 어디라고 생각하느냐에 따라 조금씩 다른 $R_0$ 식을 얻을 수도 있다. 하지만, $R_0$ 식은 해당 모델로 감염병을 어떻게 설명하는지 매우 직관적으로 이해할 수 있다. 혹여나, 감염병에 대해 수리 모델로 이해할 일이 있다면, 꼭 $R_0$값을 구하는 것을 매우 추천한다.
참고 문헌
위 전개는 van den Driessche와 James Watmough의 논문을 참고하여 진행하였다. 또한 유명한 Mathematical Epidemiology 책인, Brauer의 책에도 동일 저자가 유사한 주제로 참여하여 집필하였으니 충분히 참고할만하다. van den Driessche의 후속 논문에는 $R_0$ 계산의 여러 예시 또한 나와있으니 참고하기 바란다. 또한, Z 행렬, M 행렬 등 Nonnegative 행렬의 선형 대수(Linear algebra)에 대한 지식은 이 책 참고하였으니 참고 바란다.
수정 사항
[23.05.20] 오타 수정 및 수식 오류 수정
[23.05.21] Theorem 추가'Study > Epidemiology' 카테고리의 다른 글
전염병 모델에서의 혼동점 (0) 2023.11.26 이전글이 없습니다.댓글 - 모든 새로운 감염자들은 기존의 감염자로부터 생기는 2차 감염으로만 생긴다. 다시 말해, 모델에서 고려하지 않는 대상은 갑자기 감염자로 등장하지 않는다. 이를 수식으로 적으면 아래와 같다.