- 일반적 기초 재생산 지수 식의 이해2023년 11월 26일 02시 30분 42초에 업로드 된 글입니다.작성자: Taeyong, Lee.
기초 재생산 지수(Basic reproduction number, R0R0)는 감염병 연구에서 매우 중요한 지표 중 하나로, 감염병이 퍼질 것인지 판단하는 기준으로 쓰이는 수이다. 이 수에서 파생하여 각종 재생산 지수의 개념을 만들 수 있고, 각 상황에서 감염병의 퍼지는 정도를 알거나, 퍼질지 말지 알 수 있는 기준으로써 사용이 된다. 기초 재생산 지수는 아래와 같은 정의를 갖는다.
기초 재생산 지수란, 모든 개체가 감염될 수 있는(Susceptible) 집단에 감염력이 있는(Infectious) 개체 하나가 들어갔을 때, 그 개체가 감염력이 있는 기간 동안 감염시킬 수 있는 평균적인 수를 의미한다.
감염병의 수리 모델에서 위 지수를 식으로 나타내면 감염병에 대한 좋은 통찰을 얻을 수 있다. 예를 들어, 무작위로 접촉하고 감염되는 상황의 R0R0는 아래와 같이 쓸 수 있는데, 이는 R0R0가 질병의 감염성 특징들인 감염 계수, 감염 가능 기간에 비례하고, 전체 인구수에도 영향을 받는 것을 알 수 있다.
R0=βNDR0=βND
감염병 모델을 수리 모델로 구상했을 때, 감염의 여러 설명요소들을 추가하면서 모델이 상당히 복잡해지는 경우가 많다. 그럴 때, R0R0 식을 유도하여, 감염병의 특징을 명확하게 보여줄 수 있다. 그렇다면 일반적인 모델에서 수식으로 유도하는 방법은 무엇일까?모델의 가정
증명을 시작하기 전에, 감염병 수리 모델의 가정을 몇 가지 세우고 시작한다. 여기에서 다룰 모델은 에이전트 기반 모델(Agent-based model, ABM)이 아닌, DE(Differential equations)로 이루어진 감염병 모델이고, 가장 널리 사용되는, 구획 모델(Compartmental model)이다. 각 개별 개체들은 질병 상태(Disease state)와 인구를 나누는 특징에 따라 각 구획(Compartment)으로 나뉘게 되고, 질병 상태에 따라 nn개의 질병 구획(Disease compartments), x∈Rn, 과 m개의 비질병 구획(Nondisease compartments), y∈Rm, 로 나뉜다. 이차감염으로 인해 i번째 질병 구획이 증가하는 속도를 Fi, 질병의 진행, 죽음, 또는 치료로 인해 i번째 질병 구획이 감소하는 속도를 Vi라고 하자. 그리고 비질병 구획이 변하는 것을 g라고 하면, 감염병의 수리 모델은 아래와 같이 정리할 수 있다.
x′i=Fi(x,y)−Vi(x,y)i=1,⋯,ny′j=gj(x,y)j=1,⋯,m
하지만, 이런 단순한 모델로는 어떠한 전개를 하기가 어렵다. 그래서, 감염병 확산의 특징들을 몇 가지 반영한다.- 모든 새로운 감염자들은 기존의 감염자로부터 생기는 2차 감염으로만 생긴다. 다시 말해, 모델에서 고려하지 않는 대상은 갑자기 감염자로 등장하지 않는다. 이를 수식으로 적으면 아래와 같다.
∀y≥0,Fi(0,y)=0,Vi(0,y)=0 for i=1,⋯,n - F는 음수일 수 없다(Nonnegative). 이는 감염자의 수가 감염으로 인해 숫자가 주는 경우가 없음을 의미한다. 지극히 당연한 가정이다.
∀x≥0,∀y≥0,Fi(x,y)≥0 for i=1,⋯,n - 어떤 질병 구획이 비어있을 때, 증가하는 경우만 존재한다. 마찬가지로, 당연한 가정.
Whenever xi=0,i=1,⋯,n,Vi(x,y)≤0 - 모든 질병 구획의 유출 속도를 합하면 0 이상이다. 마찬가지로 당연한 가정이다. 반대의 경우(질병 구획의 유입)는 감염으로 F에 속한다.
∀x≥0,∀y≥0,n∑i=1Vi(x,y)≥0 - 초기에 (0,y)의 형태를 가지고 시작한 모든 해(Solution)들은 하나의 점 (0,yo)로 결국 귀결되게 된다. 이 것을 질병 무질병 평형(Disease-free equilibrium, DFE)라고 부르며, 이 가정은 결국 무질병 시스템 y′=g(0,y)가 유일한 점근적으로 안정한(Aysmptotically stable) 평형을 가진다는 뜻이 된다.
위 가정들을 가지고, 감염병의 확산 여부를 판단할 수 있는 지표인 R0를 구할 것이다.
Next generation matrix
R0를 구하기 위해서는 초기 상태에서 다음에 얼마나 많은 사람이 2차 감염으로, 초기 상태에 의해, 걸리게 될지 계산해야 한다. 먼저 음수가 아닌 초기 상태의 질병 상태 x0가 질병 상태인 개체가 없는 집단에 감염시키는 인원들을 구해야 한다. 그러기 위해서, DFE 주변에서의 모델을 선형화시켜서(Linearize) 살펴보자.
[xy]′=[∂(F−V)∂x∂(F−V)∂y∂g∂x∂g∂y][xy]=:[F−V∅J21J22][xy]
1번 가정에 의해서 무질병 상태 (0,y)들은 시간이 지나도 변하지 않을 것이다. 이는 모든 i,j에 대해, ∂Fi∂yj(0,yo)=0,∂Vi∂yj(0,yo)=0임을 의미한다. 여기에서, 각 시간마다 남아있는 초기 감염자의 수는 아래 DE를 통해 구할 수 있을 것이다.
x′=−Vx,x(0)=x0
위 식의 해를 ϕ(t,x0)라고 하면, ∫∞0Fϕ(t,x0)dt는 초기 감염자로 인해 걸린 사람 수를 의미하게 된다. 위 식의 해는 선형이기 때문에 아래와 같이 쉽게 구할 수 있고, V의 고윳값(Eigenvalue)이 양수라면, 간단하게 표현 가능하다.
ϕ(t,x0)=e−Vtx0=V−1x0
즉, 다음과 같이 초기 감염자로 인한 2차 감염자의 수를 구할 수 있다.
∫∞0Fe−Vtx0dt=FV−1x0
여기에서 행렬 K:=FV−1을 Next generation matrix라고 부르고, 여기에서 R0를 다음과 같이 정의한다.
R0:=ρ(FV−1)
ρ(⋅)는 행렬의 스펙트럼 반지름(Spectral radius)을 의미한다.기초 재생산 지수가 Threshold가 되는가?
이렇게 정의한 R0가 감염병 확산의 여부를 판단하는 지표로써 사용할 수 있을까? R0 값을 보고 감염자가 있을 때, DFE에서 벗어날지 아니면 다시 DFE로 돌아오게 될지 판단할 수 있다면, 지표로 사용할 수 있게 될 것이다.
Theorem. R0를 이용하여, DFE가 점근적으로 안정한 점이 되는지, 불안정(Unstable)한 점이 되는 지를 결정할 수 있다. R0<1이면, DFE가 점근적으로 안정한 평형점이 되고, R0>1이면, 반대로, 불안정판 평형점이 된다.
DFE의 안정성을 파악하기 위해, 위의 선형화된 모델을 살펴보자. 아래와 같이 행렬 J를 정의하면,
J:=[F−V∅J21J22]
J의 고윳값 실수부의 부호에 따라 안정성이 결정된다. 즉, 모든 고윳값 실수부가 음수라면 DFE가 점근적으로 안정적인 평형이 된다. J22와 F−V의 고윳값들을 살펴보면 되는데, 우선 J22의 고윳값의 실수부는 가정 5번에 의해, 이미 점근적으로 안정적인 평형을 가지므로, 음수이다. 반면, F−V의 고윳값은 조금 증명이 필요하다.F−V의 고윳값의 실수부는 음수이다.
먼저, 가정 1번과 2번에 의해, 행렬 F는 각 요소들이 Nonnegative이다. 또한, 가정 1번과 3번을 이용하면 행렬 V가 Z 행렬인 것을 보일 수 있다.
Vij=∂Vi∂xj(0,yo)=limh→0+Vi(hej,yo)−Vi(0,yo)h=limh→0+Vi(hej,yo)h
i≠j인 경우, hej 행렬의 i번째 요소는 0이므로, Vi(hej,yo)≤0가 성립한다. 여기에서, Vij≤0이고, 이는 Z 행렬임을 의미한다. 또한, 가정 1번과 4번에 의해,
n∑i=1Vij=n∑i=1∂Vi∂xj(0,yo)=n∑i=1limh→0+Vi(hej,yo)h=limh→0+∑ni=1Vi(hej,yo)h≥0
이다. 여기에서, 아래 Lemma를 이용하여, 행렬 V가 M 행렬임을 알 수 있다.Lemma 1. 행렬 V가 Z 행렬이고, ∑ni=1Vij≥0이면, V는 M 행렬이다.
증명 과정에서 한 가지 가정을 하게 추가로 하게 되는데, 행렬 V가 가역(Invertible or nonsingular) M 행렬이라는 것이다. 많은 감염병 모델에서 이 가정은 맞기 때문에 크게 어색하진 않다. 이를 이용하면, V−1의 각 요소가 Nonnegative임을 알 수 있고 (가역 M 행렬의 특징), 아래 계산 과정을 통해, F−V의 고윳값에 대한 결론을 낼 수 있다.
FV−1이 Nonnegative이므로, I−FV−1이 Z 행렬이다. 여기에서, ρ(FV−1)<1이라는 것은, I−FV−1이 가역 M 행렬이라는 뜻이고, 이는 (I−FV−1)−1≥0임을 의미한다.
(I−FV−1)−1=((V−F)V−1)−1=V(V−F)−1≥0
위 전개를 통해서, (V−F)−1=V−1(I−FV−1)−1≥0임을 알 수 있고, 이는 (V−F)가 가역 M 행렬임을 알 수 있다. 가역 M 행렬의 모든 고윳값은 양수 실수부를 갖기 때문에, 아래 Lemma가 성립함을 알 수 있다.Lemma 2. F−V 행렬은 음의 실수부를 갖는다.
정리하면, R0<1이라는 명제와 DFE가 점근적으로 안정적인 평행점이라는 명제는 서로 같은 말이 된다.
이제, 반대의 경우를 증명해 보자. R0>1의 경우에, 연속성(Continuity)을 사용하여 증명하게 된다. 만약, R0≤1이라면, 모든 ε≥0에 대하여 R0:=ρ(FV−1)≤1<1+ε이기 때문에, (1+ε)I−FV−1은 가역 M 행렬이 된다. 즉, ((1+ε)I−FV−1)−1≥0이 성립하고, 다른 면에서 ((1+ε)I−FV−1)=V((1+ε)V−F)−1≥0이 성립함을 알 수 있다. 여기에서, 행렬 (1+ε)V−F는 가역 M 행렬이자 Z 행렬이기 때문에, 양의 실수부를 갖는 고윳값을 가진다. ε>0이 임의의 값이고, 행렬의 고윳값은 각 요소의 연속 함수이므로, V−F 또한, Nonnegative 한 실수부를 갖는 고윳값만을 갖는다.
반대로, V−F가 Nonnegative 한 실수부를 갖는 고윳값만을 갖는다면, 모든 양수 ε에 대해, 행렬 V+εI−F이, 아래 전개로, 가역 M 행렬이 된다.
det(V+εI−F−λI)=det(V−F−(λ−ε)I)=0→R(λ−ε)≥0→R(λ)≥ε>0
즉, Lemma 2. 의 전개를 이용하면, ρ(F(V+εI)−1)<1임을 알 수 있다. 여기에서, ε>0이 임의이기 때문에, R0=ρ(FV−1)은 1보다 작거나 같은 값을 가질 수 있다.
정리하면, R0≤1이라는 것은 행렬 V−F의 모든 고윳값이 Nonnegative 한 실수부를 갖는다는 것과 같은 의미가 된다. 다시 말해, R0>1이라면, F−V의 고윳값 중 적어도 하나는 양의 실수부를 갖는다는 의미가 된다.R0와 DFE의 관계
우리는 위 전개를 통해 R0값이 1보다 작으면 F−V가 음의 실수부를 갖는 고윳값만을 가진다는 것을, 반면, R0값이 1보다 크면, 양의 실수부를 갖는 고윳값을 적어도 하나 갖는다는 것을 보였다. 그렇다면, R0는 선형화된 시스템에서 DFE의 평형점에 대한 결론을 내리는 기준점이 되어줄 수 있음을 의미한다. 즉, 아래와 같은 결론이 가능하다.
R0>1⇒DFE는 점근적 안정적 평형이다.R0<1⇒DFE는 불안정한 평형이다.정리
우리가 감염병 수리 모델을 구상할 때, 위 질병 구획과 비질병 구획을 구성하는 것은 조금씩 다를 수 있다. 즉, 같은 수리 모델에서도, 감염력을 가진 구획을 어디라고 생각하느냐에 따라 조금씩 다른 R0 식을 얻을 수도 있다. 하지만, R0 식은 해당 모델로 감염병을 어떻게 설명하는지 매우 직관적으로 이해할 수 있다. 혹여나, 감염병에 대해 수리 모델로 이해할 일이 있다면, 꼭 R0값을 구하는 것을 매우 추천한다.
참고 문헌
위 전개는 van den Driessche와 James Watmough의 논문을 참고하여 진행하였다. 또한 유명한 Mathematical Epidemiology 책인, Brauer의 책에도 동일 저자가 유사한 주제로 참여하여 집필하였으니 충분히 참고할만하다. van den Driessche의 후속 논문에는 R0 계산의 여러 예시 또한 나와있으니 참고하기 바란다. 또한, Z 행렬, M 행렬 등 Nonnegative 행렬의 선형 대수(Linear algebra)에 대한 지식은 이 책 참고하였으니 참고 바란다.
수정 사항
[23.05.20] 오타 수정 및 수식 오류 수정
[23.05.21] Theorem 추가'Study > Epidemiology' 카테고리의 다른 글
전염병 모델에서의 혼동점 (0) 2023.11.26 이전글이 없습니다.댓글 - 모든 새로운 감염자들은 기존의 감염자로부터 생기는 2차 감염으로만 생긴다. 다시 말해, 모델에서 고려하지 않는 대상은 갑자기 감염자로 등장하지 않는다. 이를 수식으로 적으면 아래와 같다.