- [ Study/Machine learning ]머신러닝 기초 공부; CNN2023-12-16 04:50:07머신러닝 공부 머신러닝 기초 공부; SLP, MLP 머신러닝 기초 공부; Adam 머신러닝 기초 공부; CNN 우리는 여러 가지 형태의 데이터를 분석한다. 간단하게는 테이블이 있고, 화면과 같은 이미지, 시간에 따른 변화나 어떤 열을 따라 변화하는 것을 기록한 시계열, 이 둘을 합한 동영상 등이 있다. 여기에선, 이미지 데이터를 처리하는 것을 자세하게 다룰 것이다. 이미지 데이터는 보통 2차원의 넓은 면을 가지고 각 포인트마다 값을 갖는다. 많은 수의 픽셀을 갖는 이미지의 경우 입력 벡터의 크기가 커지고, weight 파라미터 개수가 엄청 커지게 된다. 또한, 이미지를 파악할 때는 주위의 데이터가 중요하게 작용한다. 예를 들어, 이미지의 사람을 인식해야 한다면, 사람 모양의 픽셀을 파악하는 게 중요하고 ..
- [ Study/Etc. ]놓치기 쉬운 Python 문법들2023-11-29 04:21:18필자가 연구로 사용해본 언어들은 MATLAB, C, R, Julia, Java가 있고 각각 기초 문법부터 천천히 배웠던 기억이 있다. 하지만, Python은 이례적으로 조금 급한 연구에서 이용하기 위해 배워서, 기초적인 부분에서 모자란 부분이 일부 있다. 여러 코딩 테스트를 대비하면서, 새로이 알게 되거나 잊기 쉬운 기초 문법들을 정리하려 한다. 나누기 Python에서 나누기(/)는 꽤 주의해야한다. 나눠진 결과를 기본적으로 실수로 취급한다. 몫을 얻기 위해선 //, 나머지를 얻기 위해선 % 연산자를 사용한다. 또한, 거듭제곱은 **로 사용한다. ^를 사용하는 다른 언어와 조금 다르다. 참고로 Python에서 ^ 연산자는 bitwise-XOR을 의미한다. a, b = 7, 2 print(a/b) # 3...
- [ Study/Machine learning ]머신러닝 기초 공부; Adam2023-11-26 03:49:53머신러닝 공부 머신러닝 기초 공부; SLP, MLP 머신러닝 기초 공부; Adam 머신러닝 기초 공부; CNN 우리는 실생활에서도 가장 좋은 방법을 찾으려는 노력을 많이 한다. 하루 일정을 세울 때나, 예산을 분배할 때, 난방을 조절할 때 등등, 최소한의 노력이나 소비로 최대한의 효과를 바란다. 이런 종류의 문제들은, 흔히, 최적화 문제(Optimal control problem)라고 불리고, 수학적으로도, 계산적으로도 상당히 어려운 문제에 속한다. 데이터를 분석할 때에도, 상당히 많은 종류의 최적화 문제를 설계하게 되는데, 그 중 모수 추정(Parameter estimation)은 거의 모든 분석에서 필수적으로 들어가는 최적화 문제이다. 신경망 모델의 Weight와 bias 등을 구하거나, 감염 모델에..
- [ Study/Machine learning ]머신러닝 기초 공부; SLP, MLP2023-11-26 03:31:43머신러닝 공부 머신러닝 기초 공부; SLP, MLP 머신러닝 기초 공부; Adam 머신러닝 기초 공부; CNN 현재는 머신러닝을 기초로 한 생성 모델들로 엄청나게 많은 창작물들이 나오는 시대이다. 뿐만 아니라, 파악하기 힘든 복잡한 현상이 있을 때, 신경망 모델로 훌륭하게 패턴을 파악하여 미래를 에측하거나, 다른 상황에서의 결과를 예측하는 일은 이제 매우 흔한 일이다. 저자는 대학원 시절 지식 기반 모델들을 활용하여 이러한 일들을 진행하였다. 이러한 모델들은 여러 관련 현상들에서 원인을 파악하거나 새로운 가능성을 제시하는 데에 매우 논리적인 결과를 제시하지만, 미처 파악하지 못한 외부 요인에 의하여 예측이 잘못되는 경우가 더러 있다. 물론, 데이터를 기반으로 하는 신경망 모델에서 이러한 일이 없진 않겠지..
- [ Study/Etc. ]접촉 조사의 활용2023-11-26 02:58:26접촉 조사(Contact survey)는 다방면에서 활용할 수 있는 매우 중요한 정보이다. 다른 글에서도 언급했듯 질병학에서 매우 활용도가 높고, 이외에도 여러 사회학 연구 등에서 많이 활용된다. 예를 들어, 글쓴이의 대학원 시절, 유럽의 큰 조사였던 POLYMOD 프로젝트나 국내 접촉 조사 등을 활용하여 수두 바이러스라던가, COVID-19 등의 확산을 연구한 경험이 있다. 질병 확산을 접촉과 결부시켜 설명할 수 있기 때문에, 그 정도가 평균 접촉수(Average contact)이나 접촉률(Contact rate)에 상관이 있다고 생각하고, 질병 확산을 설명한다. 질병 확산의 방식에 따라, 전체 인구수를 어떻게 나눌지를 매번 결정해야 한다. 이에 따라서, 접촉률을 알아야 하는 그룹이 달라진다. 우리가 ..
- [ Study/Epidemiology ]일반적 기초 재생산 지수 식의 이해2023-11-26 02:30:42기초 재생산 지수(Basic reproduction number, $R_0$)는 감염병 연구에서 매우 중요한 지표 중 하나로, 감염병이 퍼질 것인지 판단하는 기준으로 쓰이는 수이다. 이 수에서 파생하여 각종 재생산 지수의 개념을 만들 수 있고, 각 상황에서 감염병의 퍼지는 정도를 알거나, 퍼질지 말지 알 수 있는 기준으로써 사용이 된다. 기초 재생산 지수는 아래와 같은 정의를 갖는다. 기초 재생산 지수란, 모든 개체가 감염될 수 있는(Susceptible) 집단에 감염력이 있는(Infectious) 개체 하나가 들어갔을 때, 그 개체가 감염력이 있는 기간 동안 감염시킬 수 있는 평균적인 수를 의미한다. 감염병의 수리 모델에서 위 지수를 식으로 나타내면 감염병에 대한 좋은 통찰을 얻을 수 있다. 예를 들어..
- [ Study/Machine learning ]보호글 입니다.2023-11-26 02:07:32보호되어 있는 글입니다.
- [ Study/Optimization ]최적화 문제에서 해의 존재성2023-11-26 01:35:01수리 모델을 활용한 문제를 풀거나, 기계 학습(Machine learning), 강화 학습(Reinforcement learning)을 진행할 때, 최적 제어 문제(Optimal control problem)를 쉽게 접할 수 있다. 조금 더 현실적으로 다가올 수 있는 문제는, 코로나바이러스감염증(COVID-19)이 한창 퍼지고 있을 때, 백신을 어떤 연령부터 보급해야 전염을 최소화시킬 수 있을지, 또는 집에서 어떤 방식으로 난방을 해야, 난방비를 최소화시킬 수 있을지 등이 이런 문제에 해당할 것이다. 이런 문제들은 아래와 같이 수식으로 나타낼 수 있다. $$ u=\arg\min I(t,x,u)\ \text{subject to }x'=f(t,x,u)\text{ and }h(t,x,u)\leq0 $$ 조금 ..