전체 글 45

PyTorch Lecture 03: Gradient Descent

방학동안 학회에서 김성훈 교수님의 PyTorch Zero To All 강의로 공부를 하게 된 김에 스스로 정리해보려고 합니다. 좋은 강의 공유해주신 김성훈 교수님께 감사드립니다. 강의링크: https://www.youtube.com/playlist?list=PLlMkM4tgfjnJ3I-dbhO9JTw7gNty6o_2m PyTorchZeroToAll (in English) Basic ML/DL lectures using PyTorch in English. www.youtube.com Gradient Descent 2강의 예제는 단순한 예제이기 때문에 loss를 최소화하는 w를 찾는 것이 어렵지 않았습니다. 하지만 실제 data에서 이런 경우는 없다고 해도 무방합니다. 따라서 우리는 loss를 최소화하는 w..

PyTorch Lecture 02: Linear Model

방학동안 학회에서 김성훈 교수님의 PyTorch Zero To All 강의로 공부를 하게 된 김에 스스로 정리해보려고 합니다. 좋은 강의 공유해주신 김성훈 교수님께 감사드립니다. 강의링크: https://www.youtube.com/playlist?list=PLlMkM4tgfjnJ3I-dbhO9JTw7gNty6o_2m PyTorchZeroToAll (in English) Basic ML/DL lectures using PyTorch in English. www.youtube.com Linear Model 저희는 input x를 받아 output y를 예측하는 모델을 만들고자 합니다. 이번 강의에서는 그 모델이 linear model인 경우에 대해서 다루고 있습니다. Linear model, 즉 선형 모델..

[Practical Statistics for Data Scientists] Simple & Multiple Linear Regression

회귀분석 회귀분석의 목적은 관심이 있는 종속변수(Y)에 영향을 주는 독립변수(X)를 찾고, 두 변수 간의 관계를 잘 설명하는 모델을 만드는 것입니다. 보통 회귀분석은 Linear Regression(선형회귀분석)을 의미하고 선형회귀분석의 모델은 다음과 같이 표현됩니다. $Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n + \epsilon$ 설명드릴 Simple Linear Regression(단순선형회귀)와 Multiple Linear Regression(다중선형회귀)는 독립변수(X)의 숫자로 구분됩니다. 독립변수의 수가 1개일 때 단순선형회귀라 부르고, 2개 이상일 경우 다중선형회귀가 됩니다. Simple Linear Regression(단순선형회귀..

[Practical Statistics for Data Scientist] Hypothesis Testing and Resampling

실험 설계는 현실에서의 통계 적용에 초석이 되고, 거의 모든 분야에 적용됩니다. 실험 설계의 목적은 가설을 채택하거나 기각하는 데에 있습니다. 데이터 사이언스에서는, 주로 특정 UI(User Interface)에 대해, 혹은 마케팅 방법에 대해 실험이 빈번히 이뤄진다고 합니다. 전통적인 통계학에서의 실험은 다음과 같은 파이프라인을 따릅니다. Formulate hypothesis: A약이 기존의 약보다 효과가 좋다, 가격A가 기존의 가격B보다 수익성이 좋다 등 증명하고자 하는 가설 세우기 Design experiment: 어떠한 종류의 테스트가 될지, 통제집단/실험집단의 구성, 처리 방법 등, 실험방법에 대한 설계 Collect Data: 설계된 실험을 바탕으로 데이터를 수집 Inference/conclu..

[Practical Statistics for Data Scientist] Binomial Distribution, Poisson Distribution, Exponential Distribution, Chi-Square Distribution, F-Distribution

Binomial Distribution(이항분포) 이항분포를 설명하기 앞서 베르누이 시행(Bernoulli Trial)에 대해 알아야합니다. 베르누이 시행이란, 오직 2개의 결과만을 가지는 시행을 의미합니다. 베르누이 시행의 예시로는 동전 던지기(H/T), 신생아의 성별(남아/여아) 등이 있습니다. 성공확률이 $p$인 베르누이 시행을 $n$번 하였을 때, 성공 횟수 혹은 특정 사건의 발생 횟수 $x$를 확률변수로 하는 분포를 이항분포(Binomial Distribution)라 합니다. 이항분포함수는 다음과 같이 표현 가능합니다. $p(x) = \binom{n}{x}p^x(1-p)^{n-x}$ $X\sim B(n, p)$ 이를 확률변수 X가 시행횟수가 n, 성공확률이 p인 이항분포를 따른다고 합니다. ex..