분류 전체보기

Languages/JavaScript

[JavaScript] 호이스팅(Hoisting)

호이스팅(Hoisting)이란 자바스크립트 인터프리터가 변수와 함수 안에 있는 선언들을 모두 해당 함수 유효 범위의 최상단에 선언하는 것을 말한다. 하지만 주의해야 할 점은 실제로 위치가 옮겨지는 것이 아니라 그렇게 된 것처럼 실행이 된다는 뜻이라는 것을 염두에 두어야 한다. 즉, 선언이 코드 실행보다 먼저 메모리에 저장되는 과정으로 인해 야기되는 현상이다. 변수가 생성되는 절차는 아래와 같다. 1단계: 선언 단계(Declaration phase) - 변수를 실행 컨텍스트의 변수 객체에 등록한다. - 이 변수 객체는 스코프가 참조하는 대상이 된다. 2단계: 초기화 단계(Initialization phase) - 변수 객체에 등록된 변수를 위한 공간을 메모리에 확보한다. - 이 단계에서 변수는 undefi..

Data Science/Statistics

[Python] 상관 분석(Correlation Analysis)과 상관 계수(Correlation Coefficient), 자기 상관 계수(Autocorrelation Coefficient)

상관 분석(Correlation Analysis) 또는 상관 관계 분석은 두 변수 간에 어떤 선형적 관계를 가지는지 분석하는 기법으로 상관계수를 이용하여 측정하는 것이다. A와 B가 positive correlation이란 사실은 알 수 있지만, A의 증가가 원인이 되어 B가 증가하는지, B가 증가하는 것이 원인이 되어 A가 증가하는지는 알 수 없다. 따라서 원인과 결과에 대한 분석이 필요하다면 상관분석이 아니라 회귀 분석(Regression Analysis)을 수행하여야 한다. 상관 도표, ACF, PACF 등에서 등장하는 단어인 자기 상관이라는 단어를 다시 한번 정리해보려 한다.ACF와 PACF에 관한 내용은 여기를 참조하면 된다. 상관 계수(Correlation Coefficient)상관 계수(Co..

Data Science/Statistics

가설 검정과 1종 오류, 2종 오류 그리고 본페로니 교정(Bonferroni Correction)을 통한 사후 검정(Post-hoc)

가설검정 가설검정이란 귀무가설과 대립가설을 세워 이 둘 중 어느 것이 참인 것인지 밝혀내는 검정방식이다. 일반적으로 귀무가설(H0)은 처음부터 버릴 것이라 생각하고 설정하는 가설이다. 반대로 대립가설(H1)은 귀무가설이 기각되었을 때 자동으로 참이 되는 귀무가설에 정반대의 결론이 도출되는 가설을 뜻한다. 즉, 이 두가지 가설을 모집단으로부터 표본을 추출해 분석한 후 채택하거나 기각하는 것을 가설검정이라고 한다. 귀무가설이 채택된다는 뜻은 기존의 개념이 참이고 새로운 가설은 거짓이 되는 것으로 볼 수 있고, 대립가설이 채택된다면 새로운 가설이 참으로 받아들여진다는 뜻이다. 하지만 이렇게 대립가설이 기각된다고 해서 항상 귀무가설이 참이라는 뜻으로 해석해서는 안된다. 만약 새로운 데이터가 쌓이고 이를 분석하게..

Data Science/Statistics

[Python] AR, MA, ARMA, ARIMA 모델을 이용한 시계열(Time Series) 예측

이제까지 정상성에 대한 판단 방식과 비정상성 데이터를 정상성 데이터로 바꾸는 방법들에 대해 포스팅했다. 기초적인 내용들이지만 이를 토대로 정상성 데이터를 이용한 시계열 데이터(Time Series) 예측(Forecasting)을 수행할 수 있다. 한번 더 시계열의 특성을 짚고 넘어가자면,$$ 시계열 데이터 = 규칙적인 패턴+불규칙적인 패턴 $$으로 볼 수 있다. 이중 규칙적인 패턴은 이전 결과 사이 발생하는 자기상관성과(Autocorrelativeness)과 이후 결과에 편향성을 초래하는 이동평균(Moving Average) 현상으로 구분할 수 있다. 반대로 불규칙적인 패턴은 white noise라 칭하고 평균이 0이며 일정한 분산을 지닌  정규분포에서 추출된 임의의 수치로 정의하고 있는데, 이런 정규분..

Data Science/Statistics

[Python] ADF(Augmented Dickey-Fuller Test)를 이용한 정상성 확인

주요 개념 Augmented Dickey-Fuller Test (ADF Test) AR, MA, ARMA, ARIMA 모델을 적용하기 전, 우선 시계열 데이터를 정상성 데이터로 바꾼 후 사용하는 것이 바람직하다. 정상성을 띄기 위해선 시계열 데이터의 평균, 분산이 시간에 따라 일정해야 하고 lag에 따른 공분산이 일정해야 한다. 이를 위해 로그 변환을 해주거나 n차 차분을 적용해줄 수 있다. 시계열에 대한 자세한 사항은 여기를 참고하면 된다. 정상성에 대한 검증은 시각화를 하거나 상황에 대해 직관적인 판단을 통해 알 수 있지만 통계적인 정량적 방법으로 검증할 수 있는 방법을 사용하는 것이 데이터를 분석할 때 더 납득할 수 있는 방법이 될 것이다. 이를 위해 사용하는 방법 중 하나가 Augmented Di..

Data Science/Statistics

[Python] ACF(Autocorrelation function), PACF(Partial Autocorrelation function)의 이해

상관도표(Correlogram)는 시계열 데이터를 분석에서 자주 활용되는데 자기상관함수(Autocorrelation Function, ACF) 또는 편자기상관함수(Partial Autocorrelation Function, PACF)를 그래프로 표현한 것을 뜻한다. 우리가 자주 말하는 Correlation은 두 변수 간의 관계를 -1~1 사이로 정규화한 값으로 표현하는 척도인데, Autocorrelation은 time shifted된 자기 자신의 데이터와의 상관성을 의미한다. 이 ACF와 PACF는 ARIMA 모델의 파라미터가 되는 p, d, q의 최적 차수를 탐색할 때 유용하게 사용된다. p는 AR, d는 차분 횟수, q는 MA와 관련이 있는 파라미터이다. ACF와 PACF 설명 이전에 자기회귀 모형(..

AlienCoder
'분류 전체보기' 카테고리의 글 목록 (29 Page)
loading