Data Science

Data Science/Computer Vision

[OpenCV] [Python] 이미지 회전(Rotate) 변환과 Affine(어파인 or 아핀)

기하학적(Geometric) 변환 기하학적(Geometric) 변환에서 어파인(Affine) 변환과 원근(or 투시, Perspective) 변환 그리고 리매핑(Remapping)이 있다. 여기서 어파인 변환과 투시 변환은 아래와 같은 차이가 있다. 어파인 변환 - 변환 결과가 평행사변형 형태 - 이미지의 끝 점 3개의 이전 위치와 변환 후의 위치를 알면 이동 관계를 알 수 있음 => 평행 사변형에서 점 3개를 알면 나머지 점의 위치 또한 알 수 있기 때문에 점 3개 투시 변환 (Perspective Transformation) - 어파인 변환보다 자유도가 높은 변환 - 이미지의 끝 점 4개의 이전위치와 변환 후의 위치를 알면 이동 관계를 알 수 있음 => 평행 사변형이 아닌 좀 더 자유로운 사각형이므로..

Data Science/Computer Vision

[OpenCV] [Python] 이미지 이진화(Binarization)와 Thresholding (임계처리) + 오츠(Otsu)

이미지 이진화(Binarization) 이미지 이진화(Binarization)는 이미지 분리(Image Segmentation)를 하는 가장 간단한 방법으로 이미지 내의 물체와 배경을 0과 1, 또는 그 반대로, 두 값만으로 픽셀값을 재설정하는 것이다. 이는 3채널의 RGB값을 가진 이미지가 아닌 1채널을 가지고 있는 이진화된 이미지 데이터에만 적용 가능하다. 즉, 픽셀 값을 0~255까지 가진 흑백 사진으로 변경하는 것이다. 이 이진화 작업을 수행한 후 Thresholding을 통해 임계값(Thresh) 기준 이상의 값을 255, 미만의 값은 0으로 바꾸는 것이 가능하다. Thresholding 우선 openCV 라이브러리를 사용한다면 다음의 함수를 통해 간단하게 Thresholding을 수행할 수 있..

Data Science/Computer Vision

[OpenCV] [Pillow] [Python] 이미지 확장자 및 품질 변환 png - jpg

JPG(Joint Photographic Experts Group) 디지털 이미지 규격은 GIF, JPG(JPEG), PNG, BMP, TIFF, RAW 등이 있다. 여기서 일반적으로 많이 쓰이는 이미지 규격은 GIF, JPG(JPEG), PNG이다. 일반적으로 화질이 좋으면 용량은 커진다. 파일의 크기순대로 이미지 파일 포맷을 나열하면 아래와 같다. GIF

Data Science/Computer Vision

컴퓨터 비전(Computer Vision)과 영상 처리(Image Processing)의 차이점과 머신 비전(Machine Vision)

컴퓨터 비전(Computer Vision)과 영상 처리(Image Processing)는 상반되는 관계를 가진 개념은 아니다. 컴퓨터 비전(Computer Vision) 우선 컴퓨터 비전(Computer Vision)은 영상을 조작하고 분석하고 인식을 위해서 다양한 방식(확대, 축소, 이동, 편집 등)으로 영상을 처리하는 기술을 뜻한다. 이러한 과정을 통해 영상에서 의미있는 데이터를 추출해내는 기법을 연구하는 학문이다. 예를 들어 요즘 스마트폰 카메라에서 얼굴 위치를 자동으로 잡아주거나, 딥러닝을 이용해 객체 탐지를 수행하는 것 등이 있다. 하지만 이러한 작업을 수행하기 위해 저품질 영상보다 고품질 영상을 사용하거나 여러 노이즈들을 제거해주는 것이 더 효과적인 결과물 산출에 도움이 될 것이다. 이를 위해..

Data Science/Statistics

[Python] 로지스틱 회귀(Logistic Regression)와 이진 교차 엔트로피(Binary Cross Entropy)의 이해와 구현

주요 개념분류 알고리즘로지스틱 회귀(Logistic Regression)비용 함수 or 손실 함수(Cost Function or Loss Function)이진 교차 엔트로피(Binary Cross Entropy)경사 하강법(Gradient Descent)지역 최소(Local Minimum) 로지스틱 회귀(Logistic Regression) 로지스틱 회귀(Logistic Regression)는 범주형 변수를 예측하기 위해 설계된 알고리즘으로 선형 회귀 모델을 변형하여 확률 기반의 예측을 수행한다. 주로 이진 분류(binary classification) 문제에 사용되지만 다중 범주형 변수도 예측할 수 있다. 예를 들어 "합격/불합격", "스팸/비스팸", "긍정/부정"과 같은 이진 분류 문제 외에도 다중 ..

Data Science/Statistics

[Python] 다항 회귀(Polynomial Regression)의 이해와 구현

주요 개념다항 회귀(Polynomial Regression)비선형 데이터편향(Bias)분산(Variance) 다항 회귀(Polynomial Regression)란 비선형 데이터를 학습하기 위해 선형 모델을 사용하는 기법이다. 단순 선형 회귀(SLR)를 이용해 모든 데이터의 관계성을 직선으로 표현할 수는 없으므로 다항 회귀 또는 다중 선형 회귀(MLR) 등과 같은 조금 더 복잡한 회귀 모델이 때에 따라 최적의 회귀선을 나타내고는 한다. 각 변수의 거듭제곱을 새로운 변수로 추가하고 이 확장된 변수를 포함한 데이터셋에 선형 모델을 훈련시킨다. 다중 선형 회귀는 여러 독립 변수들이 필요한 반면 다항 회귀는 하나의 독립 변수에 대한 차수를 확장해가며 단항식이 아닌 2차, 3차 등의 회귀 모델을 도출한다. 다만 주..

AlienCoder
'Data Science' 카테고리의 글 목록 (7 Page)
loading