ALL NIGHT STUDY 18

원격제어 - SSH란무엇인가?

SSH secure Shell 원격지 컴퓨터를 안전하게 제어하기 위한 프로토콜보안상 안전 서로간의 암호화된 방식으로 데이터를 주고받음 강력한 보안 이점을 가짐 클라이언트, 서버로 구성됨 Xshell 원격지에 컴퓨터 접속가능 리눅스 명령어를 이용해서 제어 가능해짐 윈도우와 Mac, 리눅스 환경 리눅스, Mac과 같은 Unix는 기본적으로 SSH 설치되있는데, 윈도우는 아님 윈도우는 PuTTY, Xshell 을 설치해야함 리눅스 리눅스는 오픈 SSH를 설치해야함

ALL NIGHT STUDY 2022.01.13

퍼셉트론과 인공신경망

Keywords 퍼셉트론 신경망 학습 활성 함수 신경망 1950년대 고양이 신경세포의 실험을 통해 얻어진 신경망 아이디어는 오늘날 다층신경망(MLP, multilayer perceptron)의 발전으로 매우 강력한 머신러닝 기술 중 한 가지 이제는 머신러닝에서 독립하여 딥러닝이라는 학문으로 발전하여 단순 계산만 잘 하던 컴퓨터를 사물인식, 분할기술, 자연어 처리 등은 컴퓨터가 잘 못하는 영역까지 사람보다 뛰어난 성과를 보이며 발전 신경망은 딥러닝의 발전은 핵심 알고리즘의 발전 Framework의 발전(Tensorflow, PyTorch 등) CUDA (Gpu library, 속도증가) ImageNet과 같은 벤치마크 Dataset 등의 발전 퍼셉트론 사람의 노가 100억개의 뉴런으로 구성된 것을 활용하여..

ALL NIGHT STUDY 2021.09.23

통계적 지식

분산(Variance) 데이터가 얼마나 퍼져있는지를 측정하는 방법 각 값들의 평균으로부터 차이의 제곱 평균 평균 먼저 계산 후 분산 계산 표준편차(Standard Deviation) 분산의 값에 sqrt를 씌운 값 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다. 분산은 수치가 너무 커서, 제곱근으로 적당하게 줄인 값이다. 공분산(Covariance) Covariance란, 1개의 변수 값이 변화할 때 다른 변수가 어떠한 연관성을 나타내며 변하는지를 측정하는 것입니다. 첫번째 그래프의 경우, y의 값이 높을때 x 의 값은 낮습니다. 이는 음의 (negative) 공분산 값을 갖는다 라고 표현합니다. 두번째 그래프에서는 양 변수의 높고 낮음에 대하여 관련성을 알 수 없습니다. 그러므로 이러한 형태는 ..

ALL NIGHT STUDY 2021.09.16

벡터와 매트릭스

선형대수학 형 대수학은 머신러닝에서 실행되는 모든 것에 힘을 실어줍니다. 그것은 우리의 사진, 추천 시스템, 얼굴 인식의 예술적 렌더링에 사용됩니다. 선형대수의 지식은 기술을 갖추기 위해 필수적입니다. 선형대수학에는 행렬, 텐서, 행렬 인자화, 고유값 등 다양한 주제가 있습니다. 선형대수학에서 알아야 할 학습 목표 벡터와 행렬의 연산이 기하학적으로 어떤 의미인지 이해하고 벡터를 투영분해하며 이를 이용하여 직선의 방정식을 벡터 연산으로 나타낼 수 있다. 벡터의 선형독립과 벡터공간의 의미를 이해하고 벡터를 벡터공간에 투영시킬 수 있다. 기저벡터가 바뀌었을 때 이에 해당하게 좌표 변환을 할 수 있다. 고윳값 분해의 정의를 알고 행렬의 모양과 고윳값의 관계에 대한 성질을 암기한다. 특잇값 분해의 정의를 알고 차..

ALL NIGHT STUDY 2021.09.16

조건부 확률

어떤 사건 B가 일어났을 때 사건 A가 발생할 확률 기호는 P(A|B)로 표기한다. 조건부확률에 있어서 사건A가 발생활 확률이 사건 B의 확률에 영향을 받는다. 베이지안 이론 확률을 지식 또는 믿음의 정도를 나타내는 양 으로 해석하는 확률론 확률 빈도 이론과 다른 해석이다. 두 확률 변수의 사전확률과 사후 확률 사이의 관계를 나타내는 정리 사전확률 P(A)와 우도확률 P(B|A)를 안다면 사후확률 P(A|B)를 알 수 있다. 공식은 아래 그림과 같다. 빈도 확률 vs 베이지안 확률 빈도확률 동전의 앞면이 나올 확률? 처럼 10번 던질 때 4번이 앞면이면 앞면이 나올 확률은 2/5이다. 베이지안 확률 세상에는 반복할 수 없는 사건이 무수히 많고, 빈도 확률의 개념을 그러한 사건에 적용을 할 수 없다. 따라..

ALL NIGHT STUDY 2021.09.16

ANOVA

2개 이상 그룹의 평균에 차이가 있는지를 가설 검정하는 방법 통계학에서 두 개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법 F 분포? F분포는 분산의 비교를 통해 얻어진 분포비율이다. 이 비율을 이용하여 각 집단의 모집단분산이 차이가 있는지에 대한 검정과 모집단평균이 차이가 있는지 검정하는 방법으로 사용한다. 즉 F = (군간변동)/(군내변동)이다. 만약 군내변동이 크다면 집단간 평균차이를 확인하는 것이 어렵다. 분산분석에서는 집단간의 분산의 동질성을 가정하고 하기 때문에 만약 분산의 차이가 크다면 그 차이를 유발한 변인을 찾아 제거해야 한다. 그렇지 못하면 분산..

ALL NIGHT STUDY 2021.09.16

Chi-squared-test

Chi-Squared test One-sample Chi-Squared test 카이제곱 검정은 카이제곱 분포에 관한 검정으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정하기 위해 사용되는 검정방법이다. 자료가 빈도로 주어졌을 때, 특히 명목척도 자료의 분석에 이용한다. 귀무가설: 분포가 비슷하다. 대안 가설: 분포가 비슷하지 않다. 카이제곱을 구하는 방법은 (관찰값 - 평균값)^2 / 평균값 을 모든 관측값에 대해서 더하면 구할 수 있다. 하지만 카이제곱은 데이터마다 다르게 나오므로 chi-square 분포값을 → p-value로 바꾸는 과정이 필요하다. (표준화 된 값을 얻기 위해) 이때 scipy의 stats.chi2.pdf( ) 함수를 이용해서 구할 수 있다. Two sample..

ALL NIGHT STUDY 2021.09.16

Estimation/Sampling

기술 통계치(Descriptive Statistics) count, mean, standard dev, min, 1Q, median, 3Q, max 등의 데이터를 설명 하는 값(혹은 통계치)들 기술 통계치 시각화 box plot violin plot bag plot 추정 통계치 추론 통계은 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다. 통계학의 한 부분으로서 추론 통계학(Inferential statistics)이라고 불린다. 이것은 기술 통계학(descriptive statistics)과 구별되는 개념이다. 추론 통계에는 도수 확률(frequency probability)과 사전 확률(prior probability)을 기반으로 하는 베이즈 추론의 두 학파가 ..

ALL NIGHT STUDY 2021.09.16

T-test

T-test 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정 하는 방법 "두 모집단의 평균간의 차이는 없다”라는 귀무가설과 “두 모집단의 평균 간에 차이가 있다”라는 대립가설 중에 하나를 선택할 수 있도록 하는 통계적 검정방법이다. T-Value t값이란 t 검정에 이용되는 검정통계량으로, 두 집단의 차이의 평균(X)을 표준오차(SE)로 나눈 값 즉, [표준오차]와 [표본평균사이의 차이]의 비율이다. t 분포 (t-distribution) 평균이 0, 좌우 대칭을 이루며, 자유도(n-1) υ에 의해서 규정되는 수리적 분포로 왼쪽 그림과 같은 형태를 띤다. t값이 커질 수록 표준정규분포와 같은 형태를 띤다. 자유도와 영역 넓이에 따른 t값은 ..

ALL NIGHT STUDY 2021.09.16