-
[정리] 평균, 분산, 표준편차, 공분산, 상관계수의 이해코딩 및 데이터분석/통계 관련 기초 지식 2023. 11. 8. 02:31
https://www.youtube.com/watch?v=j4dIbyBRGPw
짧고 굵게 핵심을 짚어서 잘 설명한 강의 - 평균
: 데이터를 모두 더한 뒤 그 수만큼 나눈 값
- 분산
: 평균과 각 데이터 간 차이(편차)를 제곱한 뒤 평균을 낸 값 (단, 표본분산일 경우 n-1로 나눔)
: 편차를 평균내면 항상 0이 나오기 때문에 음수를 제거하기 위해 제곱함
- 표준편차
: 분산의 제곱근
: 제곱으로 커진 스케일을 다시 줄이기 위해 루트를 씌움
- 공분산
: 변수 x와 변수 y의 각 데이터의 편차를 곱셈
: 그 곱셈 값의 평균을 냄
: 두 변수 x와 y의 편차 간의 관계를 파악 가능 (음수인가 양수인가)
- 상관계수
: 공분산을 변수 x와 변수 y의 표준편차를 곱셈한 값으로 나눔
: 이렇게 하면 상관계수의 절대값은 1을 넘지 않게 됨 즉, -1 < 상관계수 < 1
: 공분산은 수치의 범주가 정해져 있지 않아 음과 양의 관계만 파악이 가능했지만, 상관계수를 사용하면 절대값이 1을 넘지 않게 스케일링하여 그 관계가 얼마나 강하고 약한지까지 가늠할 수 있게 됨
https://separang.tistory.com/85
[통계학] 평균/분산/표준편차 설명
1. 평균(Mean) - 어떤 변수의 합계가 고정되어 있을 때, 모든 관측치가 똑같이 나누어 가질 수 있는 값. 다 알고 있는 내용이지만 수식을 쓰자면 다음과 같다. 변수 x의 평균은 모든 관측치의 값을
separang.tistory.com
https://blog.naver.com/sjloveu2/222925537148
|통계 19| 공분산, 상관계수 [Covariance, Correlation]
● 두 개의 변량이 있을 때 각 편차곱의 평균이 공분산이다. ● 공분산 = 편차곱의 평균 ● 공분산이...
blog.naver.com