본문 바로가기
반응형

수학8

공분산과 상관계수 확률 변수가 하나일때는 분산을 구할 수 있는데 변수가 여러 개일 때는 어떻게 분산을 구할 수 있을까? 그리고 두 변수 간의 상관 관계는 어떻게 구할까? 이 문제는 공분산과 상관계수을 통해서 알 수 있다. 공분산(Covariance) 공분산은 어떤 두 가지 변수(x, y)가 변하는 정도를 수로 나타낸 것이다. 두 변수 간의 관계를 측정하는 지표라고 볼 수 있는데 분산과 마찬가지로 평균으로부터 얼마나 떨어져 있는지를 나타낸다. 공분산은 각 변수의 편차의 평균으로 정의된다. 간단히 말해, 두 변수가 함께 얼마나 변하는지를 나타낸다. 식에서 Con(X, Y)는 변수 X와 Y의 공분산을 나타내고 n은 관찰값의 개수이다. x와 y 두 개의 변수중 하나의 값이 상승하는 경향을 보일 때 다른 값도 상승하는 경향이 있다.. 2023. 6. 18.
기본 통계 개념 : 평균, 편차, 분산과 표준편차 평균, 편차, 분산, 표준편차는 데이터들을 나타낼 때 많이 쓰이는 통계적 개념이다. 데이터의 특성과 분포도를 파악하는데 중요한 기초적인 개념이므로 알아둘 필요가 있다. 평균(Average) 평균은 데이터 값들을 모두 더한 후 데이터 개수로 나누어 계산한다. 수식으로 나타내면 아래와 같이 나타낼 수 있다. 평균값 = 모든 데이터의 합 / 데이터의 개수 편차(deviation) 편차는 데이터 값이 평균으로부터 얼마나 떨어져 있는지를 나타낸다. 개별 데이터 값에서 평균을 뺀 값으로 계산한다. 어떤 데이터와 평균 간의 차이라고 볼 수 있다. 편차 = 데이터값 - 평균값 분산(Variance) 분산은 데이터가 평균으로부터 얼마나 퍼져 있는지 나타내는 산포도를 계산하는 방법이다. 분산 값이 작을수록 데이터가 평균에.. 2023. 6. 17.
반응형