DTS: Outlier detection02
§ data 출처
이상값 찾기
서로 겹치는 값이 있거나, 한 변수의 범주거나 연속일 경우
수치형 데이터에 대한 상관행렬
1
2# 상관관계 확인
covidtotals.corr(method = "pearson")corr <|0.2| : 약한 상관관계
corr < |0.3~0.6| : 중간정도의 상관관계
상관관계를 확인 할 수 있다.
crosstab
- 총 사망자 분위수별 총 확진자 분위수의 크로스 탭 표시
- case: 확진자수
- deaths: 사망자 수
1 | pd.crosstab(covidtotalsonly["total_cases_q"], |
- 매우 낮은 수로 사망 했지만, 확진이 중간 = 이상치
1 | covidtotals.loc[(covidtotalsonly["total_cases_q"]== "very high") |
1 |
|
DTS: Outlier detection02
https://yoonhwa-p.github.io/2021/12/22/python/DTS_Outlier_Detection2/
You need to set
install_url
to use ShareThis. Please set it in _config.yml
.