Python
(Python) 모평균 검정 (t-test, ANOVA)
Nacho_13
2024. 2. 28. 19:37
반응형
빅분기 시절 공부 했던 이론을 다시 꺼내어 정리해 봤다.
( Feature, x ) : 범주 이고, (Target, y ) : 연속 일 때,
T-test, ANOVA, Wilcoxon, 등등.. 정리가 안돼서 머리 아픈 청춘을 위해하여...
정규성 검사
import spicy.stats as stats
statistic, pvalue = stats.shapiro(df['column'])
단일 표본 t 검정
statistic, p_value = stats.ttest_1samp(df['column'],
popmean= mean,
alternative='greater or less or two-sided')
윌콕슨 부호순위 검정
statistic, pvalue = stats.wilcoxon(df['colums']-mean, alternative='greater or less or two-sided')
대응 표본 t 검정
statistic, pvalue = stats.ttest_rel(df['column1'], df['column2'], alternative='greater or less or two-sided')
윌콕슨 부호순위 검정
statistic, pvalue = stats.wilcoxon(df['column1']-df['column2'], alternative='greater or less or two-sided')
등분산성 검정
statistic, pvalue = stats.bartlett(df['column1'],df['column2'])
독립 표본 t 검정
statistic, pvalue = stats.ttest_ind(df['column1'], df['column2'],
equal_var= True or False, #등분산성
alternative='greater or less or two-sided')
윌콕슨 순위합 검정
statistic, pvalue = stats.ranksums(df['column1'], df['column2'],
alternative='greater or less or two-sided')
정규성 검정
import spicy.stats as stats
statistic, pvalue = stats.shapiro(df['A'])
statistic, pvalue = stats.shapiro(df['B'])
statistic, pvalue = stats.shapiro(df['C'])
등분산 검정
statisic, pvalue = stats.bartlett(df['A'], df['B'], df['C'])
ANOVA
statistic, pvalue = stats.f_oneway(df['A'], df['B'], df['C'])
크루스칼-왈라스 검정
statistic, pvalue = stats.kruskal(df['A'], df['B'], df['C'])
( Feature, x ) : 범주 이고, (Target, y ) : 범주 일 때,
카이제곱 검정.
정규성 검정
statistic, pvalue = chisquare(f_obs=f_obs, f_exp=f_exp) # 관측빈도, 기대빈도
독립서 검정
statistic, pvalue, dof, expected = chi2_contingency(df)
# 검정통계량, p값, 자유도, 기대빈도
반응형