(Python) 모평균 검정 (t-test, ANOVA)

Python

(Python) 모평균 검정 (t-test, ANOVA)

Nacho_13 2024. 2. 28. 19:37

빅분기 시절 공부 했던 이론을 다시 꺼내어 정리해 봤다.

( Feature, x ) : 범주 이고, (Target, y ) : 연속 일 때,

T-test, ANOVA, Wilcoxon, 등등.. 정리가 안돼서 머리 아픈 청춘을 위해하여...

정규성 검사

import spicy.stats as stats
statistic, pvalue = stats.shapiro(df['column'])

단일 표본 t 검정

statistic, p_value = stats.ttest_1samp(df['column'], 
					popmean= mean, 
					alternative='greater or less or two-sided')

윌콕슨 부호순위 검정

statistic, pvalue = stats.wilcoxon(df['colums']-mean, alternative='greater or less or two-sided')

대응 표본 t 검정

statistic, pvalue = stats.ttest_rel(df['column1'], df['column2'], alternative='greater or less or two-sided')

윌콕슨 부호순위 검정

statistic, pvalue = stats.wilcoxon(df['column1']-df['column2'], alternative='greater or less or two-sided')

등분산성 검정

statistic, pvalue = stats.bartlett(df['column1'],df['column2'])

독립 표본 t 검정

statistic, pvalue = stats.ttest_ind(df['column1'], df['column2'], 
					equal_var= True or False, #등분산성
       					alternative='greater or less or two-sided')

윌콕슨 순위합 검정

statistic, pvalue = stats.ranksums(df['column1'], df['column2'],
					alternative='greater or less or two-sided')

정규성 검정

import spicy.stats as stats
statistic, pvalue = stats.shapiro(df['A'])
statistic, pvalue = stats.shapiro(df['B'])
statistic, pvalue = stats.shapiro(df['C'])

등분산 검정

statisic, pvalue = stats.bartlett(df['A'], df['B'], df['C'])

ANOVA

statistic, pvalue = stats.f_oneway(df['A'], df['B'], df['C'])

크루스칼-왈라스 검정

statistic, pvalue = stats.kruskal(df['A'], df['B'], df['C'])

( Feature, x ) : 범주 이고, (Target, y ) : 범주 일 때,

카이제곱 검정.

정규성 검정

statistic, pvalue = chisquare(f_obs=f_obs, f_exp=f_exp) # 관측빈도, 기대빈도

독립서 검정

statistic, pvalue, dof, expected = chi2_contingency(df)
# 검정통계량, p값, 자유도, 기대빈도