毕业论文中常用的几种数据分析方法
一、描述统计
描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。
缺失值填充:常用方法:剔除法、均值法、最小邻居法比率回归法、决策树法。
正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图Q-Q图、W检验、动差法。
二、假设检验
1.参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
(1)验使用条件:当样本含量n较大时,样本值符合正态分布。
(2)T检验使用条件:当样本含量n较小时,样本值符合正态分布
A单样本t检验:推断该样本来自的总体均数u与已知的某一总体均数u0(常为理论值或标准值)有无差别:
B配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面极为相似;
C两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。
2.非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
A虽然是连续数据,但总体分布形态未知或者非正态;
B总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、 K-量检验等
一、描述统计
描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。
缺失值填充:常用方法:剔除法、均值法、最小邻居法比率回归法、决策树法。
正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图Q-Q图、W检验、动差法。
二、假设检验
1.参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
(1)验使用条件:当样本含量n较大时,样本值符合正态分布。
(2)T检验使用条件:当样本含量n较小时,样本值符合正态分布
A单样本t检验:推断该样本来自的总体均数u与已知的某一总体均数u0(常为理论值或标准值)有无差别:
B配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面极为相似;
C两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。
2.非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
A虽然是连续数据,但总体分布形态未知或者非正态;
B总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、 K-量检验等