数据特征分析
1、分布分析
2、对比分析
3、统计量分析
1)集中趋势度量:(均值、中位数)
均值:---------所有数据的平均值。
中位数:-------将一组观察值从小到大按顺序排列,位于中间的那个数据。
众数:----------数据集中出现最频繁的值。
2)离中趋势度量:(标准差(方差)、四分位数间距)
极差:----------最大值-最小值
标准差:--------度量数据偏离均值的程度
变异系数:
四分位数间距:上四分位数-下四分位数
4、周期性分析
周期性、季节性-----月度周期性、周度周期性、甚至天、小时
5、贡献度分析
二八定律----帕雷托图
80%的利润常常来自于20%的最畅销产品。
6、相关性分析
1)散点图
2)散点图矩阵
3)计算相关系数
Pearson相关系数--------------------两个连续性变量之间的关系,要求连续变量的取值服从正态分布
Spearman秩相关系数--------------连续,不服从正态分布
判定系数
判定系数
########################################‘统计特征函数
mean(X)---------------------计算数据样本的算术平均数
exp(mean(log(X)))---------计算数据样本的几何平均数
var(X)-------------------------计算数据样本的方差
sd(X)--------------------------计算数据样本的标准差
cor(X)-------------------------计算数据样本的相关系数矩阵
cov(X)-------------------------计算数据样本的协方差矩阵
moment(X,order)-----------计算数据样本的指定阶中心矩
#########################################统计作图函数
barplot() 绘制简单条形图
pie() 绘制简单饼图
hist() 绘制简单直方图
boxplot() 绘制箱型图
plot() 绘制线性二维图、折线图、散点图
---------------------
作者:-Shonna-
来源:CSDN
原文:https://blog.csdn.net/u010289316/article/details/51571540
版权声明:本文为博主原创文章,转载请附上博文链接!
本文来源:https://www.2haoxitong.net/k/doc/7b8afa2e294ac850ad02de80d4d8d15abe23008c.html
文档为doc格式