R语言更新版本
install.packages("installr")
library(installr)
updateR()
清除所有对象
rm(list=ls())
读取数据:
mydata<-read.table("clipboard",header = TRUE,sep="")
编码缺失值
mydata$Phthalimide[mydata$Phthalimide==0.01012500]<-NA
选入观测子集
data<-subset(mydata,mydata$type!="low",select = c("type","Phthalimide"),drop = FALSE)
去除缺失值
data1<-na.omit(data)
正态性检验
shapiro.test(mydata$Parathion.methyl) P值>0.05说明数据正态
方差齐性检验(两组)(Levene检验)
var.test(mydata$孩子出生体重~mydata$饮酒)
方差齐性检验(多组)(Bartlett检验)
bartlett.test(mydata$孩子出生体重~mydata$学历3层)
对数转换
mydata$DDTpp.geo<-log(mydata$DDT_p..p)
直方图
hist()
地毯图
rug(jitter(data1$Phthalimide))
添加正态密度曲线
lines(density(data1$Phthalimide),col="black",lwd=5)
箱形图
boxplot(mydata$DDTpp.geo~mydata$type,data=mydata)
散点图
plot(mydata$NUM.pesticide,mydata$孩子出生体重,xlab="Number of Pesticides Detected in Blood",ylab="Birth Weight")
添加最佳拟合线性直线
abline(lm(mydata$孩子出生体重~mydata$NUM.pesticide),lwd=2,lty=1)
相关性
cor(mydata$孩子出生体重,mydata$BWG)
相关性检验
cor.test(mydata$孩子出生体重,mydata$BWG)
单因素方差分析(AVOVA分析)(F检验)
summary(aov(mydata$DDTpp.geo~mydata$type))
单因素方差分析之后的多重比较
TukeyHSD(aov(mydata$VAP~mydata$分组))
两组独立样本的秩和检验(Wilcoxon秩和检验或称为Mann-Whitney U检验)
wilcox.test(data1$Phthalimide~data1$type,data1)
多个独立样本的非参数检验(秩和检验)(Kruskal-Wallis检验)
kruskal.test(mydata$Parathion.methyl~mydata$type,data=mydata)
npmc做秩和检验之后的两两比较
class<-newdata$type
var<-newdata$Phthalimide
data<-as.data.frame(cbind(class,var))
rm(class,var)
library(npmc)
summary(npmc(data),type="BF")
求众数
as.numeric(names(table(x)))[which.max(table(x))]