rm(list=ls())
library(metagenomeSeq)
library(biomformat)
library(metagenomeFeatures)
tot_tir <- scan('E:/data.txt')
tot_tir <- matrix(tot_tir, ncol = 156, byrow = TRUE)
clin = loadPhenoData(file.path("E:/", "sample_type.csv"),tran = TRUE)
phenotypeData = AnnotatedDataFrame(clin)
obj = newMRexperiment(tot_tir,phenoData=phenotypeData)
#norm_mat_tot=cumNormMat(obj, p = cumNormStatFast(obj), sl = 1000)
matx=cumNorm(obj, p = cumNormStatFast(obj))
norm_mat_tot=MRcounts(matx, norm = TRUE, log = FALSE)

group <- factor(c(3,1,1,2,1,1,1,2,3,1,3,1,3,1,2,1,3,2,1,2,3,2,3,1,1,1,2,1,1,3,1,2,1,2,1,2,3,2,1,1,2,2,3,3,2,1,1,1,3,1,2,1,1,3,1,2,1,1,1,1,1,1,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,2,2,2,2,2,2,1,1,2,1,1,1,1,2,1,1,1,2,2,1,2,1,1,1,1,2,1,2,1,2,1,2,1,1,3,1,2,2,1,2,1,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,2,1,3,1,3,3,3,2,2,1,1,1,1,1,2,1))
p <- matrix(1:nrow(norm_mat_tot))
for (i in 1:nrow(norm_mat_tot))
{
  a=kruskal.test(norm_mat_tot[i,], group)
  p[i]=a$p.value
}


sum(p<0.05)/length(p)*100

b <- p.adjust(p, "BH")
sum(b<0.05)/length(b)*100