RyanSchu · February 8, 2024 01:38
diff --git a/Illumina to Lgen.md b/Illumina to Lgen.md
diff --git a/illumina_to_lgen.R b/illumina_to_lgen.R
 ## Originally written by Ryan Schubert for the Wheeler Lab, github@RyanSchu Lab github@wheelerlab
 ## script to convert illumina final report gentoype data to lgen data. This script will generate the .lgen file and .map file used for plink format. For instructions on how to generate the .fam file please see the .md file

 library(dplyr)
 library(tidyr)
 library(argparse)

 parser <- ArgumentParser()
 parser$add_argument("--illumina", help="file path of the sample list")
 parser$add_argument("-o", "--outputdir", help="output directory")
 args <- parser$parse_args()

 Finalreport<-as.data.frame(read.table(file=args$illumina, sep='\t', skip = 9, header = T))
 Finalreport<-filter(Finalreport, Allele1...Forward != 'I')
 Finalreport["empty"]="0"
 Finalreport['fid']<-Finalreport$Sample.ID
 map<-select(Finalreport, Chr, SNP.Name, empty, Position)
 map<-map[!duplicated(map),]
 map<-map[complete.cases(map),]
 lgen<-select(Finalreport, fid, Sample.ID, SNP.Name, Allele1...Forward, Allele2...Forward)
 lgen<-lgen[!duplicated(lgen),]
 lgen<-lgen[complete.cases(lgen),]
 lgen<-filter(lgen, Allele1...Forward != "-" & Allele2...Forward != "-")
 write.table(map, file = paste(args$outputdir,"/mets.map",sep=""), sep = "\t", col.names = F, row.names = F, quote = F)
 write.table(lgen, file = paste(args$outputdir,"/mets.lgen",sep=""), sep = "\t", col.names = F, row.names = F, quote = F)
diff --git a/Sex_to_Fam.R b/Sex_to_Fam.R

 sex<-as.data.frame(read.table(file="Z:/BLayden-LL-UIC-MEGA-AA-Oct1-2018_CallRate-Gender.csv", sep=',', header = T))
 sex["empty"]<-"0"
 sex["empty1"]<-"0"
 sex["empty2"]<-"0"
 sex['fid']<-sex$Sample.ID
 sex<-select(sex, fid, Sample.ID, empty, empty1, Gender, empty2)
 sex$Gender<-gsub('F', '2', sex$Gender, fixed = T)
 sex$Gender<-gsub('M', '1', sex$Gender, fixed = T)
 write.table(sex, file = "Z:/mets_analysis/mets.fam", sep = "\t", col.names = F, row.names = F, quote = F)
	## Originally written by Ryan Schubert for the Wheeler Lab, github@RyanSchu Lab github@wheelerlab
	## script to convert illumina final report gentoype data to lgen data. This script will generate the .lgen file and .map file used for plink format. For instructions on how to generate the .fam file please see the .md file

	library(dplyr)
	library(tidyr)
	library(argparse)

	parser <- ArgumentParser()
	parser$add_argument("--illumina", help="file path of the sample list")
	parser$add_argument("-o", "--outputdir", help="output directory")
	args <- parser$parse_args()

	Finalreport<-as.data.frame(read.table(file=args$illumina, sep='\t', skip = 9, header = T))
	Finalreport<-filter(Finalreport, Allele1...Forward != 'I')
	Finalreport["empty"]="0"
	Finalreport['fid']<-Finalreport$Sample.ID
	map<-select(Finalreport, Chr, SNP.Name, empty, Position)
	map<-map[!duplicated(map),]
	map<-map[complete.cases(map),]
	lgen<-select(Finalreport, fid, Sample.ID, SNP.Name, Allele1...Forward, Allele2...Forward)
	lgen<-lgen[!duplicated(lgen),]
	lgen<-lgen[complete.cases(lgen),]
	lgen<-filter(lgen, Allele1...Forward != "-" & Allele2...Forward != "-")
	write.table(map, file = paste(args$outputdir,"/mets.map",sep=""), sep = "\t", col.names = F, row.names = F, quote = F)
	write.table(lgen, file = paste(args$outputdir,"/mets.lgen",sep=""), sep = "\t", col.names = F, row.names = F, quote = F)

	sex<-as.data.frame(read.table(file="Z:/BLayden-LL-UIC-MEGA-AA-Oct1-2018_CallRate-Gender.csv", sep=',', header = T))
	sex["empty"]<-"0"
	sex["empty1"]<-"0"
	sex["empty2"]<-"0"
	sex['fid']<-sex$Sample.ID
	sex<-select(sex, fid, Sample.ID, empty, empty1, Gender, empty2)
	sex$Gender<-gsub('F', '2', sex$Gender, fixed = T)
	sex$Gender<-gsub('M', '1', sex$Gender, fixed = T)
	write.table(sex, file = "Z:/mets_analysis/mets.fam", sep = "\t", col.names = F, row.names = F, quote = F)