Ahmed Abbas

ChIPr

Repository

rad21_folder <- '/Users/s206442/Documents/rad21_bigwig/'
link_rad21 <- 'https://ftp.ncbi.nlm.nih.gov/geo/samples/GSM935nnn/GSM935332/suppl/GSM935332%5Fhg19%5FwgEncodeSydhTfbsGm12878Rad21IggrabSig%2EbigWig'
fname2 = 'GM12878_rad21.wig'
read_chip_seq(rad21_folder,link_rad21,fname2)
Rscript prepare_chipseq_inputs.R
op_folder <- '/Users/s206442/Documents/GM_inputs/'
fasta_dir = '/Users/s206442/Documents/hg19/'
peaks_bed_folder <- '/Users/s206442/Documents/peaks_bed_files/'
Rscript get_GC_content.R
fname_ctcf <- '/Users/s206442/Documents/hg19/CTCF2.bed'
peaks_bed_folder <- '/Users/s206442/Documents/peaks_bed_files/'
Rscript Get_CTCF_orientation_flag.R
op_folder <- '/Users/s206442/Documents/GM_inputs/'
peaks_bed_folder <- '/Users/s206442/Documents/peaks_bed_files/'
Rscript prepare_final_input_files.R
path = '/Users/s206442/Documents/GM_inputs'
name = 'gm12878_model.h5'
python train_DNN.py
python train_random_forest_and_gradient_boosting.py
Rscript prepare_chipseq_inputs_K562.R
Rscript get_GC_content_K562.R
Rscript get_CTCF_orientation_flag_K562.R
Rscript get_final_inputs_K562.R
from numpy import genfromtxt
def read_test_data(path,chr_num):
    fname = f'{path}/reduced_inputs_{chr_num}_gc_orient.csv'
    inputs = genfromtxt(fname, delimiter='\t')
    fname = f'{path}/reduced_outputs_{chr_num}_gc_orient.csv'
    outputs = genfromtxt(fname, delimiter='\t')
    I = inputs
    O = outputs
    return I,O

from keras.models import load_model
import scipy
path = '/work/pathology/s206442/dbet_data/test_chipr/K562/K562_inputs/'
I,O = read_test_data(path,'chr20')
name =  'gm12878_model.h5'
NN_model = load_model(name)
P = NN_model.predict(I)
A = scipy.stats.pearsonr(O.flatten(), P.flatten())
A