Skip to content

Instantly share code, notes, and snippets.

@kantale
Created December 30, 2016 09:30
Show Gist options
  • Select an option

  • Save kantale/24f4f02d5b87ce0146e0455791e71aeb to your computer and use it in GitHub Desktop.

Select an option

Save kantale/24f4f02d5b87ce0146e0455791e71aeb to your computer and use it in GitHub Desktop.
Εισαγωγή στον προγραμματισμό με τη γλώσσα python, Project εξαμήνου
Display the source blob
Display the rendered blob
Raw
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@kantale
Copy link
Copy Markdown
Author

kantale commented Feb 13, 2017

Παράδειγμα Manhattan plot με ένα χρωμόσωμα

Υπάρχει εδώ: http://2.bp.blogspot.com/-w1h3x3rpOLY/TbXVEHCr1cI/AAAAAAAALqI/wiQqpr1HJ6c/s400/2011-04-19+GGD+manhattan4.png
(Αγνοήστε τα χρώματα αν θέλετε)

@kantale
Copy link
Copy Markdown
Author

kantale commented Feb 22, 2017

ΠΡΟΣΟΧΗ!! Λάθος στον υπολογισμό του LD

Στο link που σας έχω δώσεις για τον υπολογισμό του LD: http://rannala.org/books/CUPChap3.pdf
Έχει ένα λάθος!
Στη σελίδα 68.

το λάθος είναι:
slide3

Kudos στον Παύλο Παυλίδη που το εντόπισε!!

@kantale
Copy link
Copy Markdown
Author

kantale commented Mar 1, 2017

Για την ολοκλήρωση του project στέλνω τη λίστα με τα SNPs τα οποία χρησιμοποιήθηκαν για την δημιουργία του artificial dataset:

rs910873 32635433 1 1.7 3 
rs6010620 61780283 1 1.2 1.4
rs1015362 32202273 1 3.0 3.0
rs4911414 32193105 0 3.0 3.0
rs2273535 54394948 1 1.5 1.8
rs1064039 23566427 0 1.5 3.0

Η δεύτερη στήλη είναι το locus του SNP. H τρίτη στήλη (1 ή 0) είναι αν το causative allele είναι το reference (0) ή το alternative (1). H τρίτη και τέταρτη στήλη είναι το heterozygous risk και το homozygous αντίστοιχα. Όπως περιγράφεται και εδώ: https://mathgen.stats.ox.ac.uk/genetics_software/hapgen/hapgen2.html

For example, -dl 1085679 1 1.5 2.25 2190692 0 2 4 specifies two disease SNPs, at positions 1085679 and 2190692, and with heterozgyote risks 1.5 and 2, homozygote risks 2.25 and 4, and risk alleles set to 1 and 0 at each SNP respectively

Σε αυτό το gist: https://gist.github.com/kantale/87b4e1b24abf9be85e44fcd7f8324639 υπάρχει η δική μου (Αλέξανδρος) υλοποίηση καθώς και ένα jupyter notebook με οδηγίες για το πως μπορεί να χρησιμοποιηθεί η υλοποίηση για όλα τα tasks του project.

Σαν τελική παρατήρηση να σημειώσω ότι έχω κάνει ένα μεθοδολογικό λάθος στη δημιουργία του artificial dataset. Συγκεκριμμένα υπάρχουν 3 SNPs (rs910873, rs4911414, rs1015362) τα οποία βρίσκονται κοντά το ένα με το άλλο και έχουν εξαιρετικά μεγάλο effect (3.0). Το hapgen2 όμως θεωρεί ότι τα effects που δημιουργούν τα causative SNPs είναι independent! Οπότε είναι εξαιρετικά σπάνιο να υπάρχουν στη πραγματικότητα 3 SNPs τόσο κοντά το ένα με το άλλο με τόσο μεγάλο effect τα οποία να είναι independent. Αυτό "μπέρδεψε" λίγο το hapgen2 και δημιούργησε πολλά statistical significant SNPs (~78). Επίσης αυτό φάνηκε και στο "περίεργο" qqplot. Συγγνώμη αν μπέρδεψε κάποιους αυτό!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment