Variant Call Format Genetik Veri İle Poligenik Risk Skoru Analizi


Albayrak M., Turhan K.

13. Tıp Bilişimi Kongresi, İzmir, Turkey, 24 - 27 March 2021, pp.215-218

  • Publication Type: Conference Paper / Full Text
  • City: İzmir
  • Country: Turkey
  • Page Numbers: pp.215-218
  • Karadeniz Technical University Affiliated: Yes

Abstract

Human has almost the same DNA sequences in an estimated 6 billion letters of code for their genome. There are slight differences between individuals. These differences, called genomic variants, occur at specific locations within DNA. These variants may be specific to that individual or may be in others. Some variants increase the risk of developing the disease, while others may reduce this risk. Researchers identify genomic variants associated with complex diseases by comparing the genomes of individuals with and without these diseases. Polygenic risk scores are used to estimate how collecting a person's variants affects their risk for a particular disease. In this study, scores were calculated by PRS analysis for a certain number of variants from the genetic data presented as Variant Call Format (VCF). PRS analysis can be performed with some software packages. However, PRS analysis for certain variants cannot be done with these software. For this reason, a software has been developed for PRS analysis. Thus, PRS analysis can be performed for the genetic variant list of interest. In this way, the contribution of certain genes to the disease can be examined separately or together, while the interactions of the genes with each other can be investigated using appropriate statistical methods.

İnsan, genomları için tahmini 6 milyar harflik kodda neredeyse aynı DNA dizilerine sahiptir. Bireyler arasında küçük farklılıklar vardır. Genomik varyantlar olarak adlandırılan bu farklılıklar, DNA içindeki belirli yerlerde meydana gelir. Bu varyantlar o kişiye özel olabilir veya başkalarında da olabilir. Bazı varyantlar hastalık geliştirme riskini artırırken diğerleri bu riski azaltabilir. Araştırmacılar, karmaşık hastalıklarla ilişkili genomik varyantları, bu hastalıkları olan ve olmayan bireylerin genomlarını karşılaştırarak tanımlar. Bir kişinin varyantlarının toplanmasının belirli bir hastalık için risklerini nasıl etkilediğini tahmin etmek için poligenik risk skorları kullanılır. Bu çalışmada, Variant Call Format(VCF) olarak sunulan genetik veriden belli sayıdaki varyant için PRS analizi ile skorlar hesaplanmıştır. PRS analizi bazı paket yazılımlar ile gerçekleştirilebilmektedir. Ancak belirli varyantlar için PRS analizi bu yazılımlar ile yapılamamaktadır. Bu nedenle PRS analizi için bir yazılım geliştirilmiştir. Böylece ilgilenilen genetik varyant listesi için PRS analizi yapılabilmektedir. Bu yolla belirli genlerin hastalığa katkısı ayrı ayrı veya birlikte incelenebilirken genlerin birbirleri ile etkileşimleri de uygun istatistiksel yöntemlerle araştırılabilir.