Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Uzman Doktor Zafer Yüksel tarafından sunulan akademik bir eğitim sunumudur. Doktor Yüksel, tıbbi genetik uzmanı olarak Eskişehir Osmangazi Üniversitesi'nde eğitim görmüş ve şu anda Almanya'da özel bir laboratuvarda görev yapmaktadır.
- Sunum, genom ve egzom verilerinin yorumlanması, sekanslama teknolojileri, veri analizi ve varyant sınıflandırması konularını kapsamaktadır. Video, konunun tarihçesiyle başlayıp, sekanslama teknolojilerinin gelişimini, veri yönetimi, varyant antasyonu ve filtreleme süreçlerini, ACMG rehberine göre varyant sınıflandırmasını ve genom/egzom analizlerinin karşılaştırmasını ele almaktadır.
- Sunum, teknik detaylarla devam ederek varyant filtreleme kriterleri, kullanılan programlar (ANN, SnpEff, VEP, IGV) ve klinik uygulamalara dönüştürme süreçlerini açıklamaktadır. Ayrıca, genom ve egzom dizilmesi arasındaki farklar, kapsama ve okuma derinliği kavramları, retinis pigmentosa gibi genetik hastalıklarda raporlama stratejileri ve gelecekte fenotipik bilgilerle genomik verilerin entegre edilmesi çalışmaları da sunumun içeriğinde yer almaktadır.
- 00:06Sunumun Tanıtımı
- Uzman doktor Zafer Yüksel, tıbbi genetik uzmanı olarak, egzom verilerinin yorumlanması ve tüm genom çalışmalarının önemini anlatacak.
- Sunumda egzom ve genom dizilemesinin tarihçesi, önemli projeler, kullanım alanları ve veri yorumlama süreci ele alınacak.
- Egzom ve genom çalışmalarının özellikle mendeliyen ve nadir hastalıklarda yoğun kullanım alanları var, ancak farklı alanlarda da uygulanabiliyor.
- 03:01Egzom ve Genom Çalışmalarının Tarihçesi
- 1980'lerde RFLP analizlerinden başlayarak, teknoloji gelişimiyle egzom ve genom çalışmalarına gidilmiştir.
- 2000'li yılların başında "konsept kanıtı" yaklaşımı izlenerek, arthropolis grubu içinde Freeman-Sheldon sendromu gibi hastalıklarda gen keşifleri başlamıştır.
- 2010-2011 yılları arasında yoğun çalışmalar yapılmış, ilk resesif gen (Miller sendromu) ve dominant gen keşfedilmiştir.
- 06:11Büyük Projeler ve Gelişmeler
- Amerika Ulusal Sağlık Enstitüsü tarafından yapılan büyük projeler, egzom ve genom sekanslama çalışmalarına önemli önayak olmuştur.
- Mendeliyen Genomik Merkezleri kurulmuş ve hayvan modellemelerine dayanak sağlamıştır.
- Çalışmalara 36 ülkeden 261 kurum ve 529 araştırmacı katılmış, 579 fenotip aydınlatılmış ve 956 gen keşfedilmiştir.
- 08:54Maliyet ve Gelişmeler
- Hala 169 antite için moleküler temel bilinmemektedir, egzom ve genom çalışmaları bu konuda en ideal araçtır.
- Genom maliyetleri bin dolar civarına inmiş, ancak hizmeti alanlar için henüz bu seviyeye ulaşmamıştır.
- Örnek izolasyonu artık kolaylıkla yapılabilen tükürük, kan ve kağıda emdirilmiş örneklerle gerçekleştirilebilmektedir.
- 11:38Genom Analizinde Veri Yönetimi ve Değerlendirme
- Genom analizinde hibrizasyon aşaması, yıkayıp yakalanan yerlerin dizisini anlamaya çalışmak için kullanılır.
- Genom analiz teknolojileri yaygınlaştıkça ve ucuzlaştıkça, herkese uygulanabilir hale gelmiş ve büyük miktarda veri ortaya çıkmıştır.
- 2000'li yıllarda insan genom projesi sürecinde elde edilen veriler, günümüzde neredeyse yüz kat daha küçük ve daha iyi sıkıştırılabilmektedir.
- 12:44Değerlendirme Aşaması
- En sıkıntılı ve problemli olan kısım halen değerlendirme aşamasıdır.
- Egzom sekanslamayla tüm genetik hastalıkların tanısı konulacağı algısı kısmen doğru olsa da, bu yöntemler henüz %30-33 oranını aşamamıştır.
- Teknolojik gelişmelere rağmen, değerlendirme kısmının gelecekte en büyük kısmı olacağını ve verilerin yorumu, analizi daha büyük bir kısmını kapsayacağını belirtmektedir.
- 15:03Varyant Annotasyonu ve Filtrelemesi
- Genom analizinde öncelikle multiplexing işlemi yapılır, sonra okunan dizilerdeki bazlar çağrılır ve haritalama yapılır.
- Varyant annotasyonu, referans genoma eşleştirildikten sonra eşleşmeyen kısımların özelliklerini belirlemek için yapılır.
- Varyant annotasyonu gen temelli, bölge temelli veya türkçe temelli olabilir ve bu annotasyonun detaylandırılması, varyantları filtrelemek için önemlidir.
- 17:47Veri Formatları ve Filtreleme Aşamaları
- Genom analizinden sonra FASTQ dosyası oluşturulur, bu dosya uluslararası kabul görmüş en temel veri formatıdır.
- Haritalandırmadan sonra BN dosyası, varyant call formatı (BCF) dosyası ve son olarak Excel tablosu veya internet arayüzü kullanılarak sonuçlar sunulur.
- Varyant filtrelemesi aşamasında, egzom sekanslamasında yaklaşık 60.000, tüm genomda yaklaşık 100.000 varyant elde edilir ve bunların hepsini tek tek incelemek mümkün değildir.
- 22:16Varyant Filtreleme Süreci
- Sağlıklı popülasyonda yüksek sıklıkta bulunan gereksiz genleri çıkartmak, varyans sayısını azaltmak için kullanılan bir yöntemdir.
- Varyant filtreleme sürecinde, analizin amacı (somatik, germline varyant, yapısal varyant veya teknikotit değişim) belirlenir.
- Başlangıçta yüzlerce varyant bulunan veriler, klinik genetik deneyimi sayesinde bir veya iki varyanta kadar azaltılarak rapor edilebilir.
- 24:06Varyant Filtreleme Araçları
- Illumina'nın Bae Space Vian Interprator, HMD'nin Kage, Alamut Focus gibi varyant filtreleme ve vcf dosyası sonrası işlemler için kullanılabilen programlar mevcuttur.
- Bu programlar genellikle paralı olmasına rağmen, araştırma amaçlı kullanılması için bazıları ücretsiz olabilir.
- Varyant filtrelemesinde en belirleyici faktörler klinik genetik tecrübesidir.
- 25:42Varyant Filtrelemede Önemli Kriterler
- Varyant filtrelemesinde üç temel kriter vardır: minör alel frekansı, zigosite ve klinik bulguların uyumluluğu.
- Nadir hastalıklarla ilgilenirken, nadir varyantların (yüzde 0,5'in altında) o hastalığı açıklama şansı daha yüksektir.
- Zigosite bilgisi, otozomal resesif veya dominant kalıtım durumlarında varyant filtrelemesinde önemli avantaj sağlar.
- 30:48Klinik Uyumluluk ve Gelecek Yönelimler
- Varyantlar klinik bulgularla uyumlu olmalıdır, aksi takdirde rastlantısal ikincil bulgular olabilir.
- Tanı destekleyici sistemler (Concept, Facetune gibi platformlar) genom analizleriyle entegre edilmeye çalışılıyor.
- Fenotipik bilgilerle genomik varyantlar birleştirilerek filtreleme aşamasının otomatize edilmesi çalışmaları devam etmektedir.
- 33:52Varyant Sınıflandırma ve Otomasyon
- Varyantları filtrelendirmede özellikle fotojenik olan ve olabilecek varyantların filtre dışında bırakılmaması önemlidir.
- ACMG'nin 2015'te yayınladığı rehber, varyantları patojenik, patojenik olası, önemi bilinmeyen, patojenik olmayan ve bina olmayan olmak üzere beş ana sınıfa ayırır.
- Yeni otomasyon çalışmaları, varyant sınıflandırma için farklı parametreleri girdiğinizde hangi sınıfa ait olduğunu söyleyen araçlar geliştirilmiştir.
- 36:33İkincil Bulguların Raporlanması
- Hastanın semptomlarını açıklayacak varyantları bildirmek birincil amaçken, rastlantısal olarak görülen varyantların raporlanması konusunda 2016'da ACMG tarafından yayınlanan bir rehber bulunmaktadır.
- Bu rehberde bazı genlerin listesi verilmiş ve bu genlerin rapor edilmesi tavsiye edilmektedir.
- Raporlama kalıbı önemlidir; otozomal resesif olan ve homozigot rastlandığında rapor edilmesi tavsiye edilen varyantlar, otozomal dominant olduğu ancak patojenik te şeklinde rapor edilmesi gereken varyantlar gibi.
- 40:30Exom ve Genom Tekniklerinin Karşılaştırılması
- Exom, protein kodlayan alanlara odaklanırken genom teknolojisi intronları, genleri ve genler arası bölgeleri de kapsar.
- Exom teknolojisinin tasarım handikapı vardır, çünkü tüm egzonları yakalayamazken, genom teknolojisi kapsama alanını eşit şekilde yapabilir.
- Genom çalışmalarında elde edilen verilerin büyüklüğü (yaklaşık 80-100 GB) depolama alanına ihtiyaç oluşturur ve verilerin yorumlanması zorlaşır.
- 44:04Kapsama ve Okuma Kavramları
- Exom ve genom teknolojilerinde kapsama ve okuma kavramları raporlanan önemli hususlardır.
- Exom teknolojisi tasarım önyargısıyla başlar ve sadece protein kodlayan bölgeleri kapsar, bu nedenle tam kapsama sağlanamaz.
- Kapsama oranları iki şekilde ifade edilir: ortalama kapsama (okuma derinliği için kapsama oranı) ve belirli bir okuma derinliği için kapsama oranı.
- 45:45Genom ve Egzom Analizlerinde Kapsama ve Okuma Derinliği
- Egzom analizinde bazı alanların kapsamı yetersiz olabilir, bu durumda heterozigot varyantların tespit edilmesi zorlaşır.
- Genom analizinde kapsama oranı daha yüksek ve eşit dağılım gösterir, bu da kopya sayısı değişikliklerinin daha kesin ve akıllı bir şekilde tespit edilmesini sağlar.
- Egzom analizinde de kopya sayısı değişikliklerini bulabilen araçlar bulunsa da genom analizine göre başarılı değildir.
- 47:33Analiz Sonuçlarının Değerlendirilmesi
- Analizlerde beklentilerin ne olduğu önemlidir; hangi varyant çeşitlerinin ne şekilde ve hangi okuma derinliğiyle bulunabileceği belirlenmelidir.
- Egzom dizisinde düşük kapsama alanına sahip genlerde tespit edilecek varyantlar için yeterli veri sağlanamaz.
- Genom dizisinde düşük kapsama alanlarına rağmen omega-etherezigo tespitleri daha başarılı bir şekilde ortaya çıkabilir.
- 48:58Kopya Sayısı Değişikliklerinin Tespiti
- Genom dizisinde eşit dağılımlı kapsama oranları sayesinde kopya sayısı değişikliklerinin tespit edilmesi daha kolaydır.
- İndel (insertion-deletion) tespitleri genom dizisinde daha başarılıdır, ancak okuma derinliği gereksinimleri belirtilmemiştir.
- Homozigot ve heterozigot delesiyonlar genom dizisinde başarıyla tespit edilebilir.
- 51:34Okuma Derinliği ve Kapsama Kavramları
- Okuma derinliği, bir genomik pozisyon için kaç adet pair (okuma çifti) görülebildiğini gösterir.
- Kapsama, bir genin tüm bölgelerinin ortalama olarak ne kadar okunmuş olduğunu ifade eder.
- Düşük okuma derinliği ve kapsama oranı, özellikle heterozigot varyantların tespit edilmesini zorlaştırabilir.
- 56:06Delesyon ve İnsersiyon Analizi
- Delesyonların veya insersiyonların tekrar edilme sayısını IGV'den tam olarak anlayabilmek zordur.
- Bazı araçlar bu konuda fikir verebilir ancak etkili değildir.
- Şüpheli bölgeler için özel fragman analizi veya PCR yöntemleri kullanılabilir.
- 57:49Sanger Doğrulama Kullanımı
- Sanger doğrulama her vakaya gerekli değildir, belli bir kalite kriteri eşik değeri belirlenebilir.
- Yüksek kalite kriterlerine sahip olsa bile artafat olan varyantlar göz önünde bulundurulmalıdır.
- Özellikle delesyon, insersiyon ve nomen clation'ı belirlemek için geno pozisyonunu anlamak gerekli olduğunda mutlaka Sanger doğrulaması yapılmalıdır.
- 59:17Homopolimer Bölgelerdeki Okuma Sorunları
- Homopolimer bölgelerdeki okuma farklılıkları hata mı yoksa mutasyon mu olabilir.
- Homopolimer bölgeleri annota eden araçlar kullanılarak, tekrar uzunluklarına göre eşik değerler belirlenebilir.
- Bazı homopolimer bölgelerinde tekrar sayısı belirli bir eşik değerini aşıyorsa, o varyant değerlendirmeye alınmayabilir.
- 1:00:40Raporlandırma ve Klinik Uyum
- Retinis pigmentosa gibi zigosite problemi olan hastalıklarda, tüm genler kontrol edildikten sonra bir şey bulunamazsa raporlama zorlaşır.
- Klinik uyumlu olmayan ancak literatürde desteklenen varyantlar da raporlanabilir.
- Klinik doktora bilgi verilerek, varyantın hastanın mevcut klinik fenotipini açıklayabileceğini düşündüğümüz bir varyant olarak raporlanır.
- 1:04:39Literatür ve Patojeniklik
- Literatürde yanlış bildirimler olabilir, özellikle 2010 senesinden önceki çalışmalar dikkatlice incelenmelidir.
- Literatürdeki verilerin fonksiyonel data, hayvan modelleri veya kimyasal analizlerle desteklendiği kontrol edilmelidir.
- Referans genomun belki de polimorfizme sahip olması, varyantların doğru yorumlanmasını zorlaştırabilir.
- 1:08:15VCF dosyalarının Excel'e dönüştürülmesi
- Klinikçiler için VCF dosyalarını Excel'e dönüştürme sürecinde en önemli nokta, anotasyon zenginliğine inandığınız araçları kullanmaktır.
- Farklı platformları takip edip denemek gerekir çünkü bazı araçlar veritabanlarından çok iyi bilgi sağlayarak filtreleme sürecini kolaylaştırabilir.
- Teknolojik olarak şu an çok ciddi bilgisayar gücü ve depolama alanına ihtiyaç var, ancak gelecekte bu aşamaları kendi desktop veya laptoplarımızda yapabileceğimiz bir devrim olabilir.
- 1:10:27VCF dönüştürme süreci
- VCF dosyalarının dönüştürme süreci genellikle FASTQ dosyasından başlayarak BCF veya VCF formatına ulaşır.
- Ham veri SQUD dosyası olarak çıkar, sonra alignon mapic tarzında referans genom'a eşleştirilir.
- Eşleşmeyen yerler varyant olarak çağrılır ve sonunda bu veriler Excel veya internet arayüzlerinde değerlendirilebilir.
- 1:11:33Dönüştürme sürecinde karşılaşılan zorluklar
- Türkiye'de genellikle ücretsiz anotasyon programlarını kullanmaya çalışırken, ücretli programlar (Centogen gibi) kullanılamaması bir sorun oluşturabilir.
- VCF'ten Excel'e çeviri işlemi için kullanılan programlar (GATK, SnpEff, Bisulfite gibi) henüz masaüstü bilgisayarlara uyumlu olmadığı için zorluk yaşanmaktadır.
- Anotasyon araçları arasında ücretsiz ve ücretli seçenekler bulunmakta, bazıları cüzi miktarda ücret isteyebilir, ancak hastayı gören kişinin analizi yapması en iyi sonucu veren yöntemdir.