• Buradasın

    Üniformatik Dersi Tanıtımı ve Temel Kavramlar

    youtube.com/watch?v=hLlJOedP8bg

    Yapay zekadan makale özeti

    • Bu video, Florida Üniversitesi Bilgisayar Bölümü'nde 2004 yılından beri hocalık yapan Taner Kahveci tarafından sunulan bir ders tanıtımıdır. Taner Kahveci, Kaliforniya Üniversitesi'nde doktora yapmış ve Türkiye'de Bilkent Üniversitesi Bilgisayar Bölümü'nde lisans eğitimi almıştır.
    • Video, bioinformatik (üniformatik) dersinin tanıtımını yaparak başlıyor ve ardından bioinformatikteki temel kavramları (filojeni, protein yapıları, biyolojik ağlar) açıklıyor. Daha sonra biyolojik verilerin çeşitliliği, büyüklüğü ve analiz edilmesinin zorlukları ele alınıyor. Son bölümde ise veri toplama ve algoritmalar konuları Pony Express örneği üzerinden anlatılıyor.
    • Ders, farklı altyapılarda yetişmiş öğrencilerin (mühendislik, biyoloji, tıp fakültesinden) katıldığı bir ders olup, temel biyoloji ve bilgisayar bilgisi varsayımı altında anlatılacaktır. Video, bioinformatik alanının bilgisayarcılar için önemli bir alan olduğunu vurgulayarak sona ermektedir.
    00:02Eğitmenin Tanıtımı ve Ders Hedefleri
    • Taner Kahveci, 2004 yılından beri Florida Üniversitesi Bilgisayar Bölümü'nde hocalık yapmakta ve son 20 yılda master ve doktora seviyesindeki biyoinformatik dersini düzenli olarak vermiştir.
    • Bu dersin Türkçe versiyonunu bölümler halinde internete koyarak araştırma yapmak isteyen master ve doktora öğrencilerine ve genç hocalara yardımcı olmayı amaçlamaktadır.
    • Ders slaytları İngilizce olacak ancak anlatım Türkçe olacak, ancak teknik terimlerin Türkçe karşılığı tam emin olmadığından İngilizce terimler kullanılabilir.
    02:01Dersin İçeriği ve Hedefleri
    • Dersin hedefleri arasında biyoinformatik verilerinin ne olduğu, biyolojik verilerle bilgisayar bilimlerinin arasındaki ilişki ve algoritmalar kullanılarak verilerin nasıl analiz edilebileceği bulunmaktadır.
    • Ders, farklı altyapılarda yetişmiş öğrencilerin toplandığı bir ders olup, biyoloji ve programlama bilgisi gerektirmemektedir.
    • Ders, hazır yazılımların kullanımını değil, biyolojik verilerin analiz edilmesi ve algoritmaların nasıl dizayn edilebileceği konusunu ele alacaktır.
    06:24Dersin Tartışacağı Konular
    • Dersin ilk konusu biyolojik dizilimler (DNA ve aminoasit dizilimleri) ve bunların birbirleriyle nasıl karşılaştırılacağıdır.
    • Dizilimlerin karşılaştırılmasında "lotus" (kesin cevap) ve "los lind" (hızlı cevap) olmak üzere iki farklı kategori bulunmaktadır.
    • İkinci konu, DNA dizilimlerinin küçük parçalarından büyük dizilimler oluşturmak olan "second assembly"dir.
    09:20Diğer Konular ve Zorluklar
    • "Substitution metris" konusu, DNA ve aminoasit dizilimlerini karşılaştırırken benzerlik seviyelerine karar vermek için matematiksel altyapıyı oluşturmayı içerir.
    • "Multible seconceliment" (çoklu dizilim) konusu, iki dizilim yerine üç, dört, beş veya daha fazla dizilimin birbirleriyle karşılaştırılmasını içerir.
    • Çoklu dizilim karşılaştırması, iki dizilim karşılaştırması problemine göre algoritmik olarak çok daha zorlaşmaktadır.
    11:32Filojeni ve Filojenetik Ağaç
    • Filojeni, birçok entity'nin birbirleriyle olan anne-baba ilişkilerinin (ensester) geçmişe dönük ilişkilerinin bulunmasıdır.
    • Filojenetik ağaç, gen varyantları veya virüs varyantları arasındaki benzerlikleri gösteren bir yapıdır.
    • Filojenetik ağaç oluşturma problemi, verinin verilen kısmında kimin kime bağlı olduğunun hesaplanmasıdır.
    13:48Bioformatik Konuları
    • Protein yapıları, aminoasit dizilimlerinin üç boyutlu şekilleri (helix, beta sheet) ve bu şekillerin nasıl tahmin edilebileceği konularını içerir.
    • Biyolojik ağlar, farklı biyolojik ağların komponentleri ve parçacıkları hakkında bilgi verir.
    14:51Bioformatik İçin Gerekli Alt Yapılar
    • Bioformatik konusunda ilerlemek için veri yapıları (data structure) ve temel algoritmalar bilinmesi gerekir.
    • Herhangi bir programlama dilinde (C, C++, Java, Python, R) rahat olmak önemlidir.
    • Bioformatik literatürünü okumayı sevmek ve özellikle son yıllarda yapılan yayınlara bakmak gerekir.
    16:28Bioformatik Kaynakları
    • Bioformatikle ilgili önemli dergiler ve konferanslar vardır, bunlar genellikle yılda bir veya ayda bir düzenlenir.
    • Son 3-5 yıldaki yayınlara bakmak tavsiye edilir ve çoğu yayın açık erişim (open access) olup indirilebilir.
    • Üniversitelerin kütüphaneleri genellikle bu dergilere abonelik sahibidir, bu nedenle erişim kolaydır.
    18:45Bioformatik Tanımı
    • Bioformatik, biyoloji, bilgisayar ve diğer alanların (kimya, istatistik) bir araya gelmesiyle oluşan bir alt alandır.
    • Bioformatik üç temel görevi vardır: biyolojik verilere hızlı ve etkin bir şekilde ulaşabilme, verileri analiz edebilme ve farklı veri türlerini bir araya getirip ortak bilgi çıkartabilme.
    21:14Biyolojik Verilerin Önemi
    • Biyolojik veriler bilgisayarcılar için önemli çünkü çok farklı veri türlerini literatüre kazandırır.
    • DNA dizilimleri, dört çeşit nükleotit (A, T, C, G) art arda eklenmesiyle oluşur.
    • Protein dizilimleri, yirmi farklı aminoasit harfleriyle ifade edilir ve protein yapıları ise proteinlerin üç boyutlu şekilleridir.
    24:05Biyolojik Verilerin Türleri
    • Microchip, yaklaşık 5x5 santimlik cam kare şeklinde olup, üzerindeki küçük noktalar (prob) genlere karşılık gelir ve renkler genin aktivite seviyesini ifade eder.
    • Biyolojik ağlar, sosyal ağlar gibi düşünülebilir ancak burada moleküllerin birbirleriyle iletişimi ifade eder ve farklı biyolojik ağlar (metabolik ağ gibi) vardır.
    • Biyolojik görüntüler (X-ray görüntüleri), zamanlı seriler (belli periyotla alınan ölçümler) ve protein/nükleotit dizilimleri de biyolojik veri türlerinden bazılarıdır.
    26:59Biyolojik Verilerin Önemi ve Büyüklüğü
    • Biyolojik veriler çok çeşitlilik gösterse de toplamda hücrenin nasıl işlediği, dışarıyla nasıl konuştuğu ve tüm biyolojik özellikleri anlatan bir hikaye anlatır.
    • Bilgisayarcılar için biyolojik verilerin büyüklüğü önemli bir konudur; DNA dizilimlerinin gen bank verileri yıllara göre geometrik olarak artmaktadır.
    • 1999'da bir haftadan daha kısa sürede bir laboratuvarda Shakespeare'in tüm hayatı boyunca yazdığı yazıların toplamından daha fazla nükleotit dizilimi elde edilmiştir.
    31:37Biyolojik Verilerin Zorlukları
    • Veri arttıkça veriye ulaşma ve analiz etme zorlaşır, bu da bilgisayarcıların devreye girmesini gerektirir.
    • Ham biyolojik verilerden gerçek bilgiyi çıkarmak zordur; DNA dizilimlerinden kanser riski gibi bilgileri çıkarmak için analiz ve yapay zeka metodları gereklidir.
    • Farklı veri türlerini birleştirip entegre etmek, birbiriyle alakasız gibi görünen verileri birleştirmek de önemli bir zorluktur.
    33:51Biyolojik Verilerin Güvenilirliği
    • Biyolojik veriler tam güvenilir değildir; ölçümlerde hatalar olabilir ve bu hatalar çıkarımları etkileyebilir.
    • Verilerde tekrarlı (redundant) bilgiler olabilir ve bu tekrarlı bilgilerin anlamları önemlidir.
    • Verinin tam olmaması (incompleteness) da bir zorluktur; bazı bilgilerin eksik olması analiz sürecini zorlaştırır.
    36:03Pony Express Örneği
    • Pony Express, yüz küsur yıl önce Amerika'da var olan bir posta şirketi olup, mesajları atlarla hızlı bir şekilde gönderiyordu.
    • Şirket, mesajları atlarla belirli mesafelerde teslim ederek, her atla mesajın gideceği yeri hesaplayarak ve atların var gücüyle gidebildiği mesafeleri belirleyerek çalışıyordu.
    • Telegraf icat edildiğinde, Pony Express şirketi rekabet edemeyeceğini düşünerek daha çok at, daha iyi at ve daha iyi sürücüler bulmaya çalıştı ancak başarılı olamadı.
    39:20Veri Toplama ve Çözüm Yolları
    • Biyolojik verilerin toplanma hızı ve kompleksliği arttıkça, bunu çözmek için kullanılan algoritmalar ve yöntemler yetersiz kalacaktır.
    • Veri toplama hızı ve kompleksliği arttıkça, çözüm daha çok daha iyi ve akıllı algoritmalar bulmak olacaktır.
    • Üniformatik alanı, bilgisayarcılar için önemli bir alandır.

    Yanıtı değerlendir

  • Yazeka sinir ağı makaleleri veya videoları özetliyor