Yapay zekadan makale özeti
- Kısa
- Ayrıntılı
- Bu video, Açık Erişim Haftası etkinlikleri kapsamında Dr. Emrah Akkoyun tarafından sunulan bir eğitim içeriğidir. Dr. Akkoyun, TÜBİTAK'da görev yapmış ve şu anda Sabancı Üniversitesi'nde doktora sonrası araştırmacı olarak çalışmaktadır.
- Sunum, bilimsel veri paylaşımı ve APARTA platformu hakkında kapsamlı bilgiler sunmaktadır. İçerik iki ana bölümden oluşmaktadır: İlk bölümde veri yaşam döngüsü, veri yönetim planı, FAIR ilkeleri ve veri paylaşımının önemi anlatılırken, ikinci bölümde APARTA Türkiye Arşivi'nden örnek bir çalışma ve platformun özellikleri detaylandırılmaktadır.
- Sunumda ayrıca iş akışı yöneticisi kullanılarak protein mutasyonları üzerine yapılan bir çalışma, TÜBİTAK tarafından yönetilen APARTA platformunun Zenodo tabanlı yapısı, veri saklama, koruma ve paylaşım özellikleri ele alınmaktadır. APARTA'nın bilimsel veri havuzunun oluşturulması, çoklu disiplinler arası işbirliklerini teşvik etmesi ve araştırma maliyetlerini düşürme potansiyeli gibi avantajları vurgulanmaktadır.
- 00:04Giriş ve Sunum Tanıtımı
- Açık erişim haftası etkinlikleri kapsamında iklim adaleti temasıyla bir program düzenleniyor.
- Dr. Emrah Akkoyun, veri paylaşımında APART konulu sunum yapacak.
- Emrah Akkoyun, 2006 yılında TÜBİTAK KULAK BİM'de göreve başlamış ve şu anda Sabancı Üniversitesi'nde doktora sonrası araştırmacı olarak çalışmaktadır.
- 01:24Sunumun İçeriği
- Sunum iki temel bölümden oluşuyor: giriş ve APART Türkiye Arşivi.
- Giriş bölümünde veri yaşam döngüsü, veri yönetim planının önemi, FAIR ilkeleri ve veri paylaşımının nedenleri ele alınacak.
- İkinci bölümde APART Türkiye Arşivi'nden bahsedilecek, örnek bir çalışma paylaşılacak ve sonuçlar değerlendirilecek.
- 02:42Bilimsel Paradigmalar
- İnsanlık tarih boyunca gözlemsel, teorik, bilgisayarlı yaklaşımlar ve günümüzde yoğun veri analizi şeklinde bilimsel çalışmalar yapmıştır.
- Araştırma verisi, bulguları doğrulamak için toplanmış, üretilmiş, gözlemlenmiş ve yaratılmış verilerdir.
- Araştırma verileri dört türde olabilir: göz arsa, deneysel veriler, simülasyon verileri ve türetilmiş veriler.
- 05:49Veri Yaşam Döngüsü
- Veri yaşam döngüsü, bir araştırma projesinin başlangıcından tamamlanmasına kadar üretilen ve yönetilen verilerin aşamalarını tanımlar.
- Birleşik Krallık'ın paylaştığı yaşam döngüsü altı süreçte özetlenebilir: veri oluşturulması, temizlenmesi, işlenmesi, veri analizi, korunması ve erişim sağlanması.
- Veri yönetim planı, araştırmaya başlamadan önce ve tamamlandıktan sonra verinin nasıl yönetileceğini belirler.
- 07:32Veri Yönetiminin Önemi
- Veri miktarının hızlı artması ve verinin yeniden kullanılması, açık bilim ve açık erişim sürecine doğru ilerleme için gereklidir.
- Verinin yeniden kullanılması maliyeti düşürür ve daha değerli çalışmaların yapılmasına olanak sağlar.
- Fon sağlayıcılar farklı politikalar geliştiriyor; Avrupa Komisyonu 2017'de, TÜBİTAK ise 2019'da açık bilim politikası yayınlamıştır.
- 08:41FAIR İlkeleri ve Veri Paylaşımının Faydaları
- FAIR, verinin tekrar kullanılabilirliğini artırmak için 2016 yılında akademisyenler, fon sağlayıcıları, özel sektör ve yayıncılar tarafından yayınlanan bir rehberdir.
- FAIR'in temel ilkeleri: bulunabilir olması, erişilebilir olması, birlikte çalışabilir olması ve tekrar bulunabilir olmasıdır.
- Veri paylaşımı işbirliği maliyetini düşürür, yenilikçiliği destekler, araştırmanın etkisini artırır ve tekrarlanabilirliği sağlar.
- 10:56İş Akışı Yöneticisi Kullanımı
- Çalışmada çeşitli sinekmek adına bir iş akışı yöneticisi kullanılarak çalışmanın taşınabilir ve tekrar üretilebilir olması sağlanmıştır.
- Her bir aşamanın kodla veya konfigürasyon dosyasıyla tanımlandığı bir süreç kullanılmıştır.
- Her protein için yapılan farklı işlemler (sekans hizalamaları, ağaçların oluşturulması, skor hesapları) ayrı girdi ve çıktıları vardır.
- 11:56Aperta Platformu
- Aperta, Türkiye Açık Arşivi olarak bilinen ve uzun süreli standart bir veri yapısında verileri saklamak, korumak ve paylaşmak amacıyla kullanılan bir platformdur.
- TÜBİTAK tarafından fonlanan projelerde üretilen veri ve bilginin burada saklanmasını önemsiyor.
- Aperta, TÜBİTAK ULAKBİM tarafından yönetiliyor ve barındırma ve kaynaklara erişim için kullanıcılardan ücret talep etmiyor.
- 13:51Aperta'nın Özellikleri
- Aperta sadece web arayüzü değil, aynı zamanda API üzerinden de verilerin gönderilebileceği bir platformdur.
- Verilerin herkese açılabilmesi, kısıtlı belli bir gruba açılması veya herkes tarafından açılması gibi çeşitli erişim mekanizmaları bulunmaktadır.
- Kayıtların versiyonlanması mümkün ve kullanıcı istatistiklerinde kullanım bilgileri toplanır ve paylaşılır.
- 14:25Zenodo Teknolojisi
- Aperta açık kaynak kodlu Zenodo tabanlıdır, Zenodo CERN tarafından geliştirilmiş ve OpenAIRE programı kapsamında geliştirilmiş bir açık veri platformudur.
- Bir yayın için DOI verilebiliyor ve bu DOI aracılığıyla hem atıf alınabiliyor hem de veri kolay bir şekilde bulunabilir oluyor.
- 2021 yılında Zenodo'da bir petabyte veri ve on beş milyon yıllık bir ziyaret gibi büyük bir aktivite gerçekleşmiştir.
- 15:10Veri Paylaşımı Örneği
- Sunumda paylaşılan çalışma, proteinlerdeki mutasyonların hastalığa neden olup olmadığının skorlanması üzerine bir makale olup, 5.123 protein üzerinde çalışılmış ve 129-130 GB veri üretilmiştir.
- Veri, Aperta üzerinden tüm araştırmacılara açılmış olup, her bir protein ayrı bilinç şeklinde indirilebilmektedir.
- Veri paylaşımı için API kullanılmış, her yayın için metadata verisi oluşturulmuş ve Python kodları ile dosyaların nasıl atılacağı gösterilmiştir.
- 17:34Aperta'nın Eksiklikleri ve Gelecek
- Aperta'nın dil desteği eksikliği bulunmaktadır ve tüm verileri atabilmek için her birini yayın olarak koymak gerekmektedir.
- Aperta, bir makale ve o makaleye ait tüm verilerin paylaşılması için önemli bir platform olup, açık veri açısından ileriye taşıyabilmiş bir çözüm sunmaktadır.
- İlerleyen zamanlarda veri merkezi veya veri bankası olarak bilinen veri arşivlerini düşünerek çalışmanın geliştirilmesi gerekecektir.
- 18:29Açık Veri ve İşbirlikleri
- Bilimsel veri havuzunu oluşturma, büyük verileri yönetmek ve araştırmacılarla paylaşmak önemlidir.
- Avrupa'da bulunan Airdot CDI Clobe Data Infrastructure gibi projeler, veri hayat döngüsündeki adımlar için araçlar geliştirmiştir.
- Bu platformların oluşması işbirliklerine olanak sağlayacak ve çok disiplinli ortak çalışmalara önayak olabilmeyi sağlayacaktır.
- 20:19Sonuç ve Değerlendirme
- Türkiye'de açık ve açık bilim politikalarının oluşturulması ve FEAR ve ilkeleri doğrultusunda Aperta oldukça önemli ve önemli bir süredir kullanılmaktadır.
- Aperta sadece maliyetleri düşürmek değil, aynı zamanda çoklu disiplinler arası çalışmaları teşkil edecek potansiyele sahiptir.
- Aperta'nın yeni işbirliklerinin sağlanması, çalışmanın güvenilir olması ve araştırma maliyetlerini düşürme noktasında kritik öneme sahiptir.