Yazan: Derya Güçdemir, Hacettepe Üniv. SBE. Y.Lisans Programı
Boğaziçi Üniversitesinin ev sahipliğini yaptığı, Araştırma Verilerinin Yönetimi ve Açık Bilim Çalıştayı, 11 Eylül 2018 tarihinde TÜBİTAK-ULAKBİLİM, İzmir Yüksek Teknoloji Enstitüsü, Hacettepe Üniversitesi, Sabancı Üniversitesi, Anadolu Üniversite Kütüphaneleri Konsoryimu (ANKOS) ve Boğaziçi Üniversitesi işbirliği ile gerçekleşti.
Çalıştayın amacı açık bilimin ve açık verinin ne olduğunu anlatmak, bu konuda yapılan girişimlerden bahsetmek ve veri yönetiminin gerek bilimsel gerek toplumsal açıdan önemi paylaşmaktır[1]. Akademisyenler, sivil toplum çalışanları ve öğrencilerin dışında, çalıştaya katılan kişilerin önemli bir bölümünün farklı üniversitelerden gelen kütüphanecilerin olması aslında araştırma verilerinin yönetimi ve açık bilim konusunda kütüphanecilerin kendilerine düşen yeni sorumlulukları üstlendiklerini ve bu yöndeki isteklerini gösterir nitelikteydi.
Çalıştayda tartışılan konular “açık bilim, açık veri, araştırma verisi, veri yönetimi yazılım ve araçları, araştırma verisi yönetimine giriş, kütüphaneciler için araştırma verisi yönetimi modelleri, Zenodo, Avrupa Açık Bilim Bulutu ve OpenAIRE[2] hizmetleri, açık bilim ve veri yönetimi politikası oluşturma” olarak sıralanmaktadır[3]. Bugün açık veri, veri yönetimi ve açık bilim konularını tartışıyor olmamızın nedeni iletişim ve enformasyon teknolojilerinde yaşanan gelişmelerdir. Akıllı telefonlar, bilgisayarlar ve yöndeşen cihazlar ile veri üretimi çeşitlenmekte ve giderek katlanmaktadır. Üretilen bu kadar verinin nasıl yönetileceği önemli bir sorudur. Bunun dışında, bilimsel araştırma yaparken üretilen verinin nasıl yönetileceği sorusunu sormak enformasyon çağında bilimin ve teknolojinin gelişmesi ve toplumun ilerlemesi açısından önemli olacaktır. Bunu başarabilmek için bazı ilkelerin belirlenmesi gerekmektedir. Örneğin, Avrupa Birliği’nde araştırmalarda üretilen araştırma verilerinin ve yayınların FAIR ilkelerine uygun olması gereklidir. Bu ilkeler Findable – Bulunabilir, Accessible – Erişilebilir, Interoperable – Birlikte Çalışabilir, Reusable – Yeniden Kullanılabilir) olarak belirlenmiştir. Bu ilkeler GO FAIR isimli küresel açıklık girişimi ile desteklenmektedir. Albert Long Hall’ın girişine konan afişte bu ilkelerin altının çizildiğini görmek oldukça keyifliydi.
Konuşmacıların sunumlarında değindikleri sorunlara ve çalıştayda tartışılan not etmiş olduğum bazı noktalara değinmek istiyorum. İzmir Yüksek Teknoloji Enstitüsü’nden Prof. Dr. Ahmet E. Eroğlu’nun açık bilim ve kimya arasında kurduğu ilişkiyi dinlemek oldukça keyifliydi. Çalıştaya CERN’den katılan Tim Smith araştırma verisini nasıl yönetilebilir hale getirdiklerini ve CERN’de verinin araştırılmasını, kullanılmasına ve erişilmesine olanak sağlayan sınıflandırmadan bahsetti. Bu sınıflandırma; açık erişim sağlanan veri, özel amaçlı veri (eğitim gibi), fizik ile ilgili veri (çarpışma gibi) ve sınırlandırılan veriden (ham veri) oluşmakta. Cern’in websitesini ziyaret ederek kamuya açılan verileri kullanmak mümkün.
TU Delft’ten gelen Marta TEPEREK ise kurumlarında ve fakültelerinde açık bilimi mümkün hale getirmek için gerekli olan adımları, iyi veri uygulamalarının neden gerekli olduğunu açıkladı. Hollanda’da ve özellikle TU Delft’de açık bilim konusunda duyulan ilgiyi bir örnek ile açıkladı. Hollandalı bir psikolog olan Diederik Stapel, Tilburg Üniversitesi’nde araştırmacı olarak çalışmaktadır. Fakat yaptığı çalışmaların birçoğunda veri manipülasyonu olduğu ve çalışmalarının uydurma verilerden beslendiği ortaya çıktığından beri[4], Hollanda’daki üniversitelerin ve araştırmacıların açık veri somut adımlar attığını belirtmiştir. Bunlardan birisi TU Delft’deki “Data Stewardship” pozisyonu. Her fakülteye verinin yönetilmesi, bu kültürün geliştirilmesi ve araştırmacılara danışmanlık sağlaması için (doktora öğrencisi ya da doktora sonrası çalışma yürüten araştırmacılar gibi) araştırma deneyimi olan bir data steward yerleştirilmektedir. Verinin yönetilebilmesi için ilk önce veriyi açık hale getirebilmenin gerekli olduğunu belirtirken, bunu başarmak için fakültelerden disipliner destek aldıklarından ve hatta iyi veri pratiğini geliştirmek adına yerel savunucuların da desteğini aldıklarından bahsetti. Veri setlerinin en az 15 yıl boyunca korunduğunu ver her veri seti için bir DOI numarası tahsis edildiğini söyledi. Önemli olabilecek bir başka not ise, TU Delft’de işe alım süreçlerinde sadece bilimsel etki faktörüne değil, kişinin başarılarına ve açık erişime olan ilgisine ve yatkınlığına baktıklarını da vurguladı.
Yine bir başka kurumdan, Athena Araştırma ve İnovasyon Merkezi’nden Elli Papadopoulou ise Araştırma Verileri İttifakı (RDA)’nın rolünden ve Erken Kariyer ve Katılım Ortaklığı Grubunun (ECEIG) Misyonu’nundan bahsetti. RDA, verinin açık paylaşımını ve yeniden kullanımını sağlamak için sosyal ve teknik köprüler kurmayı hedefleyen bir oluşumdur[5].
Açık Bilimin Altyapısı ve Araştırma Verilerinin Yönetimi isimli sunumunda Prof. Dr. Yaşar Tonta Türkiye’deki duruma dikkat çekti. Bilimsel yayın-açık erişim, veri-açık veri, yöntemler-açık kaynak yazılım arasındaki ilişkide, Türkiye’de bilimsel yayın ve açık erişim konusunda ilerlendiğini, fakat özellikle ikincisi olmak üzere ikinci ve üçüncü konularda Türkiye’de gerçekten bir ilerleme kaydedilmediğini vurguladı. İyi işleyen alt yapıların gözükmediğine yönelik yaptığı vurgu da diğer önemli bir noktaydı. Açık erişim denilince, araştırma verisinin sadece açık olmasının yeterli olmayacağını, verilerin başkaları tarafından anlaşılabilir olması gerektiğini, bu yüzden ‘akıllı açıklık’ düşüncesinin gerekli olduğunun altını çizdi. European Open Science Cloud (EOSC) için verinin kuluçka döneminden değerlendirilme dönemine kadar alt yapının oturtulması anlamına geldiğini belirtti. EOSC, Avrupa ve ötesinde açık bilimi ve yeniliği destekleyen ve gelişmesini sağlayan büyük bir alt yapı olmak üzere Avrupa Komisyonu’nun bir vizyonu olarak 2015 yılında şekillenmiştir[6]. Alt yapılardan bahsederken, verileri sadece açık hale getirmenin yeterli olmayacağını, araştırma verilerinin sürdürebilirliğini ve güvenliğini sağlayacak alt yapıların olup olmadığını sorgulamanın önemli olduğunu söyledi. Türkiye’deki durumu değerlendirdiğinde ise, OECD Kamu Destekli Araştırma Verilerine Erişim Bildirgesi’ni imzalayan ilk ülkelerden birisi olmamıza rağmen, bu konuda çok fazla bir yere gidilemediğini vurguladı. Sunumunu, kurumların ve üniversitelerin geleneklerini ve alışkanlıklarını değiştirmekte yaşanan sıkıntıya bir gönderme olarak, Carel Stolker’ın sözüne atıfta bulunarak bitirdi: “Üniversiteleri değiştirmek, mezarlığı taşımak gibidir. İçerideki insanlardan yardım alamazsınız”.
Açık Veri Yönetiminde Çerçeve Yapılar Standartlar ve Teknoloji isimli konuşmasında İlkay Holt, açık verinin herkes tarafından serbestçe kullanılabilmesi, modifye edilebilmesi, değiştirebilmesi ve yeniden kullanılabilmesi olarak tanımladı. TBL 5 Yıldız çerçeve yapılardan bahsetti ve web’in kurucusu ve bağlı veri öncüsü (Linked Data) Tim Berners-Lee konseptine yer verdi. Sunumunda verinin açık olmasında ziyade erişim hakkına odaklandı.
Avrupa Birliği için Açık Veri ve OpenAIRE Advance isimli konuşmasında Gültekin Gürdal, konuşmasında araştırmacıların akademik çalışmalarını nerede yayınladıkları ile ilgili olarak, aslında etki faktörü yüksek olan yerlerde yayınlamanın değil, ne yayınladığının ve hangi platformlarda yayın yapılacağının altını çizdi. Research data management briefing yazısına dikkat çekerek, farklı disiplinlerden her araştırmacıya açık ve güvenilir bir depo olan Zenodo’dan ve EOSC’den bahsetti.
Açık Arşive Doğru isimli konuşmasında Ebru Soyu Yüce Aydın, Tübitak ve Ulakbilim’in açık erişim ve açık bilim konusunda nerede yer aldığını tartıştı. Türkiye Akademik Arşivi ve kurumsal arşiv çalışmalarından bahsetti. Tübitak’ın açık arşiv girişimi olan aperta’dan ve amaçlarından söz ederek, açık demenin ücretsiz demek olmadığı ve açık demenin de kalitesiz demek olmadığının altını çizerek bu yöndeki önyargılara bir cevap verdi. Scoap3 ve DergiPark’ın da diğer açık çalışmalar arasında yer aldığını vurguladı.
Araştırma Verilerinin Yönetimi ve Türkiye’de Durum isimli çalışmasında Dr. Öğr. Üyesi Zehra Taşkın, konuşmasına “araştırma verisi neden yaygınlaştırılmalı” sorusunu yaygınlaştırmanın neden gerekli olduğu ile başladı. Açık erişimin ve açık bilimin daha önce de bahsedilen erişilebilirlik ve yönetilebilirlik gibi faydalarından bahsederek, verinin ya da bilimin açık olmasındaki sebeplerden birisinin de “size anlamlı gelenin, başkasına da anlamlı gelmesi gerektiği” fikri olduğunu vurguladı. Diğer önemli bir nokta ise verinin sahipliği üzerineydi. Verinin sahibi kimdir? Yazar mı, Tübitak veya YÖK mü yoksa kişinin maaş aldığı yer yani Üniversite mi? Türkiye’de açık veri ile ilgili belirli bir politika, strateji ve kurumsal desteğin eksikliğinden söz etti. Bunun dışında, veriye atıf yapmanın ne demek olduğu ve bunun araştırmacılar için aydınlatılması gerektiğini vurguladı. Akademide araştırmacıların çalışma verilerini yayınlamak konusunda kaygı duyduklarını, bunun genelde araştırma verisiyle kişinin kendisinden daha önce yayın yapılabilecek olması ya da kendisinden daha iyi bir yayın yapabilecek olmasından kaynaklandığını, bu yüzden akademisyenlerin araştırma verilerini kapalı tuttuğundan bahsetti. Fakat değinilmesi gereken bir nokta, eğer çalışmada ve araştırma verilerinde patent alınması gereken bir durum yoksa, çalışma verilerinin CC gibi belirli lisanslarla korunduğunu söyledi. Ayrıca, tezlerin açık erişime kapalı olması için, tez danışmanın onayı ile beraber yönetim kurulundan geçmesi gerektiğini, yönetim kurulu onayı yoksa, YÖK’ün artık doğrudan açık erişim olarak yayınladığı tartışıldı. Son olarak, paydaşların ve politika yapıcıların neler yapabileceği tartışıldıktan sonra açık erişimin ekonomisine de değinildi.
Açık Bilim ve Açık Veri Eğitimi Nasıl Olmalıdır isimli çalışmasında Öğr. Gör. R. Orçun Madran, açık veri ile ilgili yapılandırılmış Türkçe bir eğitimin ve açık bilim ile ilgili bir müfredatın olmadığını belirtti. Bu konudaki eksikliklere dikkat çekerek, Open Science Mooc ve Google Dataset Search’den bahsetti ve tüm sunumlara açıkerişim.org adresinden ulaşılabileceğini söyledi.
Son olarak, Büyük Veri isimli konuşmasında Zeki Çelikbaş, büyük verinin tanımı ve özellikleri ile başladı. Büyük verinin üç özelliği olan (Volume, Velocity, Variety) kelimelerine çokluk, çabukluk ve çeşitlilik çeviri önerisiyle, İngilizce ”3Vs of Big Data” olarak adlandırılan özelliklere Türkçe Büyük Veri’nin üç Ç’si önerisini getirdi. Büyük veri genelde verinin miktarı ile ilişkilendirilse de aslında, veri kontrol edemeyeceğiniz şekilde çoğalıyorsa, analiz ederken başka veriler ekleniyorsa büyük veri olarak tanımlandığını belirtti. Diğer bir deyişle, büyük veri verinin düzenli bir yükselişte olmasıdır. CSU, txt, sql, NoSQL, NewSQL gibi veri yapılarından ve dspace, zenodo, imeji, geoserver gibi veri depolama sistemlerinden bahsetti. Bunun dışında, İnternette ya da sosyal ağlarda anonimliğin gizlilik anlamına gelmeyebileceğine yönelik çıkarımı önemliydi. Sunumunun diğer bir kısmında ise veri ticareti ve analizine değinerek, veri üretiminin katlanarak arttığından, telefonlar, GPS ya da yaptığımız alışverişler ile kişisel olarak veri ürettiğimizden ve nesnelerin internetinden bahsetti. Bunun karşısında, ne kadar veri yüklenirse, o kadar veri kullanılmasına izin veren streamx ve datastreamx ağlarına değindi. Tartışılan diğer bir konu ise İnternet’in ölmesi ve güvenirliğini kaybetmesiydi. Bunun sebebinin ise FB, Google, Visa, Master gibi bilgiyi ve ticareti kontrol eden şirketlerin merkezileşmesi olduğu tartışıldı. Benzer şekilde, DOI, Orchid ID, Researcher ID gibi tanımlayıcıların da merkezi ve algoritmalarının gizli olduğu ve bu yüzden güvensiz olmadıkları ve çökebileceği belirtildi. Son olarak, verinin eskimediği, her zaman için kaydedilmesi ve arşivlenmesi gerektiği tartışıldı.
[1] http://rdm.acikerisim.org/
[2] OpenAIRE: Open Access Infrastructure for Research in Europe
[3] http://rdm.acikerisim.org/
[4] https://www.nature.com/news/report-finds-massive-fraud-at-dutch-universities-1.9275
[5] https://www.rd-alliance.org/about-rda
[6] https://www.egi.eu/about/newsletters/what-is-the-european-open-science-cloud/