SORUMLU BÜYÜK VERİ ARAŞTIRMASI İÇİN ON BASİT KURAL

Kaynak: Zook M, Barocas S, boyd d, Crawford K, Keller E, Gangadharan SP, et al. (2017) Ten simple rules for responsible big data research. PLoS Comput Biol 13(3): e1005399. https://doi.org/10.1371/journal.pcbi.1005399

Yazarlar:Zook M, Barocas S, boyd d, Crawford K, Keller E, Gangadharan SP, et al.

Büyük veri araştırma yöntemlerinin kullanımı, hem akademi hem de endüstride son beş yılda muazzam bir artış gösterdi. Mevcut veri kümelerinin boyutu ve karmaşıklığı arttıkça büyük veri araştırmasıyla ortaya çıkan etik sorularda artmaktadır. Veri ve araştırma gündemleri tipik sayısal ve doğal bilimlerin ötesine geçtikçe, insan davranışı, etkileşimi ve sağlığının hassas yönlerine daha doğrudan hitap etmek için bu sorular gittikçe aciliyet kazanmaktadır. Büyük veri araştırmasının araçları ekonomik ve bilimsel içgörüler için dijital tıbbi kayıt madenciliği, sosyal medya aracıyla ilişkilerin haritasını çıkarmak, sensörler aracılığıyla bireylerin eylem ve konuşmalarını yakalamak, uzamda hareketleri izlemek, “öngörücü politika” aracılığıyla güvenlik politikası ve güvenliği şekillendirmek ve daha fazlasını kapsayarak giderek gündelik hayatımızı sarmaktadır.

İlim ve endüstride büyük verilere yararlı olanakların etkisi araştırmacıların sıklıkla kendilerinin eğitim ve konfor alanlarının dışında karşılaştıkları yeni zorluklarla azaltılmaktadır. Bilgisayar bilimciler insan denek protokolleri ve hastane etik kuruluyla uğraşmak zorundayken, sosyal bilimciler artık veri yapıları ve bulut bilişimle uğraşmaktadır. Bireysel veri ve gerçek insanlar arasındaki bağlantı oldukça soyut görünebilirken, büyük verinin birçok türünün karmaşıklığı, kapsamı ve ölçeği insan katılımcılar ve toplulukların derine yerleştiği ve zarar görmeye duyarlı olduğu zengin bir ekosistem yaratır. Bu karmaşıklık herhangi bir normatif kurallar kümesine meydan okur ve evrensel yönergeler hazırlamayı zorlaştırır.

Bununla beraber, sorumlu büyük veri araştırmasında yönerge ihtiyacı aşikardır ve bu makale kaçınılmaz olarak ortaya çıkacak karmaşık etik konulara hitap eden “on basit kurallar” dizisi sağlamaktadır. Makale, PLOS’un Sayısal/Hesaplamalı Biyolojisinin devam eden kuralların toplanmasını örnek almaktadır ve özetlenen öneriler “basit” ve “kurallar” kelimelerinin ima ettiğinden daha fazla nüans içermektedir. Bu nüans kaçınılmaz olarak makalenin başlangıç öncülüne bağlıdır: Sosyal, tıbbi, psikolojik ve ekonomik fenomen üzerine tüm büyük veri araştırması insan deneklerle yakın ilişki kurar ve araştırmacıların, potansiyel zararı minimize etmede etik sorumlulukları vardır.

Büyük verideki veri kaynakları, araştırma konuları ve metodolojik yaklaşımlardaki çeşitlilik herkese uyan bir kontrol listesini yalanlar. Sonuç olarak bu kurallar, bazılarının umduğundan daha az spesifiktir. Daha doğrusu, bu makale araştırmacıları insan katılımcıları ve onların verilerinde yer alan karmaşık sistemleri tanımayı ve standart iş akışlarının bir parçası olarak etik sorularla mücadele etmeye teşvik etmektedir. Makalede yer alan ilk beş kural büyük veri araştırmalarından kaynaklanan zarar verme olasılığının nasıl azaltılacağı çerçevesinde yapılandırılmaktadır. İkinci beş kural araştırmacıların kendi disiplinleri ve metodolojik yaklaşımlarına uygun en iyi pratikleri inşa etmeye katkıda bulunmaya odaklanmaktadır. Bu kuralların merkezinde, verilerinin, varsayımlarını yeniden gözden geçirmek için zarar verme yeteneğinden kurtulduğunu düşünen büyük veri araştırmacılarına meydan okunmaktadır. Bu çalışmadaki örnekler görünüşte zararsız ve anonim verinin ne sıklıkta istenmeyen etik sorular ve zararlı etkiler ürettiğini göstermektedir.

Bu çalışma sosyal, doğal ve sayısal bilimlerden 20 kişilik araştırmacıdan oluşan, Büyük Veri, Etik ve Toplum Konseyini kuran Ulusal Bilim Vakfı (UBV) destekli iki yıllık bir araştırmanın sonucudur. Konsey, UBV’ye bilimsel ve mühendislik araştırmalarında etik pratikleri en iyi nasıl teşvik edeceği, büyük veri araştırma yöntemlerini ve altyapılarını faydalı hale getireceği konusunda rehberlik yapmakla görevlendirilmiştir.

  1. VERİLERİN İNSANLAR OLDUĞU VE ZARAR VEREBİLECEĞİ KONUSUNDA BİLGİLENDİRME

Sorumlu büyük veri araştırmasının en temel kurallarından biri çoğu verinin insanları temsil ettiği ve etkilediği değişmez kabulüdür. Basit bir şekilde tüm verilerin kanıtlanıncaya kadar insanlar olduğu varsayımıyla başlarız. Aksi taktirde verilerin çok önemli konuma sahip belirli bireylerden ayırma güçlüğünü getirir. Bu mantık “riskli” veri kümeleri için halihazırda belirgindir. Örneğin kışkırtıcı diliyle sosyal medya, görünüşte iyi huylu gibi görünen verinin hassas ve kişisel bilgi içermesi.  Örneğin YouTube videolarındaki kişilerin tam kalp atış hızı hakkında veri elde etmek mümkündür. İnsanlarla bir ilgisi yokmuş gibi görünen veriler bile bireylerin hayatlarını beklenmedik şekillerde etkileyebilir. Örneğin toplulukların risk profillerini ve varlıkların değerini değiştirebilen oşinografik veri. Ya da  konum koordinatlarını içeren ve fotoğrafçının hareketlerini ya da evinin konumunu ortaya çıkaran fotoğrafların Değiştirilebilir Görüntü Biçimi (EXIF) kayıtları.

Nüfus boyu etkiler hakkında görünüşte zararsız veri kümelerinin genellikle prosedürlere başvurmadan bireylerin ya da damgalanmış grupların yaşamlarını şekillendirmesinde kullanıldığında zarar da sonuç olabilir.

  1. GİZLİLİĞİN İKİLİ BİR DEĞERDEN DAHA FAZLA BİR ŞEY OLDUĞUNU KABUL ETME

Gizlilik ihlalleri büyük veri araştırmasının zarar verebileceği araçlardır ve gizliliğin bağlamsal ve durumsal olduğunu, basit bir kamu özel ikiliğine indirgenemeyeceğini kabul etmek önemlidir. Çünkü bir şeyin kamusal olarak paylaşılması müteakip/sonraki kullanımının sorunsuz olacağı anlamına gelmemektedir. Gizlilik verinin niteliğine, oluşturuldukları ve elde edildikleri bağlama, etkilenenlerin beklentilerine ve kurallarına bağlıdır. Kabul edilebilir kullanım ve gizliliğe yönelik tavrının verisi kullanılanlarla uyuşmayabileceğini anlamalıdır, çünkü gizlilik tercihleri toplum içinde ve toplumlar arasında farklılık gösterir.

  1. VERİLERİNİZİN YENİDEN TANIMLANMASINA KARŞI KORUMA

Verinin yeniden tanımlanamayacağını varsaymak sorunludur. İyi niyetlerle ve görünürde iyi yöntemlerle belirli bireylerin daha sonra tanımlanmasını önlemek için veriyi yeterince anonimleştirmede başarılı olamayan araştırmacılara ilişkin sayısız örnekler vardır. Diğer durumlarda bu çabalar son derece yüzeyseldir. Anonimleştirildiği düşünülen veri setleri diğer değişkenlerle birleştirildiğinde, beklenmeyen yeniden tanımlanmaya yol açabilir, bu durum son bileşenin eklenmesinden kaynaklanan bir kimyasal reaksiyona çok benzer.

Doğum tarihi, cinsiyet ve posta kodunun tanımlayıcı gücü iyi bilinirken, bireyleri tanımlamada daha yararlı olabilecek, özellikle dijital etkinlikle ilişkilendirilen meta veriler gibi, bir dizi başka parametreler vardır. Konum ve hareket gibi etiketsiz ağ grafikleri, DNA profilleri, mobil telefon verisinden çağrı kayıtları ve hatta dünyanın yüksek çözünürlüklü uydu görüntüleri bile insanları yeniden tanımlamakta kullanılabilir. Bu zayıf noktaları önceden tanımlamak zordur.

  1. ETİK VERİ PAYLAŞIMINI UYGULAMA

Bazı projeler için veri paylaşımı insan katılımcıların beklentisidir ve böylece etik araştırmanın önemli bir parçasıdır. Örneğin, nadir genetik hastalık araştırmasında biyolojik örnekler tedavi bulma umuduyla paylaşılır, paylaşma ya da yayma katılım şartı haline getirilir. Ancak kullanım ve paylaşma kuralları bilgilendirilmiş onam ve geri çekme hakkıyla iyi yönetilen projelerden farklı olarak bu durum büyük veri için kuraldan çok istisnadır. Dijital toplumumuzda, gündelik hayatımızın izlerinden oluşan veri bulutları tarafından izlenmekteyiz. Bu veri bulutları kredi kartı işlemleri, tıbbi test sonuçları, kapalı devre televizyon görüntüleri, akıllı telefon uygulamaları gibi üniversite uyum görevlileri tarafından denetlenen sorumlu araştırma tasarımı yerine zorunlu hizmet kullanım şartları kapsamında toplanan verilerden oluşmaktadır. Biz bilgilendirilmiş rıza ve çekilme hakkı standartlarını isterken, bu resmi olmayan büyük veri kaynakları özel yazılım şirketleri, devlet kurumları ve telekomünikasyon firmaları gibi araştırmacı dışındaki aracılar tarafından bir araya getirilmektedir. Bu veriler oluşturulduktan sonra araştırmacılar için erişilebilir olmakta, bu durum önceden bilgilendirilmiş onayı elde etmeyi imkansız hale getirmektedir. Bu durumda yazılım firmaları ve devlet kurumlarında bu veriyi toplayan araştırmacıların verilerin toplandığı şartları yerine getirmek için özel sorumlulukları vardır.

  1. VERİLERİNİN GÜÇLÜ VE SINIRLAYICI UNSURLARINI GÖZ ÖNÜNDE BULUNDURMA, BÜYÜK KENDİLİĞİNDEN DAHA İYİ DEMEK DEĞİLDİR

Doğru ve sorumlu büyük veri araştırması yapmak için çıkar çatışmaları da dahil olmak üzere veri kümelerini uygun bağlama yerleştirmek önemlidir. Bağlam ayrıca veri toplamadan, temizlemeye, bulguların yorumlanması ve sonuçların yayılmasına kadar araştırmanın her aşamasını etkiler. Veri toplama aşamasında, hem veri kaynağını hem de toplandıkları kuralları ve düzenlemeleri anlamak çok önemlidir.

Verilerin bağlamına dikkat etmek kurumlara veri ve analizinin ne zaman çalıştığı ve ne zaman çalışmadığını açıklamanın temelini sağlar. Büyük verilere dayalı bulguları açık bir sonuç olarak yorumlamak cazip olsa da, bilimsel araştırmada önemli bir adım veri veya göstergeyi neyin temsil ettiğini ve neyin temsil etmediğini açıkça ifade etmektir.

  1. ZORU, ETİK SEÇİMLERİ TARTIŞMA

Kurumsal inceleme kurulları (IRB) tarafından yönetilen federal hükümet tarafından finanse edilen insan katılımcıların dahil olduğu araştırma iyi yapılandırılmış işlemler yoluyla zararı önlemekle görevlidir ve birçok araştırmacıya aşinadır. IRBler ancak etikte söz sahibi tek kuruluş değildir. Büyük veriyi içeren pek çok etik sorun yönetişim yetkilerinin dışındadır. Çünkü büyük veri araştırmacıları genellikle IRB’lerin etki alanlarına yabancı ya da bu alanların dışında olan durumlarla karşılaşırlar. Bu nedenle meslektaşların kendi içlerinde konuları tartışması önemlidir.

Net çözümler ve yönetişim protokollerinin eksikliği, hatadan ziyade araştırmacıların kendi çalışmalarında sahiplenmesi gereken bir özellik olarak anlaşılmalıdır. Etik konuların tartışılması hem disiplinler içinde hem de disiplinler arasında mesleki gelişimin önemli bir parçasıdır. Bu tartışma sorumlu uygulayıcılardan oluşan olgun bir topluluk oluşturabilir. Bu tartışmaları kurs ve eğitim haline getirmek, bu etik soruları artırmak için özellikle iyi yerleştirilmiş ve bu konuşmalara duyulan ihtiyacın fark edilmesini teşvik eden değerlendirme hakemleri üretebilir. Herhangi bir resmi etik kural ya da yönetmeliklerin ön koşulu, böyle açık uçlu tartışmalar yapma kapasitesidir.

  1. KURULUŞUNUZ, ARAŞTIRMA TOPLULUĞUNUZ YA DA SEKTÖRÜNÜZ İÇİN DAVRANIŞ KURALLARI GELİŞTİRME

Zorlu seçimleri tartışma süreci, etiği direkt olarak araştırmanın iş akışına ekler, “sahte/taklit etik”i sahte veri ve sonuçlar gibi kabul edilemez hale getirir. Onlara sonradan akla gelen düşünceler ya da dış kaynak kullanımı için bir sorun olarak davranmak yerine bu tartışmaları içselleştirmek özellikle insanlar tarafından iz verilerini kullanırken başarılı bir araştırmanın anahtarıdır. Bu durum dijital günlük yaşamın veri akışlarına ayrıcalıklı erişim olanağına sahip endüstridekiler de dahil olmak üzere tüm araştırmalar için geçerlidir. Bu verilerin etik kullanımı kamuoyunun dikkatinden kaçırılmamalıdır; ne de olsa, bu veri kümeleri milyarlarca insanın hayatlarını yaşamak için kullandıkları bir altyapı üzerine kuruludur ve araştırmanın sorumlu bir şekilde yapılmasında çok güçlü bir kamu yararı vardır.

Bunu gündelik uygulamalarda pekiştirmenin/sağlamlaştırmanın en iyi yollarından biri kuruluşunuzda ya da araştırma topluluğunda kullanılmak ve örgün eğitime ve süregelen eğitime dahil olmak için davranış kuralları geliştirmektir. Kurallar yayınların değerlendirme sürecinde ve fonlamada dikkate alınmada rehberlik sağlayabilir.

  1. VERİLERİNİZİ VE SİSTEMLERİNİZİ DENETLENEBİLİRLİK İÇİN TASARLAMA

Davranış Kuralları konuya ve araştırma topluluğuna bağlı olarak değişecek olmasına rağmen, özellikle önemli bir unsur, denetlenebilirlik için veri ve sistemler tasarlamaktır. Sorumlu iç denetim süreçleri denetim sistemlerine kolayca karışır ve ayrıca, sorunlu sonuçlara katkıda bulunabilecek faktörleri takip eder. Problemli sonuçların değerlendirilmesi için otomatik test süreçlerinin ve değerlendirme sürecinde diğerlerinin çalışmasının denetlenmesi için mekanizmalar geliştirilmesi bir bütün olarak araştırmayı güçlendirebilir.

  1. VERİ VE ANALİZ UYGULAMALARININ KAPSAMLI SONUÇLARIYLA YAKINDAN İLGİLENME

Sorumlu büyük veri araştırmacıları için iş dünyasında ve akademideki geleneksel başarı metriklerinin ötesinde düşünmek önemlidir. Örneğin dijital gündelik yaşam için enerji talepleri, sosyal bilim araştırmaları için önemli bir büyük veri kaynağı olan, iklim değişikliği döneminde önemlidir. Büyük veri araştırmaları, veri analitik çalışmalarının çevresel etkisini nasıl azaltabilir? Örneğin, araştırmacılar bulut depolama sağlayıcıları ve veri işleme merkezlerine sürdürülebilir ve yenilenebilir enerji kaynaklarına geçmeyi sormada öncülük etmeliler mi? Bulutun önemli ve herkes tarafından görünür kullanıcıları olarak, büyük veri araştırmacıları böylesine bir değişim çağrısında bulunabilecek toplu bir çıkar grubunu temsil eder.

  1. BU KURALLARIN NE ZAMAN ÇİĞNECEĞİNİ BİLME

Son (ve mantıkdışı) kural, bu kurallardan ne zaman uzak durmanın uygun olacağının farkına varma yükümlülüğüdür. Örneğin, doğal felaket ya da halk sağlığı krizlerinde daha büyük bir kamu yararına hizmet için geçici olarak bireysel gizlilik sorunlarını bir kenara bırakmak önemli olabilir. Aynı şekilde, bilgilendirilmiş rıza olmadan toplanan genetik ya da biyolojik verilerin kullanımı ortaya çıkan bir hastalık salgınını yönetmede hayati önem taşıyabilir.

Ayrıca, veri kümenizdeki gizliliğin korunmasıyla ilgili düzenleyici beklentileri ve yasal talepleri gözden geçirdiğinize emin olun. Buna karşın, bu son derece riskli bir durumdur. Bu kuralı izleyerek diğer kuralları ihlal etmeden önce acil durumun basitçe bir uygun gerekçe olmadığı konusunda dikkatli olun. Bunu sağlamak için en iyi yol zor tartışmalarda yer almak için deneyim kazanmak (kural 6), davranış kuralları inşa etmek (kural 7) ve denetleme sistemleri geliştirmektir (kural 8).

SONUÇ

Bu on kural kümesinin amacı araştırmacıların daha iyi çalışmasına yardımcı olmak ve sonuç olarak kamu güvensizliği de dahil olmak üzere daha büyük komplikasyonları önlerken daha başarılı olmaktır. Bunu başarmak için, araştırmacılar tekniklere ve metodolojiye odaklandığında titiz, ahlak söz konusu olduğunda naif olan bu zihniyetten uzaklaşmalıdır.

Kısaca, sorumlu büyük veri araştırması araştırmayı engellemekle ilgili değil, çalışmanın doğru ve zararı en aza indirirken faydayı maksimize ettiğinden emin olmaktır. Araştırmacıların karşılaştıkları sorunlar ve tercihler gerçek, karmaşık ve zorlayıcıdır ve bu nedenle cevabımız olmalıdır.

Reklamlar

One Response to SORUMLU BÜYÜK VERİ ARAŞTIRMASI İÇİN ON BASİT KURAL

  1. seo uzmanı dedi ki:

    Uzun zamandır aradığım paylaşımdı sağolun

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s

%d blogcu bunu beğendi: