Uygulamalar, günümüzde entegrasyonun ve veri girişinin de çeşitlenmesi ile çok daha fazla veri üretmeye başladılar. Çekilen fotoğraflardan yola çıkmış idik. Bir günde aynı mekanda binlerce fotoğraf sisteme yüklenmiş oldu. Peki bunu analiz etmemiz gereken bir uygulama verisi gibi düşünürsek bu kadar veri ile nasıl baş edebiliriz?
Verinin Düzenlenmesi: Malum doğru etiketleme ya da yanlış yazımlar, yanlış bilgi içerikleri olabilir. Bunlar ileri aşamalarda raporlarımızı baltalayacak en büyük sorunumuz olacaktır.
Verinin Sınıflandırılması: uygulamadan gelen onca bilgiden hangileri bizim için değerlidir ya da daha açık bir değişle analizlerimizde kullanabileceğimiz veriler hangileridir?
Verinin Tekilleştirilmesi: Öncelikle aynı fotoğraftan birçok adet olduğuna göre tekilleştirmemiz gerekebilir. Sonuçta biri biri ile aynı olan fotoğraflar bize ek bir fayda sağlamayacaktır. Aksine donanım, performans ve bakım süreçlerimizde de bize yardımcı olmayacaktır
Verinin Zenginleştirilmesi: fotoğraf verisini başka uygulamalardaki veriler ile birleştirebiliriz. Örneğin tek ya da grup çekimleri, belki harcanan süre, toplam tekil (distinct) çekim sayısı, sergi giriş tarihleri, ziyaret süresi, bilet tipi gibi.
Performans: Bildiğimiz üzere, verinin hacmi büyüdükçe raporlama, yedekleme ve genel bakım/operasyon süreçlerinde çeşitli performans sorunları ortaya çıkmaya başlar.
Bu nedenle hızlı çalışması gereken sistemlerde veri silme veya arşivleme işlemleri genellikle periyodik olarak uygulanır.
Ancak belli bir tarihten eski verilerin silinmesi bazen geri dönülmez bilgi kayıplarına yol açabilir.
Ya sonradan “Keşke şu veriyi de saklasaydık” dersek?
Örneğin, “İlk hangi sergi alanında fotoğraf çekilmişti?” gibi bir soruya cevap vermek isteyebiliriz.
Bu nedenle veriyi tamamen silmek yerine arşivlemek çoğu zaman daha doğru bir yaklaşımdır.
Elbette bu da donanım ve depolama maliyetleri anlamına gelir.
Hızlı diskler daha pahalı olduğundan, arşivlenecek verilerin daha yavaş disklerde veya daha ekonomik depolama alanlarında tutulması düşünülebilir.
Ayrıca, silinmeden önce yedek alınması ve gerektiğinde yeniden erişime açılabilmesi için uygun bir yedekleme stratejisi oluşturulmalıdır.
Son olarak da KVKK gerekliliğinden dolayı verinin normalleştirilmesi, maskelenmesi, erişimlerin denetlenmesi gibi konular var.
Burada özetlemek gerekir ise, uygulamalardaki verinin değerlendirilmesi öncesinde tabii ki bilgi işlem departmanlarının çözmesi gereken bir çok sorun var: Maliyet, performans, bakım, siber güvenlik, denetim, KVKK gibi. Ama sonrasında veriden değer elde etme adına , nasıl bir maden için tonlarca toprak kazılıp içerisinden madene erişiliyor ise veride de benzer bir çalışmanın yapılması gerekir. Uygulamalar nerede ise sonsuz büyüklükte veri üretirken buradan değer elde etmek bizim madencilik becerimize kalıyor.