Bilişimin potansiyel gözdesi: Büyük Veriler (Big Data)

Bugünlerde ‘Big Data’ yani Büyük Veri olarak adlandırılan kavram hızla IT sektöründe önem kazanmaya başlamıştır. Büyük verinin en basit açıklaması çok büyük hacimli veridir ve geleneksel biçimde işlenemeyen veri olarak bilinir. Teknolojinin ilerlemesi, sosyal medyanın gelişmesi ile veri havuzları devasa boyutlara ulaşmaya başlamıştır. Bu kavramın günümüzde ve gelecekte IT sektörünü şekillendirmesi ve belki CLOUD teknolojisinin de önüne geçebilecek devrimlerden biri haline gelmesi bekleniyor. İnternet ve sensor teknolojisi hızla gelişirken  yuksek hacimli verinin nasıl saklanacağı ve istenildiğinde nasıl erişileceği konusunda endişeler kapıyı aralamaya devam etmektedir. Yıllardır her alanda depolanan bu veri tabanları sağlık sektöründen askeriyeye kadar hayati önem taşımaktadır. Bu yüzden Büyük Veriyi etkili ve hızlı bir şekilde kullanmayı öğrenmemiz bir çok alanda çığır açabilecek gelişmelerin doğrulmasını sağlayabilir ki bu da bu alana yapılacak olan yatırımların büyüklüğüne zemin hazırlamaktadır. İleride meslek olarak ‘data scientist’ olarak nitelendirilen mesleklerin büyük önem taşır hale geleceğine inanan insanların sayısı günden güne artmakta.

Nasıl işimize yarayacak? Sorusu hepimizin aklına gelmiştir başta. Düşünün ki elinizde çokça sayıda anket bilgisi bulunduruyorsunuz ve tümü tamamen güvenilir veriye dayanıyor. Bu bilgiler ile bir şirket on yıllık planını kurabilir, dünya çapındaki askeriye kuruluşları önemli kararlarını verebilir ve hatta televizyon sektörü reytingini arttırmaya yönelik bilgiler çıkartabilir. Büyük veri, doğru analiz metotları ile yorumlandığında şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine ve inovasyon yapmalarına imkan sağlayabiliyor. Bu yüzden elimizdeki veriler ve milyonlarca insanın logları bir çok havuza aktarılmaktadır. Dünya çapında bu veriyi alıp saklayabilen, işleyen, istenildiğinde bir veri kümesine kolayca ulaşmayı sağlayan insanlar için ekmek kapısı da aralanmış oluyor. Bu alanda; NoSQL, Hadoop, Cassandra, Jaql, Hbase gibi dillerin popüler olması bekleniyor.

Büyük Veri İçerisindeki Veri Bileşenleri 5v olarak adlandırılan veriyi kategorileyerek ayırmamıza olanak sağlayan bileşenlerdir. Bunlar;

  • Variety (Çeşitlilik): Veriler her zaman aynı formatta üretilmeyebiliyor. Bu yüzden birbirlerine dönüştürme işlemi yaparak veya veri tipini kategorize ederek farklı kodlama yapmamız gerekiyor.
  • Velocity (Hız):  Günden güne büyük bir hızla veri havuzuna katlanarak yeni veriler ekleniyor. Veri işleme hızının da bu doğrultuda arttırılması gerekiyor.
  • Volume (Veri Büyüklüğü): IDC istatistiklerine göre 2020’de ulaşılacak veri miktarı, 2009’un 44 katı olacak. Şimdi bu büyük veri miktarı ile nasıl işlem yapılması gerektiği araştırılıyor. Kurumların veri arşivlemesi için yeni teknolojilerin geliştirilmesi dört gözle beklenmektedir.
  • Verification (Doğrulama): Bu kadar büyük veri arşivi içinde ‘güvenlilik’ büyük önem arzediyor. Akış sırasında, doğru katmadan, olması gerektiği güvenlik seviyesinde izlenmesi, doğru kişiler tarafından görünebilir veya gizli kalması gerekiyor. Verilerin başka şirketler tarafından ele geçirilmesini kimse istemez.
  • Value (Değer): Güvenle saklanan verilerin kurum için bir ‘değer’ arz etmesi önemli bir etken. Bütün birimler için karar verme sürecinde hayati değer taşıyabileceği gibi maddi değer de barındırabiliyor. Bu yüzden her an ulaşılabilir de olması gerekiyor. İşte burada ‘Data scientist’ diye adlandırdığımız kişiler devreye giriyor. Örneğin, sağlık konusunda hayati önem taşıyan bilgiye hemen ulaşılabilmeli. Bir doktor hasta ilaç dağılımında iyileştirme sürecine gidebilmeli. Hava Kuvvetleri, bütün uçucu envanterindeki taşıtlarının anlık yerlerini ve durumlarını görebilmeli, geriye dönük bakım tarihçelerini izleyebilmeli. Bir banka, kredi vereceği kişinin, sadece demografik bilgilerini değil, yemek yeme, tatil yapma alışkanlıklarını dahi izleyebilmeli, gerekirse sosyal ağlarda ne yaptığını görebilmeli.

Teknoloji artık kendi kendini büyütmeye ve biz insanlar onun bir parçası olmaya başladık. Örneğin Twitter her gün 7 TB, Facebook 10 TB ve bazı kurumlar her gün her saat TB’larca veri saklıyor. Bu kadar bilgi tehlikeli olduğu kadar önemli de.  Big datanın bir çok alanda yatırım yapmak için gözde haline gelmesini beklediğimiz aşikar. Karar vermek zor olsa da artık elimizde yığın halinde veri bulunmakta. Birçok başarılı şirket kararlarını artık teknolojinin sayesinde yürütüyor ve milyonlar elde ediyor. Attığınız her adımın tarihe yazılmaya başlandığını unutmayın!

KAYNAK : http://seset.ceit.metu.edu.tr/2015/03/bigdata/ ( Nuray Akdemir )

İlginize Çekebilir

Türk Telekom 5G white paper

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir