BÜYÜK VERİ - BIG DATA NEDİR?

Big Data -Türkçesi ile Büyük Veri- ilk olarak astronomi ve genetik alanında ortaya çıkmış bir kavramdır. Büyük veri kavramı zamanla internet için kullanılmaya başlamış böylelikle günlük hayatımızın farkında olmadan içerisine giren ve sürekli olarak kendisine katkı yaptığımız bir parçası olmuştur. Büyük verinin birçok sözlük tanımı olmakla birlikte en açıklayıcı tanım olarak; “İnsanların her gün kullandığı sosyal medya hesapları, arama motorları, internet gezintileri sırasında arkalarında bıraktıkları izler ve tekil kullanıcıların internet ile olan tüm etkileşimlerinin bir araya getirildiği devasa veri yığını” kullanılabilir.

Bilgisayarın hayatımızın her alanında bu denli etkin olması sonucu birçok veri depolanmakta, işlenmekte, yönetilmekte. İnternetin şirketler, kurumlar ve insanlar tarafından yaygın olarak kullanılmasıyla birlikte bu verilerin dolaşımı, işlenmesi, elektronik ortamda büyük bir hızla çoğalması başka bir sonucu daha ortaya çıkardı. Sözünü ettiğimiz veriler içerisinde bir hizmetin gereği olarak giriş yapılan ve saklanan veriler olduğu gibi son derece gereksiz ve faydasızmış gibi görünen çok sayıda veri de yer almakta ve bunlar çok büyük bir hızla çığ gibi büyümekte. 2012 rakamlarıyla dünyada bir günde 2,5 kentrilyon byte veri üretilmekte. 10 yıl içinde de toplam veri büyüklüğünün şu anki zamanın 44 katına ulaşacağı tahmin ediliyor. Böylece yapısal olmayan verilerden oluşan bir çöplüğün ortaya çıktığını görüyoruz. Önceleri yapısal olmadığı için kullanılamayacağından hareketle bilgi çöplüğü olarak tabir edilen bu olgunun aslında büyük bir hazineyi barındırdığının anlaşılması uzun sürmedi. Nitekim web sunucularının logları, sosyal medya paylaşım ve yayınları, bloglar, mikro bloglar, internet istatistikleri gibi verilerden oluşan bu çöplük aslında çok işlevsel hale getirilebilirdi. Doğru analiz yöntemleri ile yorumlandığı takdirde bu veriler çok önemli kararların doğru olarak alınmasında, risklerin doğru yönetilmesinde ve yeni buluş ve keşiflere imza atılmasında çok önemli katkı sağlayabilmeliydi.

Yukarıda büyüklüğüne az çok işaret ettiğimiz bu veriyi işleme, transfer etme, yorumlama gibi işlerin tümüne big data (büyük veri) adı verilmektedir. Bu verilerin büyüklüğü petabyte, exabyte hatta zettabyte seviyesinde bile olabilir. Örneğin sosyal paylaşım sitelerinden sadece birisi bile her gün 10 TB veriyi üretebilmekte, bazı kurumlar her gün her saat 10’larca TB veri saklayabilmektedir. Tüm bu verilerin saklanması bile yüksek bir maliyet demektir. Oysa big data çözümlerinde açık kaynaklı dağıtık dosya sistemleri ile birleştirerek bu verileri daha az maliyetle saklamak mümkün olmaktadır.

Peki big data içerisindeki veri bileşenleri nelerdir? Büyük veri platformunda beş bileşen vardır. Bu bileşenler V harfi ile başlayan 5 kelime ile ifade edildiğinden 5v olarak anılmaktadır.
5v; variety, velecity, volume, verification ve value’dır. Şimdi bunları kısa açıklamaya çalışalım.

Variety (çeşitlilik) big data'nın farklı farklı teknolojilerin farklı formatlarda, büyük oranda yapısal olmayan çok çeşitli verilerden oluşmasını ifade etmektedir. Telefonlar, tabletler, bütünleşik devreler oluşturdukları türlü türlü verilerle big data'nın büyümesine etki etmektedirler. Velocity (hız) big data'nın üretilme hızının çok yüksek olmasını ifade etmektedir. Yukarıda değinildiği gibi big data gittikçe artan baş döndürücü bir hızla üretilmeye ve büyümeye devam etmektedir. Bu aynı zamanda veriye ihtiyaç duyan işlem sayısı ve çeşitliliğinin de aynı hızda artması demektir. volume (hacim) big datanın büyüklüğüne işaret etmektedir. Big data bu derece büyükken, arşivleme, işleme, bütünleştirme, saklama gibi teknolojilerin 10 yıl içinde yaklaşık olarak 44 kat büyüyecek olan bu verilerle nasıl başa çıkacağı konusunun düşünülmesi gerekmektedir. Verification (doğrulama) bu denli çeşitli, hızlı ve büyük verinin akışının doğru katmanlardan, gerekli güvenlik ve gizlilik seviyesinde olması gerektiğini ifade eder. Value (değer) big data'nın en önemli bileşenidir ve bu verilerin kurumunuz, şirketiniz, işiniz vs. için değer yaratması demektir. bu denli karmaşık, hızlı, çeşitli, yönetilmesi-işlenmesi zor veriler sizin için fayda sağlamalı. Söz gelimi bu veriler sayesinde kritik noktalarda doğru kararlar alabilmelisiniz. Örneğin bir banka kredi vereceği müşterisinin sadece nüfus bilgilerini değil, harcama ve tüketme eğilimlerini de big data sayesinde görebilmeli ve kararını ona göre verebilmelidir.

İnternet teknolojileri ile alakalı hizmet üreten büyük şirketler dev verileri işleyebilmek için yeni algoritmalar ve yazılımlar üzerinde çalışıyor. Kimi bunu açık kodlar ile yaparken kimi ise teknolojisini gizlemeyi tercih ediyor. Büyük verinin iyi işlenmesi ile tekil internet kullanıcıları aradığını kolay bulmakta, şirketler ise tekil kullanıcıların izleri ile oluşan büyük verideki kullanıcı istatistiklerini yorumlayarak yeni pazar stratejileri geliştirmekte. Tüketici eğilimlerini bire bir gözler önüne seren büyük veriyi iyi yorumlayabilen şirketler stratejilerini buna göre belirleyerek risksiz yatırımlar yapıyor. Büyük veri tıpkı uzay boşluğu gibi her gün büyümeye ve insan zihnini hayrete düşürmeye devam ediyor.

Günümüzün popüler kavramlarından biri olan Big Data - Büyük Veri eğitimlerimiz hakkında detaylı bilgi almak ve eğitimlerimize katılmak için bize ulaşın:
info@bilginc.com
+90 212 282 77 00



Egitimlerle ilgili bilgi almak ve diger tum sorulariniz icin bize ulasin!

İlgili Eğitimler

Big Data Information Architecture: Building an Architecture for Insight with Hadoop

Büyük verinin ortaya çıkışı, analitik dünyasını sonsuza dek değiştirdi. Büyük veri ölçeklenebilirliğ...

  • Classroom
  • Virtual Classroom
  • Online

1 Gün

Fundamentals of Big Data

Birçok farklı büyük veri aracıyla çalışmak da dahil olmak üzere Büyük Veri Teknolojilerinin temelini...

  • Classroom
  • Virtual Classroom
  • Online

3 Gün

Big Data on AWS

AWS üzerinde Büyük Veri eğitimi size, Amazon EMR, Amazon Redshift, Amazon Kinesis ve AWS büyük veri...

  • Classroom
  • Virtual Classroom
  • Online

3 Gün

RED HAT NEDİR? RED HAT HAKKINDA TÜM MERAK EDİLENLER II 

DEEP LEARNING & MACHINE LEARNING

FRAMEWORKLER NEDİR VE NE İŞE YARAR?

SİBER GÜVENLİKTE KARİYER

YAPAY ZEKÂ VE TÜRLERİ

MULTI-CLOUD: EFSANELER VE GERÇEKLER

RED HAT HAKKINDA TÜM MERAK EDİLENLER