Büyük veri (Big Data) nedir, nasıl analiz edilir?

Dijital dünyanın hızla büyümesiyle beraber her saniye devasa miktarlarda veri üretilmektedir. Bunlar arasında akıllı telefonlar, sosyal medya ağları, çevrimiçi alışveriş siteleri ve nesnelerin interneti cihazları trilyonlarca veriyi oluşturmaktadır. Bu verilerin büyüklüğü ise yönetilmelerini ve analiz edilmelerini zorlaştırmaktadır. Bu noktada büyük veri kavramı öne çıkmaktadır. Peki, büyük veri (Big Data) nedir, nasıl analiz edilir?

Defne Vera Şahin

Büyük veri (Big Data), birçok kişi için yeni bir kavram gibi görünse de kökeni 1970’lerdeki ilişkisel veri tabanlarının geliştirilmesine kadar uzanmaktadır. Basit olarak açıklamak gerekirse büyük veri çok büyük miktarda veriyi ifade eder.

2000’li yılların başından beri sosyal medyanın yaygınlaşmasıyla ortaya çıkan veriler analiz edilmeye başlanmıştır. Bu noktada büyük veri kavramı popülerlik kazanmıştır. Veri bilimi kapsamında big data analizi sıklıkla araştırılan konular arasında yer almaktadır.

Günümüzde dijital dünyada her saniye milyonlarca insanın etkileşim kurmasıyla büyük bir bilgi okyanusu oluşmaktadır. Akıllı telefonlar, sosyal medya platformları, çevrimiçi alışveriş siteleri ve Nesnelerin İnterneti (IoT) cihazları sayesinde her gün trilyonlarca veri üretilir. Bu devasa veri yığınlarına ise büyük veri denir.

Büyük veri nedir dendiğinde sadece “çok miktarda veri” anlamına gelmemektedir. Büyük veri verinin hızla üretilmesiyle beraber çeşitliliği ve karmaşıklığı gibi özellikleri de kapsar. Bu verilen yapılandırılmış ve yapılandırılmamış veriler olarak ikiye ayrılır. Büyük veri analizi ise doğru plan ve yöntemlerle yapıldığında değerli çözümler sunar.

Bu süreçte izlenmesi gereken adımlar aşağıdaki gibidir:

1. Sorularınızı belirleyin

Analize başlamadan önce neyi öğrenmek istediğinizi net bir şekilde ortaya koymalısınız. Soracağınız sorular ölçülebilir ve spesifik olmalıdır. Hangi problemi çözmek ya da hangi fırsatı değerlendirmek istediğinizi bilmek sürecin en kritik adımıdır.

2. Ölçüm önceliklerinizi netleştirin

Hangi veriyi nasıl ölçeceğinizi önceden planlayın. Sorularınızın cevabını hangi kriterlerle değerlendireceğinizi bilmeniz analizin doğruluğunu ve etkinliğini artırır.

3. Veriyi toplayın ve düzenleyin

Sorularınızı ve ölçüm önceliklerinizi belirledikten sonra veriyi toplamaya başlayabilirsiniz. Öncelikle mevcut veri kaynaklarına bakın. Bu noktada hangi verilerin kullanılabileceğini tespit edin. Verilerin düzenli bir şekilde depolanması ve doğru şekilde isimlendirilmesi zaman kazandıracaktır. Bununla beraber topladığınız verileri tarih ve kaynak bilgisiyle sınıflandırın.

4. Veriyi analiz edin

Topladığınız veriyi inceleyin ve farklı açılardan değerlendirin. Bunlar arasında trendler, korelasyonlar, değişimler ve sıradışı veriler sorularınıza yanıt bulmanızı sağlar.

5. Sonuçları yorumlayın

Analiz işlemi tamamlandıktan sonra bulguları yorumlamaya geçin. Bu noktada aşağıdaki soruları sorun:

  • Veriler sorulara yanıt veriyor mu?
  • Yanıtları ne şekilde ortaya koyuyor?
  • Çıkarımlarımı savunmam gerekiyorsa veriler bunu destekliyor mu?
