Eğitimin Süresi

2 Gün

Ön Şartlar

  • Mühendislik, Matematik, İstatistik, Enformatik gibi alanlardan mezun olmak.
  • Temel Python bilgisine sahip olmak.
  • Temel Linux bilgisine sahip olmak.

Kimler Katılabilir?

  • Büyük veri uzmanlığı ile ilgilenen ve farklı açık kaynak araçları kullanarak yüksek ölçeklenebilir dağıtılmış sistemleri tasarlamak,
  • Algoritmaların nasıl çalıştığını anlamak ve yüksek performanslı algoritmalar oluşturmak,
  • Karmaşık büyük veri projelerini toplama, ayrıştırma, yönetme, analiz etme ve görselleştirme gibi süreçler üzerinde çalışmak,
  • Gerekli donanım ve yazılım tasarım ihtiyaçlarına karar vermek ve bu kararlara göre süreçleri dizayn etmek isteyen kişiler için uygundur.

Eğitim Hedefleri

  • Büyük veri tarihçesi, Hadoop temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
  • Proje yaşam döngüsü, veri toplama, veri değerlendirme, veri dönüştürme ve veri analizi konularını içeren temel bilgilerin öğrenilmesi,
  • Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri kümesi kurulumunun planlanması, Ambari ile büyük veri kümesi kurulumu, konfigürasyonu ve yönetimi ile ilgili bilgilerin öğrenilmesi,
  • Veri transferi teknolojilerinin temeli olan ve Kafka ve Nifi için kullanım senaryoları ve temel bileşenleri hakkında genel bilgilerin öğrenilmesi,
  • Hadoop ortamına veri aktarılması için kullanılan Flume ve Sqoop hakkında temel bilgilerin öğrenilmesi,
  • Dağıtık dosya sisteminde bulunan dosyalar üzerinde sorgu betikleri çalıştırmayı sağlayan Hive hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile SQL, DataFrame, Makine Öğrenimi ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
  • Veri analizi için Pig Latin script dili hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri ekosisteminde servis yöneticisi olarak bulunan Zookeeper ve iş planlayıcı olan Oozie servisleri hakkında temel bilgilerin öğrenilmesi,
  • NoSQL veritabanları ve kullanımları konusunda temel bilgilerin öğrenilmesi.

Konu Başlıkları

  • Büyük Veri Tarihçe ve Temelleri
  • Veri Bilimi Temelleri
  • Çekirdek Hadoop: HDFS ve YARN
  • Ambari ile Büyük Veri Kümesi Yönetimi
  • Veri Entegrasyonu: Kafka ve Nifi
  • Veri Entegrasyonu: Flume ve Sqoop
  • Veri Analizi: Hive
  • Veri İşleme: Spark (Streaming, SQL, DataFrame, ML, GraphX)
  • Veri Analizi: Pig
  • Zookeeper ve Oozie
  • Veri Depolama: Hbase