Eğitimin Süresi

4 gün

Ön Şartlar

  • Mühendislik, Matematik, İstatistik, Enformatik gibi alanlardan mezun olmak.
  • Temel Python bilgisine sahip olmak.
  • Temel Linux bilgisine sahip olmak.
  • Veri, veri analizi, matematik, istatistik, bilgisayar bilimleri, veritabanı, veritabanı sorgulama bilgilerine sahip olmak.

Kimler Katılabilir?

  • Büyük veri uzmanlığı ile ilgilenen ve farklı açık kaynak araçları kullanarak yüksek ölçeklenebilir dağıtılmış sistemleri tasarlamak,
  • Algoritmaların nasıl çalıştığını anlamak ve yüksek performanslı algoritmalar oluşturmak,
  • Karmaşık büyük veri projelerini toplama, ayrıştırma, yönetme, analiz etme ve görselleştirme gibi süreçler üzerinde çalışmak,
  • Gerekli donanım ve yazılım tasarım ihtiyaçlarına karar vermek ve bu kararlara göre süreçleri dizayn etmek isteyen kişiler için uygundur.
  • Spark / Hadoop'ta veri bilimi ve makine öğrenimi uygulaması gereken, yazılım geliştiriciler, analistler ve veri bilimciler,
  • Son derece büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak, gelişmiş analiz teknolojilerini kullanmak,
  • Büyük miktarda veriler üzerinde çalışmak isteyen, veri toplama ve analiz etme, veri kümelerindeki kalıpları, eğilimleri ve ilişkileri tespit ederek çeşitli analiz ve raporlama araçlarını kullanmak isteyen kişiler için uygundur.

Eğitim Hedefleri

  • Büyük veri kavramının ortaya çıkmasını gerektiren senaryolar, Hadoop temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
  • Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri kümesi kurulumunun planlanması, Ambari ile büyük veri kümesi kurulumu, konfigürasyonu ve yönetimi ile ilgili bilgilerin öğrenilmesi,
  • Veri transferi teknolojilerinin temeli olan ve Kafka ve Nifi için kullanım senaryoları ve temel bileşenleri hakkında genel bilgilerin öğrenilmesi,
  • Hadoop ortamına veri aktarılması için kullanılan Flume ve Sqoop hakkında temel bilgilerin öğrenilmesi
  • Dağıtık dosya sisteminde bulunan dosyalar üzerinde sorgu betikleri çalıştırmayı sağlayan Hive hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile Streaming, SQL, DataFrame ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
  • Veri analizi için Pig Latin script dili hakkında temel bilgilerin öğrenilmesi
  • Büyük Veri Ekosisteminde servis yöneticisi olarak bulunan Zookeeper ve iş planlayıcı olan Oozie servisleri hakkında temel bilgilerin öğrenilmesi,
  • NoSQL veritabanları ve kullanımları konusunda temel bilgilerin öğrenilmesi,
  • Proje yaşam döngüsü, veri toplama, veri değerlendirme, veri dönüştürme ve veri analizi konularını içeren temel bilgilerin öğrenilmesi,
  • Yapay Zeka ve Makine Öğrenmesi hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile makine öğrenme algoritmalarının kullanımı temel bilgilerin öğrenilmesi,
  • Örnek uygulama çalışmalarının yapılması
  • Büyük Veride İleri Analitik Uygulamalara örnek çalışmaların incelenmesi
  • Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabileceğinin incelenmesi

Konu Başlıkları

  • Büyük Veri Tarihçe ve Temelleri
  • Çekirdek Hadoop:HDFS ve YARN
  • Ambari ile Büyük Veri Kümesi Yönetimi
  • Veri Entegrasyonu: Kafka ve Nifi
  • Veri Entegrasyonu: Flume ve Sqoop
  • Veri Analizi: Hive
  • Veri İşleme: Spark (Streaming, SQL, DataFrame, GraphX)
  • Veri Analizi: Pig
  • Zookeeper ve Oozie
  • Veri Depolama: HBase
  • Veri Bilimi Temelleri
  • Yapay zeka ve Makine Öğrenmesi Temelleri
  • Veri İşleme: Spark ML
  • Spark ML Lab Çalışması
  • Büyük Veride İleri Analitik Uygulamalar
  • Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabilir?
  • Uygulama Çalışması