Eğitimin Süresi

3Gün

Ön Şartlar

  • Veri, veri analizi, matematik, istatistik, bilgisayar bilimleri, veritabanı, veritabanı sorgulama bilgisine sahip olmak.
  • Temel Linux bilgisine sahip olmak.

Kimler Katılabilir?

  • Spark ile veri bilimi ve makine öğrenimi uygulaması gereken, yazılım geliştiriciler, analistler ve veri bilimciler,
  • Son derece büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak,
  • Gelişmiş analiz teknolojilerini kullanmak,
  • Büyük miktarda veriler üzerinde çalışmak isteyen, veri toplama ve analiz etme, veri kümelerindeki kalıpları, eğilimleri ve ilişkileri tespit ederek çeşitli analiz ve raporlama araçlarını kullanmak isteyen kişiler için uygundur.

Eğitim Hedefleri

  • Python Programlama ile ilgili temel bilgilerin öğrenilmesi,
  • Büyük veri temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
  • Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
  • Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile SQL, DataFrame, Makine Öğrenimi ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
  • Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile makine öğrenme algoritmalarının kullanımı temel bilgilerin öğrenilmesi,

Konu Başlıkları

  • Python’a Giriş
  • Büyük Veri Temelleri
  • Çekirdek Hadoop: HDFS ve YARN
  • Spark Mimarisi
  • Spark Düşük Seviye API (RDD)
  • Spark Yüksek Seviye API (DataFrame, Dataset, SQL)
    DataFrame ve Dataset Kalıcılığı   
  • Spark Streaming
  • Spark Structured Streaming
  • Spark Dağıtık İşleme
  • Spark Uygulamalarını Yazma, Yapılandırma ve Çalıştırma
  • Performans Ayarı 
  • Spark ML
  • Spark ile Derin Öğrenme