Eğitimin Süresi | 3Gün |
Ön Şartlar | - Veri, veri analizi, matematik, istatistik, bilgisayar bilimleri, veritabanı, veritabanı sorgulama bilgisine sahip olmak.
- Temel Linux bilgisine sahip olmak.
|
Kimler Katılabilir? | - Spark ile veri bilimi ve makine öğrenimi uygulaması gereken, yazılım geliştiriciler, analistler ve veri bilimciler,
- Son derece büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak,
- Gelişmiş analiz teknolojilerini kullanmak,
- Büyük miktarda veriler üzerinde çalışmak isteyen, veri toplama ve analiz etme, veri kümelerindeki kalıpları, eğilimleri ve ilişkileri tespit ederek çeşitli analiz ve raporlama araçlarını kullanmak isteyen kişiler için uygundur.
|
Eğitim Hedefleri | - Python Programlama ile ilgili temel bilgilerin öğrenilmesi,
- Büyük veri temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
- Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
- Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile SQL, DataFrame, Makine Öğrenimi ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
- Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile makine öğrenme algoritmalarının kullanımı temel bilgilerin öğrenilmesi,
|
Konu Başlıkları | - Python’a Giriş
- Büyük Veri Temelleri
- Çekirdek Hadoop: HDFS ve YARN
- Spark Mimarisi
- Spark Düşük Seviye API (RDD)
- Spark Yüksek Seviye API (DataFrame, Dataset, SQL)
DataFrame ve Dataset Kalıcılığı - Spark Streaming
- Spark Structured Streaming
- Spark Dağıtık İşleme
- Spark Uygulamalarını Yazma, Yapılandırma ve Çalıştırma
- Performans Ayarı
- Spark ML
- Spark ile Derin Öğrenme
|