Eğitimin Süresi | 2 Gün |
Ön Şartlar | - Mühendislik, Matematik, İstatistik, Enformatik gibi alanlardan mezun olmak.
- Temel Python bilgisine sahip olmak.
- Temel Linux bilgisine sahip olmak.
|
Kimler Katılabilir? | - Büyük veri uzmanlığı ile ilgilenen ve farklı açık kaynak araçları kullanarak yüksek ölçeklenebilir dağıtılmış sistemleri tasarlamak,
- Algoritmaların nasıl çalıştığını anlamak ve yüksek performanslı algoritmalar oluşturmak,
- Karmaşık büyük veri projelerini toplama, ayrıştırma, yönetme, analiz etme ve görselleştirme gibi süreçler üzerinde çalışmak,
- Gerekli donanım ve yazılım tasarım ihtiyaçlarına karar vermek ve bu kararlara göre süreçleri dizayn etmek isteyen kişiler için uygundur.
|
Eğitim Hedefleri | - Büyük veri tarihçesi, Hadoop temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
- Proje yaşam döngüsü, veri toplama, veri değerlendirme, veri dönüştürme ve veri analizi konularını içeren temel bilgilerin öğrenilmesi,
- Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
- Büyük veri kümesi kurulumunun planlanması, Ambari ile büyük veri kümesi kurulumu, konfigürasyonu ve yönetimi ile ilgili bilgilerin öğrenilmesi,
- Veri transferi teknolojilerinin temeli olan ve Kafka ve Nifi için kullanım senaryoları ve temel bileşenleri hakkında genel bilgilerin öğrenilmesi,
- Hadoop ortamına veri aktarılması için kullanılan Flume ve Sqoop hakkında temel bilgilerin öğrenilmesi,
- Dağıtık dosya sisteminde bulunan dosyalar üzerinde sorgu betikleri çalıştırmayı sağlayan Hive hakkında temel bilgilerin öğrenilmesi,
- Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile SQL, DataFrame, Makine Öğrenimi ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
- Veri analizi için Pig Latin script dili hakkında temel bilgilerin öğrenilmesi,
- Büyük veri ekosisteminde servis yöneticisi olarak bulunan Zookeeper ve iş planlayıcı olan Oozie servisleri hakkında temel bilgilerin öğrenilmesi,
- NoSQL veritabanları ve kullanımları konusunda temel bilgilerin öğrenilmesi.
|
Konu Başlıkları | - Büyük Veri Tarihçe ve Temelleri
- Veri Bilimi Temelleri
- Çekirdek Hadoop: HDFS ve YARN
- Ambari ile Büyük Veri Kümesi Yönetimi
- Veri Entegrasyonu: Kafka ve Nifi
- Veri Entegrasyonu: Flume ve Sqoop
- Veri Analizi: Hive
- Veri İşleme: Spark (Streaming, SQL, DataFrame, ML, GraphX)
- Veri Analizi: Pig
- Zookeeper ve Oozie
- Veri Depolama: Hbase
|