Eğitimin Süresi | 4 gün |
Ön Şartlar | - Mühendislik, Matematik, İstatistik, Enformatik gibi alanlardan mezun olmak.
- Temel Python bilgisine sahip olmak.
- Temel Linux bilgisine sahip olmak.
- Veri, veri analizi, matematik, istatistik, bilgisayar bilimleri, veritabanı, veritabanı sorgulama bilgilerine sahip olmak.
|
Kimler Katılabilir? | - Büyük veri uzmanlığı ile ilgilenen ve farklı açık kaynak araçları kullanarak yüksek ölçeklenebilir dağıtılmış sistemleri tasarlamak,
- Algoritmaların nasıl çalıştığını anlamak ve yüksek performanslı algoritmalar oluşturmak,
- Karmaşık büyük veri projelerini toplama, ayrıştırma, yönetme, analiz etme ve görselleştirme gibi süreçler üzerinde çalışmak,
- Gerekli donanım ve yazılım tasarım ihtiyaçlarına karar vermek ve bu kararlara göre süreçleri dizayn etmek isteyen kişiler için uygundur.
- Spark / Hadoop'ta veri bilimi ve makine öğrenimi uygulaması gereken, yazılım geliştiriciler, analistler ve veri bilimciler,
- Son derece büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak, gelişmiş analiz teknolojilerini kullanmak,
- Büyük miktarda veriler üzerinde çalışmak isteyen, veri toplama ve analiz etme, veri kümelerindeki kalıpları, eğilimleri ve ilişkileri tespit ederek çeşitli analiz ve raporlama araçlarını kullanmak isteyen kişiler için uygundur.
|
Eğitim Hedefleri | - Büyük veri kavramının ortaya çıkmasını gerektiren senaryolar, Hadoop temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi,
- Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi,
- Büyük veri kümesi kurulumunun planlanması, Ambari ile büyük veri kümesi kurulumu, konfigürasyonu ve yönetimi ile ilgili bilgilerin öğrenilmesi,
- Veri transferi teknolojilerinin temeli olan ve Kafka ve Nifi için kullanım senaryoları ve temel bileşenleri hakkında genel bilgilerin öğrenilmesi,
- Hadoop ortamına veri aktarılması için kullanılan Flume ve Sqoop hakkında temel bilgilerin öğrenilmesi
- Dağıtık dosya sisteminde bulunan dosyalar üzerinde sorgu betikleri çalıştırmayı sağlayan Hive hakkında temel bilgilerin öğrenilmesi,
- Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile Streaming, SQL, DataFrame ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi,
- Veri analizi için Pig Latin script dili hakkında temel bilgilerin öğrenilmesi
- Büyük Veri Ekosisteminde servis yöneticisi olarak bulunan Zookeeper ve iş planlayıcı olan Oozie servisleri hakkında temel bilgilerin öğrenilmesi,
- NoSQL veritabanları ve kullanımları konusunda temel bilgilerin öğrenilmesi,
- Proje yaşam döngüsü, veri toplama, veri değerlendirme, veri dönüştürme ve veri analizi konularını içeren temel bilgilerin öğrenilmesi,
- Yapay Zeka ve Makine Öğrenmesi hakkında temel bilgilerin öğrenilmesi,
- Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile makine öğrenme algoritmalarının kullanımı temel bilgilerin öğrenilmesi,
- Örnek uygulama çalışmalarının yapılması
- Büyük Veride İleri Analitik Uygulamalara örnek çalışmaların incelenmesi
- Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabileceğinin incelenmesi
|
Konu Başlıkları | - Büyük Veri Tarihçe ve Temelleri
- Çekirdek Hadoop:HDFS ve YARN
- Ambari ile Büyük Veri Kümesi Yönetimi
- Veri Entegrasyonu: Kafka ve Nifi
- Veri Entegrasyonu: Flume ve Sqoop
- Veri Analizi: Hive
- Veri İşleme: Spark (Streaming, SQL, DataFrame, GraphX)
- Veri Analizi: Pig
- Zookeeper ve Oozie
- Veri Depolama: HBase
- Veri Bilimi Temelleri
- Yapay zeka ve Makine Öğrenmesi Temelleri
- Veri İşleme: Spark ML
- Spark ML Lab Çalışması
- Büyük Veride İleri Analitik Uygulamalar
- Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabilir?
- Uygulama Çalışması
|