Büyük Veri ve Yapay Zeka Eğitimi | TUBİTAK BİLGEM | BULUT BİLİŞİM VE BÜYÜK VERİ ARAŞTIRMA LABORATUVARI

Eğitimin Süresi	4 gün
Ön Şartlar	Mühendislik, Matematik, İstatistik, Enformatik gibi alanlardan mezun olmak. Temel Python bilgisine sahip olmak. Temel Linux bilgisine sahip olmak. Veri, veri analizi, matematik, istatistik, bilgisayar bilimleri, veritabanı, veritabanı sorgulama bilgilerine sahip olmak.
Kimler Katılabilir?	Büyük veri uzmanlığı ile ilgilenen ve farklı açık kaynak araçları kullanarak yüksek ölçeklenebilir dağıtılmış sistemleri tasarlamak, Algoritmaların nasıl çalıştığını anlamak ve yüksek performanslı algoritmalar oluşturmak, Karmaşık büyük veri projelerini toplama, ayrıştırma, yönetme, analiz etme ve görselleştirme gibi süreçler üzerinde çalışmak, Gerekli donanım ve yazılım tasarım ihtiyaçlarına karar vermek ve bu kararlara göre süreçleri dizayn etmek isteyen kişiler için uygundur. Spark / Hadoop'ta veri bilimi ve makine öğrenimi uygulaması gereken, yazılım geliştiriciler, analistler ve veri bilimciler, Son derece büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak, gelişmiş analiz teknolojilerini kullanmak, Büyük miktarda veriler üzerinde çalışmak isteyen, veri toplama ve analiz etme, veri kümelerindeki kalıpları, eğilimleri ve ilişkileri tespit ederek çeşitli analiz ve raporlama araçlarını kullanmak isteyen kişiler için uygundur.
Eğitim Hedefleri	Büyük veri kavramının ortaya çıkmasını gerektiren senaryolar, Hadoop temelleri ve ekosistemi oluşturan temel teknolojiler hakkında temel bilgilerin öğrenilmesi, Çekirdek Hadoop’u oluşturan dağıtık dosya sistemi (HDFS) ve kaynak yönetimini sağlayan YARN’ın özellikleri ve kullanımı hakkında temel bilgilerin öğrenilmesi, Büyük veri kümesi kurulumunun planlanması, Ambari ile büyük veri kümesi kurulumu, konfigürasyonu ve yönetimi ile ilgili bilgilerin öğrenilmesi, Veri transferi teknolojilerinin temeli olan ve Kafka ve Nifi için kullanım senaryoları ve temel bileşenleri hakkında genel bilgilerin öğrenilmesi, Hadoop ortamına veri aktarılması için kullanılan Flume ve Sqoop hakkında temel bilgilerin öğrenilmesi Dağıtık dosya sisteminde bulunan dosyalar üzerinde sorgu betikleri çalıştırmayı sağlayan Hive hakkında temel bilgilerin öğrenilmesi, Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile Streaming, SQL, DataFrame ve GraphX kütüphaneleri konusunda temel bilgilerin öğrenilmesi, Veri analizi için Pig Latin script dili hakkında temel bilgilerin öğrenilmesi Büyük Veri Ekosisteminde servis yöneticisi olarak bulunan Zookeeper ve iş planlayıcı olan Oozie servisleri hakkında temel bilgilerin öğrenilmesi, NoSQL veritabanları ve kullanımları konusunda temel bilgilerin öğrenilmesi, Proje yaşam döngüsü, veri toplama, veri değerlendirme, veri dönüştürme ve veri analizi konularını içeren temel bilgilerin öğrenilmesi, Yapay Zeka ve Makine Öğrenmesi hakkında temel bilgilerin öğrenilmesi, Büyük veri üzerinde bellek içi analiz ve analitik çalışmaları gerçekleştirmek için kullanılan Spark ile makine öğrenme algoritmalarının kullanımı temel bilgilerin öğrenilmesi, Örnek uygulama çalışmalarının yapılması Büyük Veride İleri Analitik Uygulamalara örnek çalışmaların incelenmesi Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabileceğinin incelenmesi
Konu Başlıkları	Büyük Veri Tarihçe ve Temelleri Çekirdek Hadoop:HDFS ve YARN Ambari ile Büyük Veri Kümesi Yönetimi Veri Entegrasyonu: Kafka ve Nifi Veri Entegrasyonu: Flume ve Sqoop Veri Analizi: Hive Veri İşleme: Spark (Streaming, SQL, DataFrame, GraphX) Veri Analizi: Pig Zookeeper ve Oozie Veri Depolama: HBase Veri Bilimi Temelleri Yapay zeka ve Makine Öğrenmesi Temelleri Veri İşleme: Spark ML Spark ML Lab Çalışması Büyük Veride İleri Analitik Uygulamalar Gerçek dünya problemlerinde büyük veri teknolojileri ve yapay zeka nasıl kullanılabilir? Uygulama Çalışması