Course curriculum

  1. Genel Bilgilendirme

  2. Kurs Materyalleri

  1. Sanal Makine İndirme

  2. Sanal Makine Linki ve Kılavuzu

  3. Sanal Makine İndirme Hata Çözüm

  4. Sanal Makine Kurulumu

  1. Apache Spark Giriş

  2. Dataframe API Giriş

  1. Spark Dataframe ve SparkSession Giriş

  2. Dosya Kaynağından Veri Okuma

  3. Elle Şema Tasarlama

  4. Columns ve Expressions

  5. Rows

  6. Dataframe'i CSV Formatında Diske Yazma

  7. Veri Filtreleme

  8. Birden Fazla Sütun Üzerinde Filtreleme ve Dönüşümler

  9. Kullanıcı Tanımlı Fonksiyonlar (UDF)

  10. Kullanıcı Tanımlı Fonksiyonlar (UDF) Pandas

  11. Sütun Ekleme, Düşürme ve Yeniden İsimlendirme

  12. Tarih/Zaman Operasyonları-1: String -> Timestamp

  13. Tarih/Zaman Operasyonları-2: Unix Timestamp

  14. Tarih/Zaman Operasyonları-3: String -> Date

  15. Tarih/Zaman Operasyonları-4: Yeni Özellik Çıkarma

  16. Aggregations

  17. Spark Execution Plan İnceleme

  18. Spark YARN Mode

  19. Higher Order Fonksiyonlar

  1. Parquet Formatı

  2. Avro Formatı

  3. JSON ve CSV Formatları

  4. ORC Formatı

  5. Apache Hive

  6. İlişkisel Veri Tabanı (PostgreSQL)

  7. Quiz - Spark Giriş, PySpark Dataframe Operasyonları, Veri Kaynakları

  1. Pycharm Projesi Yaratma

  2. Spark-submit ve Python argparse

  3. Spark Konfigürasyonlar

  4. Spark Resouce Allocation ve Optimizasyon İpuçları

  5. Multinode Cloudera Cluster Üzerinde Demo

  6. Spark Dynamic Resource Allocation

  7. Cloudera Cluster Üzerinde Spark Dynamic Allocation Demo

  8. Cache ve Persist

  9. Spark Join Stratejileri

  10. Broadcast Hash Join

  11. Shuffle Sort Merge Join

  12. Bucketing Giriş

  13. Bucketing Veri Okuma

  14. Bucketing Veri Yazma

  15. Partitioning Giriş

  16. Partitioning Demo

  17. Shuffle Partitions

  18. Adaptive Query Execution

About this course

 • 67 ders
 • 6 saat video içeriği

Discover your potential, starting today