Course curriculum
-
-
Kurs Hakkında
-
Genel Bilgilendirme
-
Kurs Materyalleri
-
-
-
Sanal Makine İndirme
-
Sanal Makine Linki ve Kılavuzu
-
Sanal Makine İndirme Hata Çözüm
-
Sanal Makine Kurulumu
-
-
-
Apache Spark Giriş
-
Dataframe API Giriş
-
-
-
Spark Dataframe ve SparkSession Giriş
-
Dosya Kaynağından Veri Okuma
-
Elle Şema Tasarlama
-
Columns ve Expressions
-
Rows
-
Dataframe'i CSV Formatında Diske Yazma
-
Veri Filtreleme
-
Birden Fazla Sütun Üzerinde Filtreleme ve Dönüşümler
-
Kullanıcı Tanımlı Fonksiyonlar (UDF)
-
Kullanıcı Tanımlı Fonksiyonlar (UDF) Pandas
-
Sütun Ekleme, Düşürme ve Yeniden İsimlendirme
-
Tarih/Zaman Operasyonları-1: String -> Timestamp
-
Tarih/Zaman Operasyonları-2: Unix Timestamp
-
Tarih/Zaman Operasyonları-3: String -> Date
-
Tarih/Zaman Operasyonları-4: Yeni Özellik Çıkarma
-
Aggregations
-
Spark Execution Plan İnceleme
-
Spark YARN Mode
-
Higher Order Fonksiyonlar
-
-
-
Parquet Formatı
-
Avro Formatı
-
JSON ve CSV Formatları
-
ORC Formatı
-
Apache Hive
-
İlişkisel Veri Tabanı (PostgreSQL)
-
Quiz - Spark Giriş, PySpark Dataframe Operasyonları, Veri Kaynakları
-
-
-
Pycharm Projesi Yaratma
-
Spark-submit ve Python argparse
-
Spark Konfigürasyonlar
-
Spark Resouce Allocation ve Optimizasyon İpuçları
-
Multinode Cloudera Cluster Üzerinde Demo
-
Spark Dynamic Resource Allocation
-
Cloudera Cluster Üzerinde Spark Dynamic Allocation Demo
-
Cache ve Persist
-
Spark Join Stratejileri
-
Broadcast Hash Join
-
Shuffle Sort Merge Join
-
Bucketing Giriş
-
Bucketing Veri Okuma
-
Bucketing Veri Yazma
-
Partitioning Giriş
-
Partitioning Demo
-
Shuffle Partitions
-
Adaptive Query Execution
-
About this course
- 68 ders
- 6 saat video içeriği