Introduction to Data Preparation for Self-Service Analytics Eğitimi

  • Eğitim Tipi: Classroom / Virtual Classroom / Online
  • Süre: 1 Gün
  • PDF indir
  • Bu eğitimi kendi kurumunuzda planlayabilirsiniz. Bize Ulaşın!

Veri hazırlamanın bir zamanlar basit olan dünyası - operasyonel veri entegrasyonu için ETL - gittikçe daha karmaşık bir hal almaktadır. Veri karmaşası ve veri harmanlama gibi terimlerse bu zorunlukların bazılarını belirtmektedir. Analitiğin heyecan verici yanları da veriler anlamlı analizler için hazır olana dek işe yaramamaktadır. Büyük verilerin kapsamı, veri kullanımı çeşitliliği ve iş ile dost veri görselleştirme ve analiz araçlarının ortaya çıkışının tümü karmaşıklığa katkıda bulunmaktadır.

Yakın zaman önce ortaya çıkan teknolojilerse veri entegrasyonu ve hazırlamasına yönelik iş ile dost araçlar ile bu zorlukların üstesinden gelmeye yardımcı olmaktadır. Analitik projelerinizde verileri bulmak ve düzeltmek için harcadığınız zaman verileri analiz etmekten daha fazla ise o zaman gerçekten bir değişiklik yapmanız gerekmektedir. Hem iş hem de teknik konulardaki kişilere ve ekiplere analitik için verileri temizleme, birleştirme, biçimlendirme ve örnekleme konularında yardımcı olabilecek araç ve teknikleri öğrenin.

Herhangi bir önkoşul yoktur.

Bu eğitime veri hazırlama faaliyetlerini hızlandırması ve basitleştirmesi gereken iş yöneticileri, iş analistleri, veri analistleri ve veri bilim adamları, karmaşık veri hazırlama işlemlerinin günlük zorluklarıyla karşı karşıya kalan iş zekası ve analitik geliştiriciler, veri hazırlama teknolojilerini iş zekası ve analitik setlerine entegre etmesi gereken teknik yöneticiler ve mimarlar, etkin analiz için doğru verileri doğru şekillerde almaya çalışan herkes katılabilir.

  • Bu eğitimde;
  • Büyük veri çağında veri hazırlamanın sık karşılaşılan güçlükleri
  • Analitiğin hem hızını hem de kalitesini iyileştiren veri hazırlama teknikleri
  • Veri hazırlama teknolojilerinin veri yönetimi ve yönetişim avantajları
  • Modern veri hazırlama ile ilgili araçlar ve teknolojiler
  • Analitik ihtiyaçlarınıza en uygun verilerin belirlenmesi
  • Verilerin ve verilerde var olan güçlüklerin anlaşılması
  • Veri temizleme, biçimlendirme ve harmanlama ihtiyaçlarının tanımlanması ve belirlenmesi
  • Tekrarlayan ve uyarlanabilir veri oluşturma prensiplerinin anlaşılması ve uygulanması

Module 1 – Data Preparation Basics

  • Data Preparation Defined
  • Historical Perspective – How Did We Get Here?
  • The Need for Self-Service Data Preparation
  • Historical Perspective
  • Introduction to Data Preparation Tools
    • Types of tools
    • Programming/scripting vs. visual interface
    • Standalone vs. integrated into analytics platforms
    • Cloud, on-premises, and hybrid deployment
    • Machine learning and data preparation
  • Users of Data Preparation Tools
    • Data scientists
    • Data engineers
    • Business analysts
    • Data analysts
    • oInformation workers
  • Data Preparation in Analytics Architecture
  • Data Preparation and Analytics Life Cycle
    • Continuous exploration and discovery
    • Iterative and adaptive

Module 2 – Data Discovery

  • Data Sources
    • Enterprise databases
    • Local data
    • Desktop data
    • Cloud data
    • Web data
    • Files
    • NoSQL
    • Geospatial
    • Media
  • Data Sourcing
    • Choosing data sources
    • Physical data source connections
    • Virtual data source connections
  • Data Exploration
    • Understanding content
    • Estimating quality
    • Discovering patterns
    • Discovering data types
    • Discovering data structure
    • Discovering data relationships
    • Data enrichment opportunities
    • Developing data profiles
    • Capturing metadata

Exercise 1 – Data Exploration and Data Sourcing

Module 3 – Data Transformation

  • The Scope of Data Preparation
  • Improving Data
    • Standardization and conforming
    • Cleansing and quality
    • De-duplication
  • Enriching Data
    • Derivation
    • Appending
    • Aggregation
  • Formatting Data
    • Aggregation
    • Sorting and sequencing
    • Pivoting / de-pivoting
    • Sampling and filtering
    • Masking sensitive data
    • Constructing records
  • Data Blending
    • Blending defined
    • Blend vs. join
    • Blending vs. Warehousing

Exercise 2 – Data Transformation and Data Blending

Module 4 – Data Governance

  • Data Validation
    • Visual validation
    • Rules-based validation
    • Data auditing
  • Data Protection
    • Activity logging
    • Activity audits
  • Data Management
    • Metadata management
    • Data lineage
    • Model on use – “just in time” data models
    • Data curation – what and why

Module 5 – The Technology Landscape

  • Data Preparation Platforms
    • Core functions and features
  • Product Overviews and Selected Demonstrations


Eğitimlerle ilgili bilgi almak ve diğer tüm sorularınız için bize ulaşın!