"End-to-End Data Science via A Hands-on Case Study"- Sertifika Programı

Ücretli Etkinlik

Sektörünüz ne olursa olsun biliyoruz ki veri madenciliği problemleri,  işlenmemiş veri  adı verilen kirli ve düzensiz veri ile başlar ve ürün tarafında çalışan bir model ile biter. Bu problemlere bir son verelim dedik ve geleceğin en önemli ve popüler mesleği olarak görülen “Data Science” konusunda sizler için uygulamalı, süper bir eğitim hazırladık! J

Bu eğitimde 6 hafta boyunca gerçek bir iş probleminden yola çıkıyoruz, gerçek verileri kullanarak veriden en yararlı öngörüleri çıkartmanın ve bir data science projesnin aşamalarını gerçek zamanlı olarak görüyoruz.

Sınırlı kontenjana sahip bu eğitimde yerinizi ayırtmak için acele edin!

Etkinlik İçeriği


Eğitim İçeriği:

1.Hafta

Understand your business problem

  • Frame the problem - Who is your targeted customer segment?, What’s the purpose of this product?
  • Collect the raw data needed for your problem - Is the current data sufficient for the problem?, Do you need to acquire external datasets?

 

2.Hafta

Explore the data

  • Variable Identification - Identify Predictor (Input) and Target (Output) variables
  • Univariate Analysis - Distribution of continuous and categorical predictors (Excel and R Plots)
  • Bi-variate Analysis - Correlations between continuous & continuos (Pearson Correlation etc.), categorical & categorical (Chi-Square etc.) and categorical & continuous variables (Z-test, T-test, Anova etc.)  

 

 

3.Hafta

Pre-process your data for modelling

  • Missing Value Treatment - Imputation Techniques
  • Outlier Detection & Treatment - Quartile Analysis, Data Visualisation (Tableau)
  • Feature Engineering - Variable Transformation, Ways to Create New Features (Variables)

 

4.Hafta

Formulate your hypothesis and choose your machine learning model

  • Types of Model Hypothesis - Supervised Learning (Classification&Regression), Unsupervised Learning, Semi-Supervised Learning
  • Technical Details of Tree-based Machine Learning Algorithms - Random Forest & Gradient Boosting Machine (GBM) 
  • Understanding the effect of hyper-parameters in a Machine Learning Model - Spark MLLib and R Packages

 

5.Hafta

Validate and optimize your model iteratively

  • Cross-Validation Techniques - Training, Validation and Test Data Sets
  • Model Evaluation Metrics - Which metric is the best-fit for our case? What is ROC curve?, AUC, F-Score, Precision, Recall
  • Optimize Your Model - Find the best parameter set, Tuning Model Parameters via Grid Search 

 

6.Hafta

Deploy your model in production - "Let the magic happens”

  • Determine types of jobs running in the production - Model Update Job, Daily Scoring Job etc.
  • Use of Workflow and Job Scheduling Tools (Azkaban)



Not: Eğitim boyunca geliştirme ortamı olarak R kullanılacaktır.

 

Eğitmenler:

Özgür Özlük  - Professor, Director of the Big Data Analytics Masters Program / MEF University

Burak Özen - Lead Data Scientist  / sahibinden.com

 

 

Kimler için :

Kariyer yolunda Data Science, Machine Learning ve Data Mining alanları ile ilgilenmeyi düşünen herkes.

 

Nerede / Ne zaman ?

İstanbul Bilgi Üniversitesi santralistanbul Kampüsü

28 Ekim- 2 Aralık 2017

Cumartesi günleri 10:00 - 17:00 saatleri arasında

Süre: 36 Saat

Ücret: 4.500 TL (KDV Dahil)

Erken Kayıt: 4.200 TL (KDV Dahil)

*Erken kayıt ücreti  2 Ekim 2017 tarihine kadar yapılan ödemelerde geçerlidir.

*Kredi kartı ile yapılan ödemelerde 5 taksit imkanı bulunmaktadır.

Ayrıntılı Bilgi

Selen Sünear

0 (216) 418 02 29

egitim@crenvoik.com

Kayıt

bilgi-egitim@bilgi.edu.tr

0 (212) 311 7171