VERİ BİLİMİ UZMANLIĞI SERTİFİKA PROGRAMI
Program Amacı:
Python ekosisteminde derinlemesine teknik yetkinlik kazandıran, bilimsel hesaplamadan derin öğrenmeye, NLP'den Agentic AI'a uzanan ileri düzey bir program. Katılımcılar uçtan uca veri bilimi projelerini bağımsız olarak yürütebilecek donanıma kavuşur; LangGraph ile multi-agent sistemler geliştirerek Streamlit üzerinde interaktif uygulamalar deploy etmeyi öğrenir.
14 Modül
90 Saat
2026
Başlangıç: 21 Şubat 2026 |
Format: Hafta Sonu (Online) |
Süre: 90 Saat |
Saat: 10:00 - 13:00
Program Özeti
| No |
Modül |
Saat |
| 1 |
Veri Biliminin Temelleri |
6 |
| 2 |
Bilimsel Hesaplama ve Veri Yapıları |
6 |
| 3 |
Veri Analizi ve Keşifçi Veri Analizi |
6 |
| 4 |
Veri Dönüşümü ve Entegrasyonu |
6 |
| 5 |
Büyük Veri Teknolojileri ve Uygulamaları |
6 |
| 6 |
Veritabanı Yönetimi ve Büyük Veri |
6 |
| 7 |
Veri Görselleştirme ve Uygulama Geliştirme |
6 |
| 8 |
Makine Öğrenmesi I |
6 |
| 9 |
Makine Öğrenmesi II |
6 |
| 10 |
Derin Öğrenme |
6 |
| 11 |
Pekiştirmeli Öğrenme |
6 |
| 12 |
NLP ve Zaman Serisi Analizi |
6 |
| 13 |
Agentic AI ve LLM Uygulamaları |
6 |
| 14 |
Proje Uygulama Workshopu |
12 |
| TOPLAM |
90 |
Modül Detayları
1. Data Science Temelleri (6 saat)
- Veri Bilimi Nedir: Veri kavramı, verinin yapısal hale gelmesi ve büyük veri süreci
- Veri Mimarisi: Veri ambarı, veri havuzu (gölü) ve lakehouse yaklaşımları
- Bulut ve Altyapı: Bulut bilişim sistemleri, saklama yöntemleri ve ETL paket tasarımları
- Modern Veri Platformları: Databricks, Snowflake, vector database kavramı
- AI Platformları: Dataiku, Vertex AI, Microsoft Fabric, AWS SageMaker tanıtımı
- Veri Görselleştirme: Raporlama sistemleri, self servis yapılar ve cognitive servisler
- Yönetişim: Model yaşam döngüsü, MLOps ve LLMOps kavramlarına giriş
2. Bilimsel Hesaplama ve Veri Yapıları (6 saat)
- Dizi Yapıları: Çok boyutlu dizi oluşturma, veri tipleri ve indeksleme (Numpy)
- Hesaplamalar: Matematiksel, istatistiksel ve vektörel işlemler
- Mantıksal İşlemler: Kıyaslama, maskeleme ve Boole mantık
- Lineer Cebir: Matris operasyonları ve uygulamaları
- Performans: Vektörizasyon ve hesaplama optimizasyonu
- Pratik: Gerçek dünya problemleri üzerinde bilimsel hesaplama uygulamaları
3. Veri Analizi ve Keşifçi Veri Analizi (6 saat)
- Veri Yapıları: Seri ve DataFrame kavramları, veri okuma/yazma (Pandas)
- Veri Erişimi: İndeksleme, seçme, filtreleme ve fonksiyon uygulama
- Betimleyici İstatistik: Temel istatistiksel özetler ve eksik veri yönetimi
- Keşifçi Analiz: Veri dağılımları, korelasyonlar ve örüntü tespiti
- Case Study: Gerçek veri setleri üzerinde EDA uygulamaları
4. Veri Dönüşümü ve Entegrasyonu (6 saat)
- Veri Birleştirme: Merge, join ve concatenation teknikleri (Pandas)
- Gruplandırma ve Özetleme: Aggregation, GroupBy ve pivot tablolar
- Zaman Serileri: Zaman serisi veri yapıları, saat dilimi yönetimi ve resampling
- Veri Yeniden Şekillendirme: Pivot, melt, stack/unstack ve hiyerarşik indeksleme
- Veri Kalitesi: Veri temizleme, dönüştürme ve zenginleştirme süreçleri
- Case Study: Gerçek veri setleri üzerinde veri entegrasyonu uygulamaları
5. Büyük Veri Teknolojileri ve Uygulamaları (6 saat)
- Büyük Veri Ekosistemi: Büyük veri kavramı, platformların gelişim süreci ve çözüm yaklaşımları
- Klasik Altyapı: Hadoop HDFS ve MapReduce; Apache Spark ve AWS platformları
- Bulut ve Servis Modelleri: Servis-olarak-Hadoop ve servis-olarak-Bulut çözümleri
- Modern Veri Platformları: Databricks, Snowflake ve lakehouse uygulamaları
- Gerçek Zamanlı İşleme: Streaming mimarisi ve Kafka kavramı
- Uygulamalar: Güncel büyük veri uygulamalarının gösterilmesi ve tartışılması
6. Veritabanı Yönetimi ve Büyük Veri (6 saat)
- İlişkisel Veritabanları: RDBMS temelleri, SQL kodlama ve örnek uygulamalar
- NoSQL Dünyası: Key-Value, Wide Column, Document ve Graph veritabanları
- AI Altyapısı: Vector database kavramı (embedding ve RAG altyapısı)
- Modern Mimari: Lakehouse yaklaşımı — data warehouse ve data lake birleşimi
- Pratik: Popüler NoSQL veritabanları üzerinde kodlama örnekleri
7. Veri Görselleştirme ve Uygulama Geliştirme (6 saat)
- Temel Görselleştirme: Grafik temelleri — çizgi, saçılım, histogram, sütun (Matplotlib)
- İnteraktif Görselleştirme: Interaktif figür oluşturma (Plotly)
- Dashboard: Veri dashboard'u geliştirme (Streamlit)
- Uygulama Tasarımı: Uygulama bileşenleri (input, slider, selectbox, file upload) ve layout yönetimi
- Deployment: Uygulamanın deploy edilmesi
- Pratik: Gerçek veri seti üzerinde interaktif dashboard geliştirme
8. Makine Öğrenmesi I (6 saat)
- Temel Kavramlar: Makine öğrenmesi yaklaşımı ve model türleri
- Veri Hazırlık: Ölçekleme, encoding, eksik veri yönetimi ve veri dönüştürme
- Denetimli Öğrenme: Doğrusal regresyon, lojistik regresyon, KNN, Naive Bayes, SVM ve karar ağaçları (Scikit-learn)
- Denetimsiz Öğrenme: K-Means, DBSCAN kümeleme; PCA ile boyut indirgeme
- Pipeline: ML pipeline yapısı ve veri ön işleme entegrasyonu
- Pratik: Gerçek veri seti üzerinde uçtan uca sınıflandırma uygulaması
9. Makine Öğrenmesi II (6 saat)
- Değişken Mühendisliği: Feature importance, değişken seçme yöntemleri (correlation, ANOVA, Chi-Square, forward/backward selection)
- Model Değerlendirme: Cross-validation, confusion matrix, ROC-AUC ve metrik seçimi
- Hiperparametre Optimizasyonu: Grid search, random search ve overfitting yönetimi
- Ensemble Yöntemler: Random Forest, Gradient Boosting ve XGBoost
- MLOps Temelleri: Model versiyonlama (MLflow), API ile model servis etme (FastAPI), model monitoring kavramı
- Pratik: Model seçimi, değerlendirme ve deployment uygulaması
10. Derin Öğrenme (6 saat)
- Yapay Sinir Ağları: Temel ANN mimarisi, aktivasyon fonksiyonları ve backpropagation
- CNN: Konvolüsyonel sinir ağları ve görüntü işleme uygulamaları
- RNN: Tekrarlayan sinir ağları ve sekans modelleme
- Transformer: Transformer mimarisi ve attention mekanizması
- Modern AI Kavramları: Transfer learning, fine-tuning ve foundation modeller
- Pratik: Keras/PyTorch ile derin öğrenme uygulaması
11. Pekiştirmeli Öğrenme (6 saat)
- Temel Kavramlar: Durum, aksiyon, ödül ve politika kavramları
- Teorik Altyapı: Markov karar süreçleri, değer fonksiyonları ve Bellman denklemleri
- Klasik Algoritmalar: Epsilon-Greedy ve Q-Learning algoritmaları
- Derin Pekiştirmeli Öğrenme: DQN teknikleri
- Pratik: Simülasyon ortamında pekiştirmeli öğrenme uygulaması
12. NLP ve Zaman Serisi Analizi (6 saat)
- Metin Ön İşleme: Tokenization, stemming, lemmatization ve stop word yönetimi
- Metin Temsili: TF-IDF, word embeddings (Word2Vec, GloVe) ve sentence embeddings
- NLP Uygulamaları: Sentiment analizi ve metin sınıflandırma
- Zaman Serisi Tahmin: ARIMA modelleri ve Prophet ile forecasting
- DL ile Tahmin: LSTM ve Transformer tabanlı zaman serisi tahmini
- Pratik: Gerçek veri setleri üzerinde NLP ve zaman serisi uygulamaları
13. Agentic AI ve LLM Uygulamaları (6 saat)
- LLM Kavramları: Büyük dil modellerinin çalışma prensipleri ve prompt engineering stratejileri
- RAG Mimarisi: Retrieval-Augmented Generation, embedding modelleri ve vector database kullanımı
- Ajan Tasarımı: Agentic AI iş akışları tasarımı — state management, döngüsel akışlar, tool calling (LangGraph)
- Multi-Agent Sistemler: Çoklu ajan mimarisi tasarım prensipleri ve orkestrasyon
- Pratik: Temel ajan prototipi geliştirme
14. Proje Uygulama Workshopu (12 saat)
Programın tüm modüllerinin birleştiği capstone modüdüdür.
- Problem Tanımlama: Veri seti üzerinde iş probleminin belirlenmesi
- Veri Hazırlık: Veri ayıklama, kalite kontrolü, aykırı değer ve normallik testleri
- Modelleme: Uygun algoritma seçimi, model eğitimi ve değerlendirmesi
- LLM API Entegrasyonu: OpenAI/Claude API bağlantısı ve proje kapsamında LLM kullanımı
- Agentic AI Entegrasyonu: LangGraph ile modelleme sürecini destekleyen multi-agent sistemi geliştirme
- Prototipleme: Streamlit ile projenin arayüz geliştirmesi ve deploy edilmesi
- Sunum: Proje sonuçlarının sunulması ve tartışılması
Eğitmenler:
Prof. Dr. Alp Üstündağ
Prof. Dr. Başar Öztayşi
Doç. Dr. Ömer Faruk Beyca
Doç. Dr. Sefer Baday
Dr. Öğretim Üyesi Mehmet Yasin Ulukuş
Dr. Öğretim Üyesi Mehmet Ali Ergün
Dr. Öğretim Üyesi Süha Tuna
Program Peşin Ücreti: 52.000 TL + KDV
Programla ilgili detaylar, Kayıt ve daha fazla bilgi için:
İTÜ Sürekli Eğitim Merkezi (SEM)
itusem@itu.edu.tr
(0212) 2510809