Detail Pelatihan
Saat ini kita telah memasuki era big data dimana data bertumbuh dengan sangat cepat, banyak dan dengan bentuk yang bervariasi. Ketika masalah penyimpanan telah diselesaikan dengan teknologi penyimpanan terdistribusi seperti hadoop maka masalah kembali timbul saat data tersebut ingin digunakan. Proses cleansing, join, seleksi data untuk menemukan data yang tepat untuk digunakan dalam analisis menjadi masalah baru karena harus menangani data dengan variasi yang sangat banyak, sampai akhirnya muncul teknologi-teknologi baru dalam data science yang salah satunya berbasis bahasa pemrograman python.
Tujuan Pelatihan Data Science with Python
- Setelah mengikuti pelatihan ini, peserta akan mampu:
- Memahami dan menggunakan Interactive Python
- Memahami dan menggunakan komponen Numerical Python
- Memahami dan menggunakan komponen Pandas
- Memahami dan menggunakan komponen visualisasi data Matplotlib
- Memahami dan menggunakan Machine Learning untuk mengolah data
Outline Pelatihan Data Science with Python
1. Interactive Python
- Perintah-perintah shell IPython
- Error dan debugging
- Profilling dan timing
2. Numerical Python
- Tipe data di python
- Array NumPy
- Komputasi Array
- Agregasi
- Perbandingan, Masking dan logika Boolean
- Indexing
- Sorting
- Data Terstruktur
3. Pandas
- Object Pandas
- Index dan Seleksi
- Operasi data dengan Pandas
- Penanganan data yang tidak lengkap
- Index Hirarkis
- Kombinasi Dataset
- Agregasi dan Pengelompokan
- Tabel Pivot
- Operasi Vektor pada Text
- Pengolahan data waktu
4. Visualisasi dengan Matplotlib
- Grafik sedehana
- Grafik sebaran
- Visualisasi error
- Grafik kepadatan dan kontur
- Histogam
- Modifikasi Legenda Grafik
- Modifikasi Pewarnaan Grafik
- Sub Grafik
- Text pada Grafik
- Grafik Tiga Dimensi
- Visualisasi Data Geografis dengan Peta Dasar
5. Machine Learning
- Pengenalan Machine Learning
- Komponen Scikit Learn
- Hyperparameters dan Validasi Model
- Naive Bayes Classification
- Linear Regression
- Support Vector Machine
- Decision Tree dan Random Forests
- Principal Component Analysis
- Manifold Learning
- K-Means Clustering
- Gausian Mixture Models
- Kernel Density Estimation
Fasilitas
Lokasi Pelatihan