Matematika untuk Data Science
Data science course terdiri dari ilmu matematika dan tidak dapat dihindari. Matematika adalah landasan dari setiap ilmu kontemporer. Hampir semua teknik data science modern memiliki dasar matematika yang mendalam. Pelajaran ini dirancang untuk mengajarkan ilmu dasar yang diperlukan, agar berhasil di hampir semua bidang data science matematika. Sekaligus, dibuat untuk siswa yang memiliki keterampilan matematika dasar, namun belum mengambil aljabar atau pre-kalkulus.
Fungsi, Variabel, Persamaan, dan Grafik.
Bidang matematika ini mencakup dasar-dasar, dari persamaan garis hingga teorema binomial dan semua yang ada di antaranya:
- Logaritma, eksponensial, fungsi polinomial, bilangan rasional.
- Geometri dasar dan teorema, identitas trigonometri.
- Bilangan real dan kompleks, sifat dasar.
- Deret, jumlah, pertidaksamaan.
- Graphing dan plotting, Cartesian dan koordinat kutub, bagian kerucut.
Statistic & Probability
Keduanya digunakan dalam machine learning dan data science untuk menganalisis dan memahami data, menemukan dan menyimpulkan insight berharga dan pola tersembunyi. Berikut materi yang dapat dipelajari:
- Data summaries dan descriptive statistics, central tendency, varian, kovarian, korelasi.
- Probabilitas dasar: ide dasar, ekspetasi, probabilitas kalkulus, teorema Bayes, probabilitas bersyarat.
- Probability distribution functions: uniform, normal, binomial, chi-square, Student’s t-distribution, central limit theorem.
- Sampling, measurement, error, random number generation.
- Hypothesis testing, A/B testing, confidence intervals, p-values.
- ANOVA, t-test.
- Regresi linear, regularization.
Calculus
Calculus digunakan dalam machine learning untuk merumuskan fungsi yang digunakan untuk melatih algoritma untuk mencapai tujuannya, yang dikenal dengan fungsi kerugian/biaya/tujuan. Berikut materi yang dapat dipelajari:
- Fungsi satu variabel, limit, kontinu, diferensial.
- Teorema nilai mean, indeterminate forms, aturan L’Hospital’s.
- Maksimal dan minimal.
- Produk dan aturan rantai.
- Deret Taylor, infinite series summation/integration concepts.
- Fundamental dan teorema nilai mean dari integral kalkulus, evaluation of definite and improper integrals.
- Fungsi Beta dan Gamma.
- Fungsi multivariabel, turunan parsial.
- Dasar dari persamaan diferensial biasa dan parsial.
Aljabar linear
Aljabar linear digunakan dalam machine learning untuk memahami bagaimana algoritma bekerja di bawah tenda. Hal ini mengenai operasi vektor/matriks/tensor. Berikut materi yang dapat dipelajari:
- Dasar dari matriks dan vektor: perkalian skalar, transformasi linear, transpose, konjugasi, rank, dan determinan.
- Produk luar dan dalam, aturan perkalian matriks dan algoritma, invers matriks.
- Matriks spesial: matriks kuadrat, matriks identitas, matriks triangular, sparse dan dense matriks, unit vektor, matriks simetrik, hermitian, matriks skew-Hermitian dan unitary.
- Konsep faktorisasi matriks, dekomposisi LU, eleminasi Gauss-Jordan, penyelesaian Ax=b dalam persamaan linear.
- Ruang vektor, basis, span, ortogonal, linear least square.
- Eigenvalues, eigenvectors, diagonalisasi, dekomposisi nilai singular.
Referensi:
https://medium.com/s/story/essential-math-for-data-science-why-and-how-e88271367fbd
https://towardsdatascience.com/mathematics-for-data-science-e53939ee8306
https://www.coursera.org/learn/datasciencemathskills