Mengenal Regresi: Simple Linear Regression & Multiple Linear Regression
1. Apa itu Regresi
Regresi adalah teknik dalam supervised learning yang digunakan untuk memprediksi nilai kontinu (numerik) berdasarkan satu atau lebih variabel input. Berbeda dengan klasifikasi yang memprediksi kategori/kelas, regresi memprediksi angka.
bagaimana perbedaan dari klasifikasi dengan regresi dapat kita visualisasikan sebagai berikut:
2. Linear Regression
2.1. Apa itu Linear Regression?
Linear Regression adalah metode regresi paling sederhana yang memodelkan hubungan linier antara variabel independen (X) dan variabel dependen (Y).
2.2. Persamaan Regresi Linier Sederhana
Di mana:
= nilai prediksi (variabel dependen)
= variabel independen (fitur/input)
= intercept (titik potong sumbu Y)
= slope/koefisien (kemiringan garis)
2.3. Bagaimana Mencari dan ?
Menggunakan metode Ordinary Least Squares (OLS), yaitu meminimalkan jumlah kuadrat error:
Formulanya:
Di mana dan adalah rata-rata dari X dan Y.
2.4. Regresi Linier Berganda (Multiple Linear Regression)
Ketika ada lebih dari satu variabel independen:
Contoh: Harga rumah = + (Luas) + (Jumlah Kamar) + (Jarak ke pusat kota)
dari konsep diatas dapat divisualisasikan sebagai berikut:
3. Hubungan Variabel Independen dan Dependen
3.1. Variabel Dependen (Y)
Disebut juga: variabel respon, variabel target, atau variabel output
Nilainya bergantung pada variabel lain
Merupakan apa yang ingin kita prediksi
Contoh: harga rumah, suhu, nilai ujian
3.2. Variabel Independen (X)
Disebut juga: variabel prediktor, variabel fitur, atau variabel input
Nilainya tidak bergantung pada variabel lain dalam model
Merupakan faktor yang mempengaruhi variabel dependen
Contoh: luas rumah, cuaca, waktu belajar
3.3. Jenis Hubungan
Jenis Hubungan | Deskripsi | |
|---|---|---|
Positif | X naik → Y naik | |
Negatif | X naik → Y turun | |
Tidak ada | X berubah → Y tidak berpengaruh |
berikut visualisasi dari jenis hubungan nya:
4. Evaluasi Model Regresi
4.1. Metrik Evaluasi Utama
Metrik | Formula | Keterangan |
|---|---|---|
MSE (Mean Squared Error) | Rata-rata kuadrat error, penalti besar untuk error besar | |
MAE (Mean Absolute Error) | Rata-rata nilai absolut error | |
RMSE (Root Mean Squared Error) | Akar dari MSE, satuan sama dengan Y | |
R² (Koefisien Determinasi) | Proporsi variansi Y yang dijelaskan oleh model |
4.2. Interpretasi R²
Nilai R² | Interpretasi |
|---|---|
R² = 1.0 | Model sempurna (semua titik tepat di garis) |
R² ≥ 0.9 | Model sangat baik |
R² ≥ 0.7 | Model baik |
R² ≥ 0.5 | Model cukup |
R² < 0.5 | Model kurang baik |
R² = 0.0 | Model tidak lebih baik dari rata-rata |
R² < 0.0 | Model sangat buruk (lebih buruk dari rata-rata) |
5. Kelebihan dan Keterbatasan Regresi Linier
5.1. Kelebihan
No | Kelebihan | Penjelasan |
|---|---|---|
1 | Sederhana & mudah dipahami | Persamaan linier mudah diinterpretasikan |
2 | Cepat dilatih | Tidak membutuhkan komputasi yang berat |
3 | Tidak perlu tuning parameter | Tidak ada hyperparameter yang kompleks |
4 | Interpretable | Setiap koefisien punya makna yang jelas |
5 | Baseline yang baik | Sering digunakan sebagai model pembanding |
5.2. Keterbatasan
No | Keterbatasan | Penjelasan |
|---|---|---|
1 | Asumsi linearitas | Hanya memodelkan hubungan linier |
2 | Sensitif terhadap outlier | Data yang jauh dari pola bisa merusak model |
3 | Multikolinearitas | Variabel independen yang saling berkorelasi bisa memberikan hasil yang tidak stabil |
4 | Underfitting | Terlalu sederhana untuk data yang kompleks |
5 | Tidak cocok untuk hubungan non-linier | Perlu metode lain (Polynomial, dll.) |