simple liniear regression di python

Simple Linear Regression di Python

Simple linear regression adalah metode statistik yang digunakan untuk memahami hubungan antara dua variabel, yaitu variabel dependen (y) dan variabel independen (x). Dalam tutorial ini, kita akan belajar cara melakukan simple linear regression dengan menggunakan Python dan beberapa pustaka populer seperti NumPy, matplotlib, dan scikit-learn. Kita juga akan menggunakan contoh sederhana untuk mengilustrasikan langkah-langkahnya.

Langkah 1: Memasukkan Data

Pertama, kita perlu memasukkan data yang akan digunakan untuk analisis regresi linear. Misalnya, kita akan menggunakan data berikut ini:

x = [1, 2, 3, 4, 5]
y = [2, 3, 3, 4, 5]

Data ini adalah contoh data yang mencerminkan hubungan sederhana antara x dan y.

Langkah 2: Mengimpor Pustaka

Selanjutnya, kita perlu mengimpor pustaka yang diperlukan. Pastikan Anda sudah menginstal NumPy, matplotlib, dan scikit-learn sebelum menjalankan kode ini. Jika belum, Anda dapat menginstalnya menggunakan pip.

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

Langkah 3: Menyusun Data

Data x dan y perlu disusun dalam bentuk array NumPy untuk digunakan dalam model regresi linear. Kode berikut ini melakukan hal itu:

x = np.array(x).reshape(-1, 1)
y = np.array(y)

Langkah 4: Membangun Model Regresi Linear

Selanjutnya, kita akan membangun model regresi linear menggunakan pustaka scikit-learn. Ini adalah langkah yang paling penting dalam analisis regresi linear.

model = LinearRegression()
model.fit(x, y)

Dengan model ini, kita dapat melakukan prediksi terhadap data baru dan mengevaluasi model.

Langkah 5: Visualisasi Hasil

Hasil dari analisis regresi linear dapat divisualisasikan. Berikut adalah contoh kode untuk menggambar garis regresi dan data asli:

plt.scatter(x, y, color='blue', label='Data Asli')
plt.plot(x, model.predict(x), color='red', label='Regresi Linear')
plt.xlabel('Variabel Independen (x)')
plt.ylabel('Variabel Dependen (y)')
plt.legend()
plt.show()

Langkah 6: Membuat Prediksi

Sekarang, kita dapat menggunakan model yang telah kita buat untuk membuat prediksi. Misalnya, jika kita ingin memprediksi nilai y untuk x = 6, kita dapat melakukannya sebagai berikut:

x_new = np.array([[6]])
y_pred = model.predict(x_new)
print("Prediksi untuk x = 6:", y_pred)

Langkah 7: Evaluasi Model

Selain membuat prediksi, kita juga dapat mengevaluasi model regresi linear. Salah satu metrik evaluasi yang umum digunakan adalah koefisien determinasi (R-squared). Anda dapat menghitungnya sebagai berikut:

r_squared = model.score(x, y)
print("Koefisien Determinasi (R-squared):", r_squared)

Nilai R-squared berkisar antara 0 dan 1, di mana nilai yang lebih tinggi menunjukkan model yang lebih baik.

Demikianlah tutorial singkat tentang bagaimana melakukan simple linear regression dengan Python. Regresi linear adalah alat yang kuat dalam analisis data untuk memahami hubungan antara variabel-variabel.

Anda dapat menggunakan konsep ini untuk menganalisis dan memodelkan berbagai masalah dunia nyata. Semoga tutorial ini bermanfaat bagi Anda dalam memahami dasar-dasar regresi linear dengan Python.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top