Supervised Learning – Mengenal lebih dalam apa itu pengertian supervised learning, algoritma yang termasuk kategori supervised learning, dan contoh penerapan aplikasinya dalam kehidupan sehari-hari sampai dengan industri.
Bicara tentang supervised-learning tidak lepas dari machine learning itu sendiri. Dengan menggunakan machine learning, sebuah sistem dapat membuat keputusan secara mandiri tanpa dukungan eksternal dalam bentuk apa pun. Keputusan ini dibuat ketika mesin dapat belajar dari data dan memahami pola dasar yang terkandung di dalam data. Kemudian, melalui pencocokan pola dan analisis lebih lanjut, machine learning mengembalikan hasil yang dapat berupa klasifikasi atau prediksi.
Klasifikasi Machine Learning
Machine learning merupakan sains (dan seni) memprogram komputer agar mereka dapat belajar dari data. Machine learning memungkinkan sistem membuat keputusan secara mandiri tanpa dukungan dari eksternal dalam bentuk apa pun.
Keputusan ini dibuat ketika mesin dapat belajar dari data dan memahami pola dasar yang terkandung di dalam data. Kemudian, melalui pencocokan pola dan analisis lebih lanjut, machine learning mengembalikan hasil yang dapat berupa klasifikasi atau prediksi.
Secara mendasar ada tiga jenis algoritma machine learning yang masing-masing penjelasannya dapat dilihat melalui link tautaun yang tersedia yaitu [1]:
- Supervised Learning (Lihat penjelasan lengkap)
- Unsupervised Learning (Lihat penjelasan lengkap)
- Reinforcement Learning (Lihat penjelasan lengkap)
Supervised Learning
Supervised-learning merupakan jenis yang populer untuk melakukan operasi machine learning dan banyak digunakan untuk data di mana ada pemetaan yang tepat antara data input-output. Kumpulan data, dalam hal ini, diberi label, artinya algoritma mengidentifikasi fitur secara eksplisit dan melakukan prediksi atau klasifikasi yang sesuai.
Kata “supervised” menunjukkan bahwa “kontrol” terhadap algoritma sangat berpengaruh pada pembentukan model. Kontrol algoritma dilakukan dengan cara memberikan data set [latex] (D) [/latex] yang didefinisikan sebagai:
[latex]
D = \lbrace ( x_{0}, y_{0}) , ( x_{1}, y_{1}) , … ( x_{n}, y_{n}) \rbrace
[/latex]
Atau
[latex] \lbrace ( x^{( 1 )}, y^{( 1 )}) , ( x^{( 2 )}, y^{( 2 )}) , ( x^{( 3 )}, y^{( 3 )}) , … , ( x^{( m )}, y^{( m )}) \rbrace [/latex]
Atau
[latex] \lbrace x_{i} , y_{i} \rbrace binom {n}{i} = 1 [/latex]
Dimana [latex] x [/latex] adalah input dan [latex] y [/latex] adalah output. Setiap [latex] x [/latex] akan mengendalikan [latex] y [/latex]. Data semacam ini disebut dengan data berlabel (labeled data). Input dan output ini disebut juga input variabel dan output variabel. Relasi keduanya dapat dirumuskan menjadi:
[latex] y^{( i)} = f( x^{( i )} ) [/latex]
Data set yang tersedia dapat bersifat kuantitatif (quantitative) maupun kualitatif (qualitative). Berikut ini beberapa contoh data kuantitatif dan kualitatif:
Algoritma Supervised Learning
Seiring dengan berjalannya periode pelatihan, algoritma dapat mengidentifikasi hubungan antara dua variabel sehingga supervised learning dapat memprediksi hasil yang baru. Algoritma supervised learning digunakan untuk menyelesaikan berbagai persoalan yang terkait dengan:
- Classification (klasifikasi)
- Regression (regresi)
- Ensemble (gabungan)
Algoritma supervised learning berorientasi pada tugas. Dengan semakin banyaknya sampel data set yang berikan, ia dapat belajar dengan lebih baik sehingga dapat melaksanakan komputasi dan menghasilkan output yang lebih akurat. Beberapa algoritma yang termasuk kategori supervised learning adalah:
Linear Regression
Dalam linear regression (regresi linier), yang diukur adalah hubungan linier antara dua atau lebih dari dua variabel. Berdasarkan hubungan tersebut, supervised learning melakukan prediksi yang mengikuti pola linier ini.
Random Forest
Random Forest adalah metode ensemble learning untuk melakukan klasifikasi, regresi serta tugas-tugas lainnya melalui pembangunan pohon keputusan (decision tree) dan menyediakan output sebagai kelas yang merupakan mode atau mean dari pohon individu yang mendasarinya.
Gradient Boosting
Gradient Boosting adalah metode ensemble learning yang merupakan kumpulan dari beberapa pohon keputusan lemah yang menghasilkan pengklasifikasi yang kuat.
Support Vector Machine (SVM)
SVM adalah algoritma lasifikasi yang kuat yang digunakan untuk mengklasifikasikan dataset biner menjadi dua kelas dengan bantuan hyperplane.
Logistic Regression
Logistic Regression menggunakan kurva S berbentuk lonceng yang dihasilkan dengan bantuan fungsi logit untuk mengkategorikan data ke dalam kelas masing-masing.
Artificial Neural Network
Jaringan Syaraf Tiruan dimodelkan setelah otak manusia belajar dari data dari waktu ke waktu. Mereka membentuk porsi yang jauh lebih besar dari machine learning yang disebut dengan deep learning.
Contoh Penerapan Supervised Learning
Banyak penerapan supervised learning salah satu yang paling populer adalah aplikasi pengenalan wajah dan lebih khusus lagi – Jaringan Syaraf Tiruan (JST). Convolutional Neural Networks (CNN) adalah jenis JST yang digunakan untuk mengidentifikasi wajah orang. Model ini mampu menggambar fitur dari gambar melalui berbagai filter. Akhirnya, jika ada nilai kesamaan yang tinggi antara gambar masukan dan gambar di dalam database, kecocokan positif diberikan sebagi output.
Baidu, perusahaan mesin telusur terkemuka di China telah berinvestasi dalam pengenalan wajah. Meskipun telah memasang sistem pengenalan wajah di sistem keamanannya, kini teknologi ini diperluas ke bandara-bandara utama China. Baidu akan menyediakan bandara dengan teknologi pengenalan wajah yang akan memberikan akses ke awak darat dan staf. Oleh karena itu, penumpang tidak perlu mengantre panjang untuk check-in penerbangan karena cukup naik ke pesawat dengan memindai wajah mereka.
Daftar Pustaka
- Theobald, Oliver, 2017. Machine Learning for Absolute Beginners.