Unsupervised Learning – Mengenal lebih dalam apa itu pengertian unsupervised learning, algoritma yang termasuk kategori unsupervised learning, dan contoh penerapan aplikasinya dalam kehidupan sehari-hari sampai dengan industri.



Bicara tentang unsupervised-learning tidak lepas dari machine learning itu sendiri. Dengan menggunakan machine learning, sebuah sistem dapat membuat keputusan secara mandiri tanpa dukungan eksternal dalam bentuk apa pun. Keputusan ini dibuat ketika mesin dapat belajar dari data dan memahami pola dasar yang terkandung di dalam data. Kemudian, melalui pencocokan pola dan analisis lebih lanjut, machine learning mengembalikan hasil yang dapat berupa klasifikasi atau prediksi.

Klasifikasi Machine Learning

Machine learning merupakan sains (dan seni) memprogram komputer agar mereka dapat belajar dari data. Machine learning memungkinkan sistem membuat keputusan secara mandiri tanpa dukungan dari eksternal dalam bentuk apa pun.

Keputusan ini dibuat ketika mesin dapat belajar dari data dan memahami pola dasar yang terkandung di dalam data. Kemudian, melalui pencocokan pola dan analisis lebih lanjut, machine learning mengembalikan hasil yang dapat berupa klasifikasi atau prediksi.

Secara mendasar ada tiga jenis algoritma machine learning yang masing-masing penjelasannya dapat dilihat melalui link tautaun yang tersedia yaitu:

  1. Supervised Learning (Lihat penjelasan lengkap)
  2. Unsupervised Learning (Lihat penjelasan lengkap)
  3. Reinforcement Learning (Lihat penjelasan lengkap)

Pengertian Unsupervised Learning

Pada algoritma unsupervised-learning, data tidak secara eksplisit diberi label ke dalam kelas yang berbeda (tidak ada label pada data). Model mampu belajar dari data dengan menemukan pola implisit. Algoritma unsupervised learning mengidentifikasi data berdasarkan kepadatan, struktur, segmen serupa, dan fitur serupa lainnya.

Supervised learning diibarakan seperti belajar di sekolah. Anda menulis esai, mendapatkan nilai, dan seiring waktu Anda belajar cara menulis esai untuk mendapatkan nilai tinggi.

Pembelajaran unsupervised learning diibaratkan sebagai cara bayi menemukan dunia. Dia belajar tentang jenis objek di dunia, bagaimana bentuk dan perasaannya. Dia mempelajari jenis suara apa yang ada disekitarnya, mempelajari jenis suara yang dibuat orang, bagaimana mereka terhubung dengan kata-kata, bagaimana kata-kata terhubung ke dalam kalimat. Tidak ada nilai tertinggi di sini.

Oleh karena data yang diberikan kepada algoritma unsupervised learning berbeda dengan supervised-learning, maka data set [latex] (D) [/latex] didefinisikan sebagai:



Atau

Atau

Data semacam itu disebut data tidak berlabel (unlabeled data).

Jadi pada unsupervised learning tidak ada output variable atau target variable. Yang ada hanyalah input variable saja. Dengan kata lain, tidak ada target variable yang dapat “mengendalikan” jalannya algoritma.

Cara Kerja Unsupervised Learning

Unsupervised Learning
Cara Kerja Algoritma Unsupervised Learning

Algoritma unsupervised learning akan mencari pola tersembuyi (pola eksplisit) dari data set yang diberikan. Pembelajaran unsupervised-learning bekerja dengan menganalisis data tinak berlabel untuk menemukan struktur tersembunyi di dalamnya, dan dengan menentukan korelasi, dan untuk fitur yang benar-benar menghubungkan dua item data.

Struktur tersembunyi kadang-kadang disebut feature vector, mewakili data masukan sedemikian rupa sehingga jika feature vector yang sama digunakan untuk merekonstruksi masukan, maka itu dapat diterima. Variance dalam dua feature vector dari dua masukan berbanding lurus dengan variance dalam input itu sendiri. Dengan demikian struktur tersembunyi atau feature vector ini hanya merepresentasikan fitur dalam data yang benar-benar membedakannya.

Algoritma Unsupervised Learning

Algoritma supervised learning membuat komputer akan “dituntun” untuk belajar dari data. Sedangkan pada algoritma unsupervised-learning komputer “dibiarkan” belajar sendiri dari data. Algoritma yang dikategorikan ke dalam unsupervised-learning adalah:

Clustering

Pengelompokan atau clustering, juga dikenal sebagai Cluster Analysis yaitu teknik pengelompokan kumpulan objek serupa dalam grup yang sama yang berbeda dari objek di grup lain. Beberapa teknik clustering penting tersebut adalah K-menas, DBSCAN, dan Hierarchical Clustering:


K-means

Tujuan dari algoritma clustering k-means adalah untuk mempartisi n pengamatan dalam data menjadi k cluster sehingga setiap pengamatan termasuk dalam cluster dengan mean terdekat. Ini berfungsi sebagai prototipe cluster.

DBSCAN

Ini adalah metode clustering yang mengelompokkan data berdasarkan kepadatan. Ini mengelompokkan titik-titik yang diberikan dalam ruang dan menandai pencilan di wilayah dengan kepadatan rendah.

Hierarchical Clustering

Dalam bentuk pengelompokan ini, hierarki kluster dibangun.

Anomaly Detection

Teknik deteksi anomali (Anomaly Detection) mendeteksi pencilan dalam data tidak berlabel dengan asumsi bahwa sebagian besar contoh data adalah normal dengan mengamati contoh yang sesuai dengan kumpulan data lainnya.

Autoencoder

Autoencoder adalah jenis Neural Network yang digunakan dalam unsupervised learning untuk pembelajaran representasi. Mereka digunakan dalam denoising dan reduksi dimensi.

Deep Belief Network

Ini adalah model grafis generatif yang juga merupakan kelas jaringan saraf yang dirancang untuk unsupervised learning. Ini berbeda dari jenis jaringan neural yang diawasi dalam arti bahwa ia secara probabilistik merekonstruksi inputnya untuk bertindak sebagai pendeteksi fitur.

Principal Component Analysis (PCA)

Ini adalah kelas paradigma unsupervised learning yang digunakan untuk mengurangi dimensi data.

Contoh Penerapan Unsupervised Learning

Salah satu implementasi unsupervised-learning yang paling populer adalah clustering. Dengan menggunakan teknologi clustering, perusahaan bisnis dapat menangkap segmen pelanggan potensial untuk menjual produk mereka.

Perusahaan penjualan dapat mengidentifikasi segmen pelanggan yang paling mungkin menggunakan layanan atau membeli produk mereka. Perusahaan dapat mengevaluasi segmen pelanggan dan kemudian memutuskan untuk menjual produk mereka untuk memaksimalkan keuntungan.

Salah satu perusahaan yang melakukan analitik pemasaran merek menggunakan Machine Learning adalah startup yang berbasis di Israel – Optimove. Tujuan dari perusahaan ini adalah untuk mencerna dan memproses data pelanggan agar dapat diakses oleh pemasar. Mereka mengambil satu langkah lebih jauh dengan memberikan wawasan cerdas kepada tim pemasaran, memungkinkan mereka untuk meraup keuntungan maksimum dari pemasaran produk mereka.