Jenis-Jenis Machine Learning – Ada 4 macam ML (machine learning) atau pembelajaran mesin yaitu supervised learning, unsupervised learning, semi-supervised learning, dan reinforcement learning. Ini didasarkan pada pembagian data dilatih oleh manusia atau tidak.



Ada berbagai jenis learning problem di dalam machine learning. Supervised learning berkaitan dengan prediksi label kelas dari atribut, unsupervised learning mencoba menemukan struktur yang menarik dalam data, pembelajaran semi supervised learning menggunakan data yang berlabel dan tidak berlabel untuk meningkatkan kinerja prediktif, reinforcement learning dapat menangani umpan balik dalam bentuk reward.

Untuk pengertian masing-masing akan dijelaskan pada halaman ini dengan sistematika penulisan berikut:

jenis-machine-learning-7362259

Jenis Machine Learning

ML dapat dikelompokkan berdasarkan kategori dan bergantung kepada apa.

Jika dilihat dari kategorinya, machine learning dikelompokkan ke dalam beberapa kategori berikut. Ada ratusan bahkan ribuan algoritma machine learning, dapat dikelompokkan menjadi 3, 4 atau lebih yaitu[1]:

  1. ML yang dilatih manusia atau tidak:
    – Supervised
    – Unsupervised
    – Semi-supervised
    – Reinforcement Learning
  2. ML yang dapat belajar secara bertahap
  3. ML yang bekerja membandingkan titik data baru untuk menemukan titik data, atau dapat mendeteksi pola baru dalam data, dan kemudian akan membangun model.

Jadi kita dapat mengklasifikasikan sistem machine learning sesuai dengan jenis dan jumlah supervisi manusia selama pelatihan data (training dataset) ke dalam 4 jenis machine learning mulai dari supervised sampai reinforcement learning. Penjelasannya:

Supervised Learning

Pada Supervised Learning: (1) komputer dituntun melakukan sesuatu; (2) dataset berpasangan ada variabel input dan output D = {(x0,y0), (x1,y1), … , (xn,yn)}; dan (3) digunakan menyelesaikan masalah yang berkaitan dengan Classification, dan Regression. Algoritma yang termasuk supervised learning:

  • Support Vector Machine
  • Linear Regression
  • Logistic Regression
  • Naïve Bayes
  • Linear Discriminant Analysis (LDA)
  • Decision Tree
  • K-nearest neighbor
  • Neural Networks (multilayer perceptron)
  • Similiarity Learning, dll

Unsupervised Learning

Unsupervised Learning: (1) komputer dibiarkan belajar sendiri; (2) dataset tidak berpasangan hanya variabel input D = {x0, x1, … , xn}; dan (3) digunakan untuk menyelesaikan persoalan Association, dan Clustering. Algoritma yang termasuk unsupervised learning:

  • K-means
  • Hierarchical Clustering
  • DBSCAN
  • Fuzzy C-means
  • Local Outlier Factor
  • Deep Belief Nets
  • Generative Adversarial Networks
  • Expectation Maximization (EM), dll

Semi Supervised Learning

Semi supervised learning merupakan jenis machine learning yang dilatih berdasarkan kombinasi data berlabel dan tidak berlabel. Biasanya, kombinasi ini akan berisi data berlabel dalam jumlah yang sangat kecil dan data tak berlabel dalam jumlah yang sangat besar.



Prosedur dasar yang terlibat adalah yang pertama, programmer akan mengelompokkan data serupa menggunakan algoritma pembelajaran tanpa pengawasan dan kemudian menggunakan data berlabel yang ada untuk memberi label sisa data yang tidak berlabel. Kasus penggunaan tipikal algoritma semacam ini memiliki kesamaan di antara mereka – Akuisisi data tanpa label relatif murah sementara pelabelan data tersebut sangat mahal.

Secara umum, algoritma semi-supervised learning beroperasi pada kerangka kerja ini:

  • Algoritma semi-supervised learning menggunakan sekumpulan data sampel berlabel terbatas untuk melatih dirinya sendiri, menghasilkan model ‘dilatih sebagian’.
  • Model yang dilatih sebagian memberi label pada data yang tidak berlabel. Karena sampel kumpulan data berlabel memiliki banyak keterbatasan (misalnya, bias pemilihan dalam data dunia nyata), hasil pelabelan dianggap sebagai data ‘berlabel semu’.
  • Kumpulan data berlabel dan pseudo-label digabungkan, menciptakan algoritma unik yang menggabungkan aspek deskriptif dan prediktif dari supervised dan unsupervised learning.
  • Semi-supervised learning menggunakan proses klasifikasi untuk mengidentifikasi aset data dan proses clustering untuk mengelompokkannya menjadi beberapa bagian.

Semi-Supervised GAN, disingkat SGAN, adalah variasi dari arsitektur Generative Adversarial Network untuk mengatasi masalah pembelajaran semi-supervised learning ini.

Reinforcement Learning

Reinforcement Learning: (1) komputer melakukan pencarian sendiri –self discovery dengan cara berinteraksi dengan lingkungan; (2) dataset didapatkan dari pengalaman / experience, input didapatkan dari proses training; dan (3) digunakan untuk menyelesaikan persoalan Classification, dan Control. Algoritma yang termasuk reinforcement learning: Q-Learning, State-Action-Reward-State-Action (SARSA), Deep Q Network (DQN), Deep Deterministic Policy Gradient (DDPG), Actor Critic, Monte Carlo Tree Search (MCTS).

Batch Learning

Batch: Learning over groups of patters. Most algorithms are batch. Pada batch learning, sistem tidak dapat belajar secara bertahap: sistem harus mendapatkan semua data yang diperlukan. Artinya, ini akan membutuhkan banyak sumber daya dan banyak waktu, proses learning selalu dilakukan secara offline. Jadi, untuk bekerja dengan jenis batch learning, hal pertama yang harus dilakukan adalah melatih sistem, lalu meluncurkannya tanpa pembelajaran apa pun.

Online Learning

Online: Learning based on each pattern as it is observed [2].

Jenis pembelajaran online learning adalah kebalikan dari batch learning. Artinya sistem dapat belajar secara bertahap dengan menyediakan sistem semua data yang tersedia sebagai instance (kelompok atau individu), dan kemudian sistem dapat belajar dengan cepat.

Online learning dapat digunakan untuk masalah yang memerlukan aliran data yang berkelanjutan, yang juga perlu beradaptasi dengan cepat terhadap setiap perubahan. Selain itu, Anda dapat menggunakan jenis sistem ini untuk bekerja dengan data set yang sangat besar,

Anda harus tahu seberapa cepat sistem Anda dapat beradaptasi dengan perubahan apa pun dalam “learning rate” data. Jika kecepatannya tinggi, berarti sistem akan belajar dengan cukup cepat, akan tetapi juga akan cepat melupakan data lama.

Instance Based Learning

Instance based learning / memory based learning adalah jenis machine learning yang melakukan generalisasi eksplisit, membandingkan instance masalah baru dengan instans yang terlihat dalam pelatihan yang telah disimpan dalam memori.

Contoh algoritma yang berbasis instance learning adalah k-nearest neighbot, kernel machine, dan RBF network.

Model Based Learning

Model based machine learning adalah jenis machine learning yang diparameteri dengan sejumlah parameter yang tidak berubah seiring dengan perubahan ukuran data latih.


model-based machine learning adalah pendekatan machine learning di mana semua asumsi tentang domain masalah dibuat eksplisit dalam bentuk model. Model ini kemudian digunakan untuk membuat model khusus untuk mempelajari atau bernalar tentang sebuah domain. Bagian pembuatan algoritma dari proses ini dapat diotomatisasi.

Algoritma adalah serangkaian instruksi yang digunakan untuk memecahkan masalah atau melakukan komputasi. Biasanya suatu algoritma diterapkan pada beberapa data masukan untuk menghasilkan beberapa keluaran.

Model adalah serangkaian asumsi tentang domain masalah, diekspresikan dalam bentuk matematika yang tepat, yang digunakan untuk membuat solusi pembelajaran mesin.

Referensi

  1. Russel, Rudolph, 2018, Machine Learning: Step-by-Step Guide To Implement Machine Learning Algorithms with Python,
  2. Saffari, A. dkk., Online Random Forest.