SciPy, NumPy, Matplotlib, PyPlot, dan PyLab adalah library Python yang dapat digunakan untuk kebutuhan data science maupun yang lebih spesifik lagi misalnya machine learning, deep learning, dll.



Numpy, scipy, matplotlib, dan pylab adalah istilah umum yang banyak didengar ketika Anda menggunakan python untuk komputasi ilmiah data science. Lalu apa saja perbedaan diantara mereka? Kita simak tulisan di halaman ini. Terlebih dahulu biar mudah berikut daftar isinya:

Sebelum kita melihat detail berbagai library machine learning, mari kita mulai dengan melihat apa itu machine learning. Dapat dikategorikan sebagai subbidang artificial intelligence. Pada dasarnya, machine learning melibatkan pembuatan model matematika untuk membantu memahami data.

scipy numpy-plylab-3200210

“Learning” memasuki area sebenarnya ketika kita memberi model ini parameter yang dapat disesuaikan dengan data yang diamati; dengan cara ini program dapat dianggap melakukan “learning” dari data. Setelah model ini disesuaikan dengan data yang dilihat sebelumnya, model tersebut dapat digunakan untuk memprediksi dan memahami aspek data yang baru diamati.

Di dalam machine learning pasti menggunakan data sebagai inputnya, nah kumpulan data ini (dataset) dapat berasal dari berbagai sumber dan format yang berbeda, termasuk koleksi dokumen, koleksi gambar, koleksi klip suara, koleksi pengukuran numerik, atau hampir semua hal lainnya.

Untuk itulah library Python hadir yang dirancang untuk memudahkan pekerjaan sebagai data scientist.

Python Library untuk Machine Learning

Ada beberapa library Python yang digunakan dalam machine learning, diantaranya adalah:

SciPy

SciPy adalah kumpulan algoritme matematika dan fungsi matematika yang dibangun di atas ekstensi Numpy dari Python. SciPy menambahkan kekuatan yang signifikan ke sesi Python interaktif dengan menyediakan pengguna dengan perintah dan kelas tingkat tinggi untuk memanipulasi dan memvisualisasikan data.

NumPy

NumPy (singkatan dari Numerical Python) menyediakan antarmuka yang efisien untuk menyimpan dan beroperasi pada buffer data yang padat. Dalam beberapa hal, array NumPy seperti jenis daftar bawaan Python, tetapi array NumPy menyediakan penyimpanan dan operasi data yang jauh lebih efisien karena ukuran array bertambah besar.



Numpy menambahkan dukungan python untuk array dan matriks multi-dimensi yang besar, bersama dengan fungsi matematika tingkat lanjut untuk beroperasi pada array ini.

Matplotlib

Matplotlib adalah library visualisasi data multiplatform yang dibangun di atas array NumPy, dan dirancang untuk bekerja dengan tumpukan SciPy yang lebih luas. Ini dibuat oleh John Hunter pada tahun 2002, awalnya sebagai patch untuk IPython untuk mengaktifkan plotting gaya MATLAB interaktif melalui gnuplot dari baris perintah IPython.

Salah satu fitur Matplotlib yang paling penting adalah kemampuannya untuk bekerja dengan baik dengan banyak sistem operasi dan backend grafis. Matplotlib mendukung berbagai jenis backend dan jenis outpu, yang berarti Anda dapat mengandalkannya untuk bekerja terlepas dari sistem operasi mana yang Anda gunakan atau format luaran yang Anda inginkan.

PyPlot

Sebenarnya, PyLab sudah include tandem atau tertanam di dalam MatplotLib dan fungsinya adalah memberikan pengalaman seperti MATLAB bagi pengguna.

Kemudahan PyPlot umumnya lebih disukai untuk pembuatan plot non-interaktif (yaitu, pembuatan skrip). PyLab digunakan untuk penghitungan dan sementara PyPlot digunakan untuk visualisasi yang interaktif, keduanya digunakan untuk meminimalkan pengetikan.

PyLab

Matplotlib merupakan library Python yang ekstensiv; PyLab adalah modul Matplotlib yang biasanya akan diinstal bersama Matplotlib; sedangkan matplotlib.pyplot adalah sebuah modul Matplotlib.

PyLab merupakan bagian dari matplotlib (dalam matplotlib.pylab) dan fungsinya adalah untuk memberikan lingkungan agar serasa menggunakan MatLab. Matplotlib memiliki sejumlah dependensi, misalnya NumPy yang diimpor dengan alias bersama np.

Vice Versa

  • NumPy : Numetical Pyhon, merupakan paket array berdimensi-N
  • SciPy : Scientific python, librari dasar untuk komputasi ilmiah
  • Matplotlib :untuk Plotting 2D yang komprehensif

NumPy adalah paket pemrosesan array untuk keperluan umum.

  • SciPy dan NumPy adalah proyek library yang bertujuan untuk komputasi numerik yang efisien dan cepat dalam Python.
  • Sebagian besar fitur Data Science baru tersedia dalam SciPy daripada NumPy.
  • SciPy adalah versi Aljabar Linear berfitur lengkap sementara NumPy hanya berisi sedikit fitur.
  • NumPy lebih cepat daripada Library Python lainnya

Matplotlib adalah nama library plotting untuk Python.

  • Pyplot adalah API interaktif untuk Matplotlib, seperti ini: import matplotlib.pyplot as plt.
  • Pylab sama dengan pyplot, tetapi dengan fitur ekstra.
  • Pylab = pyplot + numPy