Survei tentang metode analisis sentimen, penerapan, dan tantangan – Pendekatan hibrida

September 2, 2023 Mochamad Soffan Muslim

Pendekatan hibrid menggabungkan pembelajaran mesin dan pendekatan berbasis leksikon. Hibrid adalah istilah yang mengacu pada kombinasi pembelajaran mesin dan teknik berbasis leksikon untuk analisis sentimen. Teknik hibrida menggabungkan keduanya dan sangat populer, dengan leksikon sentimen memainkan peran penting di sebagian besar sistem. Analisis sentimen adalah pendekatan gabungan, yang mencakup metode statistik dan berbasis pengetahuan untuk mengenali polaritas. Dalam karya Hassonah dkk. ( 2020a ) mengusulkan pendekatan pembelajaran mesin hybrid menggunakan SVM dan dua teknik pemilihan fitur menggunakan pengoptimal multi-ayat dan algoritma Relief (Chang et al. 2020 ). Tugas analisis sentimen (Al Amrani dkk. 2018) diusulkan menggunakan pendekatan hybrid berbasis pembelajaran mesin termasuk RF dan SVM. Mereka menunjukkan bahwa masing-masing model SVM dan RF memiliki akurasi masing-masing sebesar 81,01 dan 82,03 persen, sedangkan model hybrid yang menggabungkan kedua algoritme memiliki akurasi mendekati 84% dalam kumpulan data ulasan produk yang disediakan oleh amazon.com. Hanya sedikit peneliti yang mengusulkan arsitektur hibrid yang melibatkan teknik pembelajaran berbasis leksikon dan otomatis untuk meningkatkan hasil. Hal ini masih menjadi topik hangat bagi para peneliti, dan masih banyak penelitian yang perlu dilakukan.

Dalam karya Hassonah dkk. ( 2020b ) menggunakan data Twitter untuk pelatihan. Sebanyak 6900 tweet diekstraksi untuk pelatihan menggunakan Twitter API. Hasilnya menunjukkan bahwa model mereka mengungguli sebagian besar model sekaligus mengurangi jumlah fitur hingga 96%. Mereka juga menunjukkan kapasitas model Hybrid dan menyimpulkan bahwa model Hybrid dapat mengungguli semua model dengan arsitektur yang tepat dan pemilihan hyperparameter yang tepat (Chang et al. 2020). Model Hibrid mengungguli kedua model tersebut dalam semua metrik dan perbandingan lainnya. Mereka menyimpulkan bahwa meskipun model Hibrid memiliki performa lebih baik dibandingkan model individual, masih banyak peluang penelitian yang tersedia untuk meningkatkan performa model hibrid dengan menyesuaikan dan melatih model tersebut. Terdapat berbagai Analisis Ringkasan Metode Algoritma Klasifikasi Supervised Machine learning beserta Kelebihan dan Kekurangannya ditunjukkan pada Tabel 4 .

Tabel 4 Ringkasan analisis algoritma klasifikasi pembelajaran mesin serta kelebihan dan kekurangannya

Teknik	Keuntungan	Kerugian
catatan	Mudah DiimplementasikanLebih sedikit data pelatihan yang diperlukanMembutuhkan lebih sedikit waktu pelatihan dan data dibandingkan pendekatan lainnya	Mengasumsikan bahwa atribut saling independenModel dapat menghadapi Masalah Frekuensi NolDibatasi oleh ketidakseimbangan kelas, karena nilai probabilitas harus diperkirakan untuk setiap nilai yang mungkin
SVM	Algoritma paling populer untuk SAMemberikan akurasi yang baik untuk kumpulan data besar	Menyempurnakan model sangat sulit dan membosankanWaktu pelatihan yang lama untuk kumpulan data besar
DT	Mudah untuk dibangunLebih sedikit waktu untuk pelatihanKumpulan data yang luas tidak diperlukan untuk pelatihan	Model lebih rentan terhadap overfitModel yang sangat berorientasi pada Domain akan dibangun
KNN	Batasan keputusan non-linier dapat dibangunData dapat ditambahkan terus-menerus seiring berjalannya waktu tanpa pelatihan eksplisit	Kompleksitas prediksi yang lebih tinggi untuk kumpulan data dan dimensi besarKepentingan yang sama diberikan pada semua fitur
Federasi Rusia	Modelnya kuat dan sangat stabilModel cenderung tidak melakukan overfit secara signifikan	Modelnya sangat kompleksWaktu yang lebih lama untuk melatih data
AKU	Bekerja pada model probabilistik. Oleh karena itu, banyak data pelatihan tidak diperlukan	Model berorientasi domain dan tidak akan berfungsi dengan baik untuk kumpulan data yang berbeda
LR	Model paling sederhana untuk diterapkan dan dilatihTidak ada asumsi yang dibuat tentang distribusi kelas dalam ruang fitur	Batas linier dibangunAkurasi rendah untuk kumpulan data yang kompleks
DNN	Dibandingkan dengan model DL lainnya, model ini cukup sederhana untuk diterapkan	Masalah yang terlalu pas
RNN	Pengambilan data berurutan, yang penting untuk kategorisasi teks sentimen	Berlatih lebih lambat dibandingkan model lainnyaRumit dan mahal secara komputasi
LSTM	Lebih efisien daripada RNNDapat memetakan ketergantungan jangka panjang	Model yang sangat kompleksWaktu pelatihan tinggi
Bi-LSTM	Dapat mengetahui ketergantungan di kedua arahHasil yang lebih baik dapat diperoleh dibandingkan dengan metode lain	Secara komputasi sangat mahalPelatihan sangat lambat
CNN	Akurasi Tinggi, Pelatihan Cepat	Desain dan pemeliharaan memakan waktu
Transformator	Menggunakan model perhatian diri untuk menemukan ketergantunganBerfokus hanya pada bagian penting dari kalimat	Kurang populer dan jarang digunakanMemerlukan data yang sangat besar

Tabel 4

Roniwahyu.com

Survei tentang metode analisis sentimen, penerapan, dan tantangan – Pendekatan hibrida

Tabel 4 Ringkasan analisis algoritma klasifikasi pembelajaran mesin serta kelebihan dan kekurangannya

Sumber

https://link.springer.com/article/10.1007/s10462-022-10144-1

Leave a Reply

Tabel 4 Ringkasan analisis algoritma klasifikasi pembelajaran mesin serta kelebihan dan kekurangannya

Sumber

You May Also Like

Leave a Reply Cancel reply

Leave a Reply