Survei tentang metode analisis sentimen, penerapan, dan tantangan – Tugas analisis sentimen
Gambaran umum berbagai tugas analisis sentimen seperti ditunjukkan pada Gambar 3 dan dijelaskan sebagai berikut.
Gambar 3
Tugas analisis sentimen
Klasifikasi subjektivitas Hal ini sering dianggap sebagai tahap pertama dalam analisis sentimen. Klasifikasi subjektivitas mengenali petunjuk subjektif, frasa emosional, dan ide subjektif. Token seperti ‘keras’, ‘luar biasa’ dan ‘murah’ diidentifikasi (Kasmuri dan Basiron 2017 ).
Indikasi ini digunakan untuk membedakan objek teks objektif atau subjektif. Dalam karya Kasmuri dan Basiron ( 2017 ) melibatkan penentuan ada atau tidaknya subjek tertentu dalam teks yang diberikan. Klasifikasi subjektivitas bertujuan untuk menjauhkan item data objektif yang tidak diinginkan dari pemrosesan selanjutnya (Kamal 2013 ).
Klasifikasi sentimen Kategorisasi sentimen adalah tugas penelitian yang terkenal dalam analisis sentimen. Penentuan polaritas adalah salah satu subtugas klasifikasi sentimen, dan istilah “Analisis Opini” sering digunakan saat mengacu pada Analisis Sentimen.
Ini adalah tugas kecil yang bertujuan untuk menentukan sentimen setiap bagian teks. Polaritas secara tradisional bersifat positif atau negatif (Wang et al. 2014 ). Dalam karya Xia dkk. ( 2015), konteks tingkat opini diselidiki, dengan aspek intra-opini dan antar-opini dikarakterisasi dengan baik. Netral juga disertakan dalam beberapa kasus.
Dengan pengklasifikasi terlatih, analisis lintas domain memprediksi sentimen domain target. Mengekstraksi fitur invarian domain dan lokasi pendistribusiannya adalah pendekatan yang umum digunakan (Peng et al. 2018 ). Analisis lintas bahasa dilakukan serupa dengan melatih model pada kumpulan data dari bahasa sumber dan kemudian mengevaluasinya pada kumpulan data dari bahasa lain dengan data terbatas. Ketidakjelasan polaritas kata merupakan salah satu kendala yang harus diatasi oleh analisis sentimen.
Dalam karya Vechtomova ( 2017 ) dan Singh dkk. ( 2021b) menunjukkan bahwa model berbasis pengambilan memberikan alternatif terhadap strategi berbasis Pembelajaran Mesin untuk mendeteksi polaritas kata. Komputasi afektif dan analisis sentimen juga memiliki potensi yang luar biasa sebagai teknologi subsistem untuk sistem lain (Cambria et al. 2017 ).
Mereka dapat meningkatkan kemampuan manajemen hubungan pelanggan dan sistem rekomendasi dengan memungkinkan penemuan fitur mana yang sangat disukai pelanggan atau penghilangan item yang menerima masukan yang sangat tidak menyenangkan dari saran tersebut.
Deteksi Spam Opini Deteksi Spam telah menjadi tantangan besar dalam analisis sentimen karena meningkatnya minat terhadap platform e-commerce dan ulasan. Spam opini, sering kali dikenal sebagai ulasan palsu atau ulasan telepon, adalah komentar yang ditulis dengan baik yang mendukung atau mengkritik suatu produk demi keuntungannya. Deteksi spam opini berupaya mengidentifikasi tiga karakteristik berbeda dari ulasan telepon: konten ulasan, metadata ulasan, dan keahlian produk di dunia nyata (Crawford dkk. 2015).
Algoritma pembelajaran mesin sering digunakan untuk menilai materi ulasan guna mendeteksi ketidakjujuran. Peringkat bintang atau poin, alamat IP pengguna, geolokasi pengguna, dan informasi lainnya adalah beberapa Metadata yang digunakan dalam mendeteksi opini spam. Namun, dalam banyak keadaan, hal ini tidak dapat diakses untuk dianalisis. Pengalaman dan pengetahuan dunia nyata termasuk dalam cara ketiga. Misalnya, jika produk dengan peringkat dan ulasan buruk diberi peringkat tinggi selama jangka waktu tertentu, produk tersebut dapat dicurigai dan dianalisis untuk mendeteksi spam opini.
Deteksi Bahasa Implisit Sarkasme, ironi, dan humor umumnya disebut sebagai Bahasa Implisit. Bentuk ucapan yang samar-samar dan ambigu ini merupakan tugas yang sulit untuk dideteksi, bahkan terkadang oleh manusia. Namun, bahasa implisit ini merupakan aspek penting dari sebuah kalimat dan dapat sepenuhnya membalikkan makna dan polaritas kalimat tersebut. Misalnya, pertimbangkan ungkapan ‘Brilian, saya dipecat’.
Kata Cemerlang sangat positif, namun menggambarkan ironi atau sarkasme jika digabungkan dengan bagian selanjutnya, yaitu “Saya dipecat” membuat frasa “Saya dipecat” menjadi lebih negatif. Menyelidiki tanda-tanda seperti emotikon, emosi tawa, dan penggunaan tanda baca yang ekstensif merupakan pendekatan yang lebih klasik untuk mendeteksi bahasa implisit (Fang et al. 2020 ; Filatova 2012 ).
Ekstraksi Aspek Analisis sentimen tingkat aspek terutama terdiri dari tiga langkah ekstraksi aspek, klasifikasi polaritas, dan agregasi. Proses analisis sentimen berbasis aspek dimulai dengan ekstraksi aspek, salah satu proses utama yang membedakan analisis sentimen pada umumnya. Aspek dapat diekstraksi menggunakan serangkaian aspek yang telah ditentukan sebelumnya, yang harus ditentukan sebelumnya secara cermat berdasarkan domain penggunaannya.
Pendekatan lainnya adalah pendekatan yang lebih canggih seperti metode berbasis frekuensi, metode berbasis sintaksis, pendekatan pembelajaran mesin yang diawasi dan tanpa pengawasan. Hal ini terlihat pada ulasan (Kanapala dkk. 2019), hanya sedikit kata yang lebih sering digunakan dibandingkan kata lain, dan istilah yang paling sering digunakan ini lebih cenderung muncul sebagai aspek; metode sederhana ini bisa menjadi pendekatan yang cukup ampuh karena banyaknya pendekatan yang dilakukan. Pendekatan ini memiliki sedikit kelemahan karena semua frequent nouns tidak mengacu pada aspek, istilah seperti ‘bucks’, ‘dolars’, ‘rupee’, dll.
Selain itu, aspek yang tidak sering disebutkan dapat terlewatkan dengan metode ini. Seperangkat aturan dapat dilengkapi dengan pendekatan berbasis frekuensi untuk mengatasi masalah ini, namun aturan yang dibuat secara manual ini cenderung berasal dari parameter yang perlu disesuaikan secara manual, yang merupakan tugas yang sangat sibuk dan memakan waktu.
Daripada berfokus pada pendekatan berbasis Frekuensi.2020 ). Dalam pendekatan ini, misalnya, di sini, ‘Awesome’ mengacu pada kata sifat yang mengacu pada aspek “makanan” dalam ‘Makanan luar biasa.’ Untuk pendekatan ini, banyak data beranotasi yang mencakup semua hubungan sintaksis harus dikumpulkan untuk melatih algoritme.
Kebutuhan analisis sentimen
Analisis sentimen sangat penting karena membantu bisnis memahami sentimen konsumen terhadap merek mereka. Dengan secara otomatis mengklasifikasikan emosi di balik interaksi media sosial, ulasan, dan banyak lagi, organisasi dapat mengambil keputusan yang tepat. Analisis Sentimen mengacu pada metode dan strategi yang memungkinkan perusahaan memeriksa data tentang bagaimana perasaan basis pelanggan mereka terhadap layanan atau produk tertentu.
Untuk mengidentifikasi Polaritas 😕 Menunjukkan apakah suatu emosi itu baik atau negatif.? Subyek: Apa yang menjadi pokok bahasan? Siapa pemegang pendapat 😕 Sesuatu atau orang yang menyampaikan sentimen.
Analisis Sentimen adalah proses yang menganalisis ucapan bahasa alami secara otomatis, menemukan klaim atau opini penting, dan mengklasifikasikannya menurut sikap emosionalnya.
- Dalam kebutuhan bisnis dengan analisis sentimen telah meningkatkan kebahagiaan konsumen melalui penyempurnaan produk, deteksi masalah secara real-time, dan kekhasan pasar.
- Analisis kepuasan pelanggan melalui analisis sentimen: Pelanggan berbagi pengalamannya dengan suatu produk dan mengomunikasikan pendapat dan sikapnya terhadap produk tersebut menggunakan komentar bahasa alami. Hal ini memberi kami wawasan penting mengenai apakah konsumen puas dan, jika perlu, bagaimana kami dapat meningkatkan produk.
- Identifikasi dan tindak lanjuti masalah secara real-time: Melalui media sosial, pelanggan dapat langsung menyuarakan ketidakpuasannya ke seluruh dunia.