Apa itu Kata Berhenti?

Dalam komputasi dan aplikasi online,kata berhentiadalah kata yang disaring selama pemrosesan beberapa jenis teks, seperti selama inisiasi pencarian online.Dikenal sebagai salah satu komponenpemrosesan bahasa alamiatau NLP, ide di balik jenis pemfilteran ini adalah untuk membantu mempercepat pencarian dengan menghilangkan artikel umum dari permintaan.Sebagai gantinya,mesin pencarimenggunakan penanda sederhana untuk mencatat keberadaan kata dalam string teks tetapi tidak mencegah keberadaan penanda tersebut untuk menyertakan halaman tersebut dalam hasil pencarian.

Pria memegang komputer

Salah satu cara untuk memahami bagaimana stopword dapat memperumit fungsi mesin pencari adalah dengan mempertimbangkan fakta bahwa ketika melakukan pencarian, mesin akan mempertimbangkan setiap kata yang termasuk dalam permintaan pencarian yang diajukan oleh pengguna.Sebagai bagian dari pertimbangan itu, mesin mencari halaman yang berisi setiap kata.Itu berarti jika permintaan pencarian berisi tiga kata, mesin membuat tiga sapuan Internet, akhirnya memberikan prioritas ke halaman yang menyertakan ketiga kata tersebut.

Misalnya, pencarian seperti “rumah di atas bukit” akan membutuhkan mesin untuk melakukan pencarian pada setiap kata dalam urutan, dengan beberapa bahkan menjalankan pencarian pada kata berhenti “the” dua kali.Ini membutuhkan waktu dan sumber daya yang dapat dialihkan untuk membantupencariankata kuncilain yang sedang dilakukan pengguna akhir lainnya.Dengan menggunakan penanda untuk menggantikan “the” dan “on” selama pencarian, mesin dapat mencurahkan lebih sedikit sumber daya dan tetap mengembalikan hasil yang kemungkinan besar akan memuaskan pengguna akhir.

Sementara stop word kadang-kadang disebut sebagaikata racun, sebenarnya tidak ada yang salah dengan memasukkan artikel pidato dalam teks yang digunakan untuk melakukan pencarian.Penggunaan kata berhenti atau kata-kata sebagai bagian dari permintaan pencarian dapat mempersulit proses pengindeksan mesin pencari ketika mencoba untuk mengambil data yang memenuhi kriteria pencarian.Namun, pengguna akhir tidak mungkin melihat banyak perbedaan dalam ekstraksi informasi yang akhirnya dikembalikan.

Baca Juga  Apa itu Tabel DUAL?

Tidak ada daftar kata berhenti keras dan cepat yang digunakan secara universal oleh semua mesin pencari.Faktanya, beberapa mesin pencari tidak menggunakan semua jenis daftar kata berhenti sebagai bagian dari tugas pemrosesan bahasa alami sama sekali.Namun, mesin lain akan banyak menggunakan daftar kata berhenti sebagai sarana untuk mengalokasikan sumber daya dengan cara yang lebih efisien, sambil tetap mengembalikan hasil mesin telusur yang akurat dan kemungkinan sangat sesuai untuk permintaan penelusuran yang diajukan oleh siapa pun yang menggunakan metode tertentu. mesin.