Efektifitas Sistem

Dalam Pengkategorian teks yang ditekankan dalam evaluasi adalah efektifitasnya. Maksudnya adalah tingkat kebenaran pengkategorian yang dilakukan oleh sistem. Pengukuran efektifitas biasanya menggunakan recall, precisison, dan F1 measure yang merupakan gabungan dari recall dan precision. Nilai-nilai inilah yang menentukan apakah sistem efektif dalam melakukan pengkategorian atau tidak.

Dalam penelitian yang saya lakukan menggunakan algoritma k-nearest neighbor timbul permasalah baru yaitu time consuming. Karena pada dasarnya algoritma ini akan membandingkan data baru yang akan dikategorikan dengan keseluruhan data yang ada dalam data training.

Sebenarnya juga ada algoritma lain yang digunakan untuk menyempurnakan kelemahan algoritma K-NN ini yaitu dengan memadukan KNN dengan Rocchio. Setelah dilakukan pengamatanbanyaknya waktu yang diperlukan adalah pada saat menghitung nilai keniripan. Proses penghitungan nilai kemiripan memanfaatkan apa yang disebut denga vektor space model. Yaitu menyusun semua kata yang ada kemudian melakukan perhitungan bobot sampai didapatkan nilai kemiripannya.Proses inilah yang memerlukan waktu sangat banyak.

Ternyata eh ternyata ada penyelesaian dan pembahasan tersendiri mengenai kelemotan vector space model ini diantaranya menggunakan indexing and yang jelas tidak menggunakan metode brute force.

Untungnya karena hanya membahas efektifitas maka untuk sementara masalah “kelemotan” dapat diabaikan. Moga aja ada kesempatan buat melakukan perbaikan terhadap sistem yang telah kukembangkan ataupun ada kesempatan untuk melakukan penelitian lagi dibidang itu. Itupun kalo ga’ males.

6 thoughts on “Efektifitas Sistem

  1. mbak/mas, saya sedang tugas akhir dengan model KNN,namun saya masih bingung konsep algoritma ini.
    oh ya, topik yang diangkat dari TA saya adalah klasifikasi data angket penilaian dosen.

    mungkin mbak/mas bisa membantu saya,terima kasih

  2. Menurut pemahamanku konsep algoritma KNN sederhana sekali. Dalam melakukan klasifikasi Algoritma KNN mencari data lama yang ada dalam training yang paling mirip dengan data baru. untuk mencari kemiripannya dapat digunakan metode pengukuran jarak seperti cosine similarity dan euclidean distance. setelah dilakukan pengukuran nilai kemiripan maka dapat dilakukan pengurutan untuk mencari nilai kemiripan yang paling tinggi. Nama klasifikasi dari data yang mempunyai nilai kemiripan paling tinggi itulah yang menjadi nama klasifikasi data baru yang dimasukkan tersebut.
    Atau mungkin mb’/mas bisa hub email saya aja langsung.

  3. selamat siang mbak…
    mau nanya mbak…
    tahu tentang klasifikasi menggunakan rocchio tidak???
    kalau tahu bisa minta bahannya tidak,,
    alur program nya ithu kaya gimana gthu…
    terimakasih mbak..

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s