Vector Space Model

Vector space model adalah gambaran dokumen dalam bentuk vektor kata, definisi ini dikemukakan oleh Liao Yihua [LIA02].Dalam representasinya akan dibagi menjadi dua bagian yaitu baris dan kolom seperti sebuah matrik dengan ukuran N dimensi. Baris merupakan kumpulan urutan dokumen, pada Gambar 2.3 ditunjukkan dengan d1, d2, … , dN dan q.Kolom adalah kumpulan urutan kata atau istilah yang ditunjukkan oleh t1, t2, t3 tn pada Gambar 2.3.Sedangkan isi dari vektor itu adalah jumlah tiap-tiap kata dalam masing masing dokumen yang ditunjukkan oleh angka-angka pada Gambar 2.3.Angka-angka yang ditunjukkan pada gambar tersebut masih berupa bobot tf.Bobot tf inilah yang nantinya juga digunakan untuk menentukan bobot tfidf dari suatu kata pada sebuah dokumen yang sifatnya umum.Hasil dari perhitungan pembobotan akan digunakan untuk membentuk Vektor dengan dimensi N, R |N|.

t1

t2

t3

tn

d1

14

6

1

0

d2

0

1

3

1

d3

0

1

0

2

dN

4

7

0

5

q

0

1

0

1

Gambar 2.3 Vector Space Model

[LIA02] Yihua, Liao, 2002. Review of K-Nearest Neighbor Text Categorization Method.http://www.usenix.org/events/sec02/full_papers/liao/liao_html/

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s