Indeks Jaccard
ukuran kemiripan dan keragaman antarhimpunan
Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:
Kemiripan atribut biner tak simetri
suntingBagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Klasifikasi biner
suntingBagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Lihat pula
sunting- Koefisien tumpang-tindih (koefisien Szymkiewicz–Simpson)
- Koefisien pencocokan sederhana (koefisien kemiripan Rand/SMC)
- Jarak Hamming
- Koefisien Sørensen–Dice (indeks Sørensen/koefisien Dice)
- Indeks Tversky
- Korelasi
- Informasi bersama (MI)
Referensi
sunting- ^ Jaccard, Paul (Februari 1912). "The Distribution of the Flora in the Alpine Zone". New Phytologist (dalam bahasa Inggris). 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x. ISSN 0028-646X.
- ^ Tanimoto, T.T. (17 November 1958). "An Elementary Mathematical theory of Classification and Prediction". Internal IBM Technical Report. 1957 (8?).
Bacaan lebih lanjut
sunting- Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7.
- Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579.
- Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.