Deep Learning Untuk Entity Matching Produk Kamera Antar Online Store Menggunakan DeepMatcher

Adam Akbar, Nisrina Fadhilah Fano, Nur Aini Rakhmawati

Abstract


Dalam bidang ilmu Computer Science, Entity Matching telah menjadi tantangan tersendiri bagi beberapa peneliti. Beberapa berusaha mengembangkan algoritma entitiy matching untuk meningkatkan akurasi. Penelitian ini akan menguji DeepMatcher sebagai representasi Entity Matching yang menggunakan Deep Learning dengan melakukan pencocokan entitas terhadap studi kasus pencocokan produk kamera pada dua online store menggunakan empat algoritma pemelajaran berbeda yang dimiliki oleh DeepMatcher yakni Smooth Inverse Frequency, Bidirectional RNN, Decomposable Attention Model, dan Hybrid Model. Dengan membangun dataset dan model pemelajaran, DeepMatcher dapat melakukan pencocokan secara mandiri pada data yang belum dimasukkan sebelumnya. Hasil pencocokan tersebut akan diukur menggunakan f-measure untuk kemudian dianalisa kehandalannya. Hasil pengujian menunjukkan bahwa janis pemelajaran pada DeepMatcher yang paling cocok untuk digunakan dalam melakukan entity matching pada produk kamera antar online store adalah Bidirectional RNN dengan rata-rata skor F1 yang dihasilkan adalah 61,546

Keywords


smooth inverse frequency, bidirectional rnn, decomposable attention model, hybrid model, entity matching, deep learning, DeepMatcher

Full Text:

PDF

References


M. Lenzerini, "Data integration: A theoretical perspective," in Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems, 2002.

S. Mudgal, H. Li, T. Rekatsinas, A. Doan, Y. Park, G. Krishnan, R. Deep, E. Arcaute dan V. Raghavendra, “Deep learning for entity matching: A design space exploration,” dalam Proceedings of the 2018 International Conference on Management of Data, 2018.

L. F. Carvalho, A. H. Laender and W. Meira Jr, "Entity matching: A case study in the medical domain," in Alberto Mendelzon International Workshop on Foundations of Data Management, Lima, 2015.

P. Christen, Data matching: concepts and techniques for record linkage, entity resolution, and duplicate detection, Springer: Data-centric systems and applications, 2012.

S. Mudgal, “deepmatcher/README.rst at master · anhaidgroup/deepmatcher,” 9 July 2018. [Online]. Available: https://github.com/anhaidgroup/deepmatcher/blob/master/README.rst. [Diakses 18 November 2020].

A. Doan, “AnHai's Group,” 30 September 2017. [Online]. Available: https://sites.google.com/site/anhaidgroup/home. [Diakses 19 November 2020].

A. Doan, “Magellan - AnHai's Group,” 11 Febuary 2020. [Online]. Available: https://sites.google.com/site/anhaidgroup/projects/magellan. [Diakses 19 November 2020].

R. a. M. G. Garreta, Learning scikit-learn: machine learning in python, Packt Publishing Ltd, 2013.




DOI: https://doi.org/10.26877/jiu.v7i2.7265

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Adam Akbar, Nisrina Fadhilah Fano, Nur Aini Rakhmawati



Creative Commons License
Jurnal Informatika Upgris by Program Studi Informatika UPGRIS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.