Integration of the WebMonitoring software into Internet Archive’s Wayback Machine (Bachelor thesis)

Τσαλαμπούνας, Φώτιος

This Thesis presents the work the author did during the Google Summer of Code 2018 for the Internet Archive. To be precise,the development of a ReactJS front end application called Waybackdiff and a Python backend application called Wayback-discover-diffisdiscussed. Wayback-diff is an application that allows users to compare two snapshots of the Wayback Machine side-by-side. Wayback-discover-diffcalculates the sim has values of snapshots of webpages offering information that acts as a measure to how much a webpage has changed over time. Information about the tools, frameworks and libraries that were used for their development as well as analgorithmic explanation of the applications’code can be found in chapters two and three. Chapter three also contains ananalysis of theWayback-discover-diff’s runtime,the actions that were taken to improve it and the statistical analysis of those improvements. Finally, chapter four provides an insight as to how the applications were integrated into the Wayback Machine and chapter five discusses future improvements.
Alternative title / Subtitle: Η υλοποίηση του wayback-diff και του wayback-discover-diff
The development of wayback-diff and wayback-discover-diff
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής
Keywords: Open source licenses;Google Open Source;Internet Archive;Call back functions;React Router;Components
Description: Πτυχιακή εργασία - Σχολή Τεχνολογικών Εφαρμογών - Τμήμα Μηχανικών Πληροφορικής, 2019 (α/α 11457)
Item type: bachelorThesis
General Description / Additional Comments: Πτυχιακή εργασία
Submission Date: 2022-06-14T14:57:19Z
Item language: en
Item access scheme: free
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής
Publication date: 2019-10-01
Bibliographic citation: Τσαλαμπούνης, Φ. (2019). Ενσωμάτωση λογισμικού WebMonitoring στο Wayback Machine του Internet Archive (Πτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ Θεσσαλονίκης.
Abstract: Αυτή η πτυχιακή παρουσιάζει την δουλειά του συγγραφέα στα πλαίσια του Google Summer οf Code 2018. Πιο συγκεκριμένα παρουσιάζεται η ανάπτυξη της frontend εφαρμογής waybackdiff σε ReactJS και της Python backend εφαρμογής Wayback-discover-diff. To wayback-diff είναι μια εφαρμογή που επιτρέπει στους χρήστες να συγκρίνουν δύο snapshots μιας ιστοσελίδας δίπλα-δίπλα. Το Wayback-discover-diff υπολογίζει την Simhash τιμή των snapshot των ιστοσελίδων παρέχοντας ουσιαστικά μια νέα πληροφορία που μπορεί να χρησιμοποιηθεί ως μέσο μέτρησης των αλλαγών στην ιστοσελίδα με τον πάροδο του χρόνου. Πληροφορίες σχετικά με τα εργαλεία, τα frameworks και τις βιβλιοθήκες που χρησιμοποιήθηκαν στην ανάπτυξη των εφαρμογών, όπως και η αλγοριθμική εξήγηση των εφαρμογών, μπορούν να βρεθούν στα κεφάλαια δύο και τρία. Το κεφάλαιο τρία επίσης περιέχει την ανάλυση του χρόνου εκτέλεσης του wayback-discover-diff ,τις βελτιώσεις που έγιναν σύμφωνα με αυτή και την στατιστική ανάλυση αυτών των βελτιώσεων. Τέλος, το κεφάλαιο τέσσερα περιέχει μια περιγραφή σχετικά με τον τρόπο ενσωμάτωσης των εφαρμογών στο Wayback Machine και στο κεφάλαιο πέντε γίνονται προτάσεις για μελλοντικές βελτιώσεις.
Advisor name: Δερβός
Examining committee: Δερβός
Publishing department/division: Τμήμα Μηχανικών Πληροφορικής
Publishing institution: teithe
Number of pages: 77
