Indexing and Output Ranking Features in the Modern Search Engine Implementations

Δέρβος, Δημήτριος/ Καράπαπας, Δημήτριος


Institution and School/Department of submitter: ΤΕΙ Θεσσαλονίκης
Keywords: Ανάκτηση πληροφοριών;Αναζήτηση;Μηχανές αναζήτησης;World Wide Web
Issue Date: 28-Nov-2013
Abstract: Η παρούσα πτυχιακή εργασία παρουσιάζει τις διαδικτυακές μηχανές αναζήτησης. Οι ψηφιακές συλλογές εγγράφων (π.χ., το World Wide Web, ή ένα εταιρικό ενδοδίκτυο) διαδραματίζουν έναν σημαντικό ρόλο ως πηγές πληροφοριών για τις επιχειρήσεις καθώς επίσης και για την προσωπική χρήση. Τα συστήματα ανάκτησης κειμένων όπως οι μηχανές αναζήτησης βοηθούν το χρήστη στην εύρεση των πληροφοριών σε τέτοιες μεγάλες συλλογές. Σκοπός της εργασίας είναι να παρουσιαστούν οι επιστημονικές υποστηρίξεις της ανάκτησης πληροφοριών. Αρχικά γίνεται μια εισαγωγή στον τομέα της ανάκτησης πληροφοριών (IR) και μιας σύντομης εξήγησης πώς οι μηχανές αναζήτησης Ιστού λειτουργούν. Κατόπιν περιγράφονται αναλυτικά τα τρία σημαντικά βήματα που συμβάλλουν την οικοδόμηση ενός συστήματος IR, όπως το Tokenization, ολοκληρωμένου κειμένου ευρετηρίαση /Full-Text Indexing και μεθόδους ταξινόμησης. Τέλος, παρουσιάζεται ένα σύστημα IR το οποίο το δημιουργήθηκε κατά την διάρκεια της εξάμηνης βιομηχανικής τοποθέτησής μου στην επιχείρηση Parabots στο Άμστερνταμ, η οποία είναι μια επιχείρηση που χτίζει λογισμικό για εύρεση των πληροφοριών από το διαδίκτυο και από μεγάλα σύνολα εγγράφων. Επειδή το λογισμικό ανήκει στην επιχείρηση παρουσίαση αυτού του συστήματος θα καλύψει μόνο τα υψηλού επιπέδου ζητήματα εφαρμογής.
Description: Πτυχιακή εργασία -- Σχολή Τεχνολογικών Εφαρμογών -- Τμήμα Πληροφορικής, 2008-- αα1078
URI: http://195.251.240.227/jspui/handle/123456789/11020
Appears in Collections:Πτυχιακές Εργασίες

Files in This Item:
There are no files associated with this item.



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/11020
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.