You are here

About

The spread of the Internet and the creation of the World-Wide Web have
given rise to exciting real- world applications. Data and information
is collected and made available through a huge variety of sources. The
fundamental problem however is to make such data available to the
user, despite the highly heterogeneous nature of the data themselves
and the mechanisms through which the data are now accessible in the
network. In this proposal we are focusing on the very useful and
important case of structured spatiotemporal data, with special
consideration to mobility data, i.e. data that record the movement and
location of people, objects (for example ships or vehicles), and even
events (for example hurricanes or other physical phenomena). The
objective of the MMD project is the development of a peer-to-peer,
distributed, always available and easy to use system to allow the
users to share and search mobility data using the Query by Example
paradigm.

Ελληνική περιγραφή

Σε αυτήν την πρόταση επικεντρωνόμαστε στην πολύ χρήσιμη και σημαντική υπόθεση των δομημένων χωροχρονικών δεδομένων, με ιδιαίτερη μέριμνα για τα δεδομένα κίνησης, δηλαδή δεδομένων που καταγράφουν την κίνηση και τη θέση ανθρώπων, αντικειμένων (για παράδειγμα πλοία ή οχήματα), και ακόμη και γεγονότων (για παράδειγμα τυφώνες ή άλλα φυσικά φαινόμενα). Οι πρόσφατες τεχνολογικές εξελίξεις έχουν επιτρέψει την παραγωγή μεγάλου όγκου χωροχρονικών δεδομένων από ετερογενείς πηγές: από δορυφορικές εικόνες με GPS-enabled συσκευές και αισθητήρες ανίχνευσης. Ωστόσο, είναι η ευρεία διαθεσιμότητα των smartphone και tablet συσκευών που διαθέτουν geolocation και άλλες δυνατότητες ανίχνευσης (π.χ. εγγύτητα, το φως του περιβάλλοντος, επιταχυνσιόμετρο, κάμερα, μικρόφωνο, κλπ.), οι οποίες έχουν δημιουργήσει σημαντικές δυνατότητες για συλλογή, αποθήκευση και ανταλλαγή προσωπικών δεδομένων, δεδομένων οχημάτων, και γενικά στοιχείων κινητικότητας, παρέχοντας νέους τρόπους για ομαδικά συστήματα συλλογής δεδομένων αισθητήρων μέσα από εφαρμογές που τρέχουν στο παρασκήνιο χωρίς να απαιτείται οποιαδήποτε παρέμβαση χρήστη. Παραδείγματα αυτού του νέου μοντέλου είναι η υπηρεσία καταγραφής των σημείων πρόσβασης WiFi της Google που εκτελούνται στα Android smartphones, η οποία καταγράφει γεωγραφικές τοποθεσίες στη βάση δεδομένων της Google, και το σύστημα VTrack [T+09] το οποίο επιτρέπει την εκτίμηση της οδικής κυκλοφορίας σε χρήστες smartphones μέσω της συνεχής ανταλλαγής δεδομένων WiFi. Αυτό το μοντέλο περιλαμβάνει επίσης συστήματα όπως το Ear-Phone [R+11] για την κατασκευή χαρτών θορύβου από εθελοντές χρήστες smartphones οι οποίοι ανταλλάσουν δεδομένα μικροφώνου, το σύστημα PotHole [EGH+08], που επιτρέπει στους χρήστες smartphones να μοιράζονται δεδομένα δόνησης και θέσης, για να γίνει ταυτοποίηση λακουβών σε δρόμους, καθώς και πολλές άλλες εφαρμογές [KKN+11], [DRP+10], [Α+09], [CEL+06]. Ένα κεντρικό πρόβλημα όλων αυτών των διαφορετικών εφαρμογών, οι οποίες αναλύουν τα δεδομένα κίνησης είναι να απαντούν σε ερωτήματα που σχετίζονται με την ομοιότητα της κίνησης μεταξύ των εμπλεκόμενων φορέων. Η ομοιότητa αποτελεί θεμελιώδη λειτουργία εξόρυξης δεδομένων που είναι απαραίτητη όχι μόνο για τη σύγκριση των μεμονωμένων αντικειμένων, αλλά και για την εξόρυξη, ομαδοποίηση και ταξινόμηση των χωροχρονικών δεδομένων η οποία, είναι ένας βασικός παράγοντας που επιτρέπει την αποτελεσματική διαχείριση της δυναμικής λήψης αποφάσεων σε τομείς που κυμαίνονται από διαχείριση κυκλοφορίας, παρακολούθησης καιρού, και χημικές αντιδράσεις. Το κλειδί είναι να δημιουργηθούν αποτελεσματικοί, εύκολοι στη χρήση, και ακριβείς μηχανισμοί αναζήτησης και ανάκτησης των δεδομένων κίνησης. Το έργο αυτό δεν είναι εύκολο, επειδή τα δεδομένα δεν διαμένουν στην ίδια θέση, μπορεί να είναι ανομοιογενή, και, κυρίως, η έννοια της ομοιότητας μπορεί να εξαρτάται από την εφαρμογή ή τον χρήστη. Ωστόσο, η απρόσμενη επιτυχία της αναζήτησης λέξεων-κλειδιών, όπως αποδεικνύεται από την Google και άλλες μηχανές αναζήτησης σήμερα, δείχνει πόσο ισχυρή μπορεί να είναι μια απλή και εύκολη στην κατανόηση ανθρώπινη διεπαφή όταν συνδυάζεται με εξελιγμένες τεχνικές ανάλυσης. Δείχνει επίσης πόσο σημαντικό είναι να παρέχονται παρόμοιες δυνατότητες για τα δισεκατομμύρια των δεδομένων, συμπεριλαμβανομένων της κινητικότητας ή τροχιές, που είναι σήμερα διαθέσιμα στο διαδίκτυο. Όπως και στην περίπτωση κειμένου, οι μηχανισμοί ευρετηρίασης πρέπει να είναι σε θέση να αναζητούν και να ανακτούν τις σχετικές πληροφορίες, δηλαδή, είναι απαραίτητο να είναι σε θέση να ψάξουν για έννοιες, όχι μόνο σύνταξη. Υποστηρίζουμε ότι το μοντέλο «ερώτημα με παράδειγμα» (Query by Example) αποτελεί την κατάλληλη μέθοδο για το περιβάλλον μας. Σε αυτό το μοντέλο ο χρήστης παρέχει, ενδεχομένως, κατά προσέγγιση, δείγμα του τι αυτός/αυτή ψάχνει, και η μηχανή αναζήτησης αποδίδει τα πιο παρόμοια δεδομένα. Το μοντέλο είναι γενικό και αρκετά αρκετά απλό ώστε να μπορεί να ενσωματωθεί σε μια γενική, εύκολη στη χρήση μηχανή αναζήτησης, δεδομένου ότι ο χρήστης δεν είναι υποχρεωμένος να γνωρίζει λεπτομέρειες για τον τομέα ή τεχνικές λεπτομέρειες για τα έγγραφα. Θα μελετήσουμε τους ακόλουθους μηχανισμούς: (i) ο χρήστης εισάγει χειροκίνητα ένα, πιθανώς ελλιπές ή ανακριβές, ερώτημα, (ii) ο χρήστης παρέχει μια (μερική ή ολική) υφιστάμενη τροχιά ενός αντικειμένου. Και στις δύο περιπτώσεις, ο στόχος είναι να προσδιοριστούν τα πιο παρόμοια αντικείμενα.
Στόχος: Στην πρόταση αυτή, θα αναπτύξουμε ένα πλαίσιο αναζήτησης δεδομένων κίνησης, που ονομάζεται MMD, το οποίο θα μας επιτρέψει να μοντελοποιήσουμε τα χωροχρονικά δεδομένα κίνησης, θα δώσει τη δυνατότητα στο χρήστη να προσδιορίσει τα αντικείμενα ή τα σχέδια (patterns) κινητικότητας ενδιαφέροντος, να στηρίξει αυτοματοποιημένη εύρεση του συνόλων δεδομένων ώστε να προσδιορίσουν δραστηριότητες παρόμοιες με αυτές που καθορίζονται από το χρήστη. Θα διερευνήσουμε τεχνικές για την αποτελεσματική εκτέλεση προηγμένων χωροχρονικών ερωτημάτων για τη σύγκριση των χωροχρονικών δραστηριοτήτων, για την ανακάλυψη πληροφορίας σε μεγάλες βάσεις δεδομένων, και για τον προσδιορισμό ενδιαφέροντων προτύπων συμπεριφοράς. Σκεφτείτε για παράδειγμα την εκτέλεση των ερωτημάτων ομοιότητας με τη μορφή: "Αναφέρετε τους χρήστες που μετακινούνται όμοια με τον Q", όπου Q μπορεί να είναι ένα ερώτημα που περιγράφεται από ένα χρήστη ή μια μερική τροχιά αντικειμένου. Το πλαίσιο επιτρέπει τη χρήση διαφορετικών εννοιών ομοιότητας ώστε να απεικονίζει τροχιές, και επιτρέπει επίσης την εκμάθηση της σωστής συνάρτησης ομοιότητας. Το πλαίσιο που ορίζουμε μας επιτρέπει την εκτέλεση των εν λόγω ερωτήματων τόσο σε κατανεμημένα περιβάλλοντα (για παράδειγμα, όταν τα δεδομένα ενός συγκεκριμένου ατόμου μπορεί να είναι τροχιές που δημιουργήθηκαν με χρήση GPS), και σε κεντρικοποιημένα περιβάλλοντα. Στην περίπτωση του κατανεμημένου συστήματος, αυτό γίνεται χωρίς να αποκαλυφθούν τα ίχνη των χρηστών που συμμετέχουν. Το πλαίσιο μας μπορεί να χρησιμοποιηθεί σε μεγάλης κλίμακας εφαρμογές αστικού σχεδιασμού, οι οποίες διαφορετικά θα περιοριζόταν από περιορισμούς δημοσιοποίησης των δεδομένων [USD08], [Z+08], εφαρμογές κοινωνικής δικτύωσης για smartphones [SRA10], [ZZX+09], συστήματα παρακολούθησης κατοίκων [LSZ+04] και άλλα.

Αναμενόμενα Αποτελέσματα: Το σύστημα MMD στοχεύει σε ένα θεμελιώδες βήμα για την αποθήκευση, αναζήτηση και ευρετηρίαση χρονοσειρών και δεδομένων τροχιάς. Πιο συγκεκριμένα:
• Ανάπτυξη ιεραρχικής αναπαράστασης τροχιών για αποδοτική αναζήτηση με γεωγραφικά ερωτήματα και ομοιότητας πορείας. Σχεδιασμός μηχανισμών που επιτρέπουν τη μάθηση των συναρτήσεων ομοιότητας με input του χρήστη.
• Σχεδιασμός κατανεμημένου συστήματος χρησιμοποιώντας το MapReduce μοντέλο που επιτρέπει τη συλλογή, αποθήκευση και ανάκτηση δεδομένων κίνησης που συλλέγονται και αποθηκεύονται στα smartphones. Σχεδιασμός και κατασκευή κατανεμημένων δεικτών ομοιότητας που είναι γρήγοροι στην εκτέλεση και κάνουν αποτελεσματική διαχείριση των πόρων.