OpenMinTED

Open Mining INfrastructure for TExt and Data
Το έργο OpenMinTeD έχει αναπτύξει μια υποδομή που προωθεί και διευκολύνει τη χρήση τεχνολογιών εξόρυξης γνώσης από κείμενο και δεδομένα (text and data mining) κυρίως στον χώρο των επιστημονικών δημοσιεύσεων. Η υποδομή απευθύνεται σε απλούς χρήστες αλλά και σε ειδικούς στις τεχνολογίες εξόρυξης. Το OpenMinTeD αξιοποιεί υφιστάμενα εργαλεία και πλατφόρμες εξόρυξης, τα εντάσσει σε μητρώα ώστε να διευκολύνει την ανεύρεσή τους και τα καθιστά διαλειτουργικά, μέσω ενός επιπέδου διαλειτουργικότητας που βασίζεται σε υπάρχοντα πρότυπα. Το OpenMinTeD περιλαμβάνει δράσεις ευαισθητοποίησης για τα οφέλη της χρήσης των τεχνολογιών εξόρυξης καθώς και κατάρτισης απλών χρηστών και ειδικών ανάπτυξης σχετικών εφαρμογών. Επίσης υλοποιεί και αξιοποιεί μια σειρά περιπτώσεων χρήσης που πρότειναν ερευνητές και εμπειρογνώμονες από διάφορους επιστημονικούς τομείς (βιολογικές επιστήμες (βιοπληροφορική, βιοχημεία κ.λπ.), επιστήμες τροφίμων και γεωργίας, και κοινωνικές και ανθρωπιστικές επιστήμες), για να επιδείξει τα πλεονεκτήματα της ένταξης τεχνολογιών εξόρυξης στην ερευνητική εργασία. Στο έργο συνεργάζονται διάφοροι εμπλεκόμενοι φορείς, όπως φορείς παροχής περιεχομένου και επιστημονικές κοινότητες, φορείς που δραστηριοποιούνται στην ανάπτυξη υποδομών και εφαρμογών εξόρυξης, νομικοί εμπειρογνώμονες, κέντρα δεδομένων και υπολογιστικά κέντρα, βιομηχανικοί φορείς και μικρομεσαίες επιχειρήσεις. Το όραμα του OpenMinTeD είναι η υλοποίηση ενός επιχειρησιακού κύκλου στον οποίο: α) το πρωτογενές περιεχόμενο είναι προσβάσιμο μέσω τυποποιημένων προγραμματιστικών διεπαφών και κανόνων πρόσβασης, β) από καλά τεκμηριωμένες και εύκολα ανευρέσιμες υπηρεσίες εξόρυξης, οι οποίες επεξεργάζονται, αναλύουν και επισημειώνουν κειμενικά δεδομένα με σκοπό να γ) εντοπίσουν επαναλαμβανόμενα μοτίβα και να εξαγάγουν καινούρια γνώση, που θα χρησιμοποιηθεί για δ) την οργάνωση, ευρετηρίαση και αναζήτηση περιεχομένου, και, παράλληλα, ε) θα λειτουργήσει ως νέος πόρος γνώσης χρήσιμος για την ανεύρεση νέων σχέσεων από το περιεχόμενο και την εκκίνηση ενός νέου κύκλου εξόρυξης. Παρά τον αυξανόμενο αριθμό πλατφορμών εξόρυξης γνώσης από κειμενικά και μη δεδομένα που εξυπηρετούν διάφορες επιστημονικές κοινότητες, είναι προφανές ότι θέματα σχετικά με τη διαλειτουργικότητα, τα συστήματα αποθήκευσης πληροφορίας, τους τρόπους διασύνδεσής τους και τους περιορισμούς πρόσβασης περιορίζουν τη διάδοση, τον βαθμό αυτοματοποίησης και τους δυνητικούς τομείς εφαρμογής των τεχνολογιών εξόρυξης. Σήμερα γίνεται πλέον εμφανής η ανάγκη για περαιτέρω ενοποίηση και διαμοιρασμό των υφιστάμενων και νέων πλατφορμών και σχετικών πόρων μέσω μιας ενιαίας υποδομής, που διατρέχει επιστημονικούς κλάδους, χώρες και γλώσσες. Επιπλέον, η αξιοποίηση του πλήρους δυναμικού μιας τέτοιας υποδομής στον χώρο της επιστημονικής βιβλιογραφίας συνδέεται άρρηκτα με το αντίστοιχο σύστημα δημοσιεύσεων και τις συναφείς εθνικές και ευρωπαϊκές υποδομές. Το OpenMinTeD έχει θέσει τα θεμέλια, έχει αναπτύξει και θέσει σε λειτουργία μια ανοιχτή υποδομή και πλατφόρμα εξόρυξης γνώσης από κειμενικά και μη δεδομένα που θα επηρεάσει και, σε ορισμένες περιπτώσεις, θα αλλάξει τους τρόπους διάδρασης και συνεργασίας κοινοτήτων και τεχνολογιών.