Τρίτη 2 Σεπτεμβρίου 2014

ΜΗΧΑΝΙΚΗ ΟΡΑΣΗ

Η μηχανική όρασηυπολογιστική όραση ή τεχνητή όραση είναι ένα επιστημονικό πεδίο
της τεχνητής νοημοσύνης το οποίο επιχειρεί να αναπαράγει αλγοριθμικά την αίσθηση της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή ρομπότ. Η μηχανική όραση σχετίζεται με τη θεωρία και την τεχνολογία που εμπλέκονται στη σχεδίαση και κατασκευή συστημάτων που λαμβάνουν και αναλύουν δεδομένα από ψηφιακές εικόνες. Τα εν λόγω δεδομένα μπορούν να είναι φωτογραφίεςβίντεο, όψεις από πολλαπλές κάμερες, πολυδιάστατες εικόνες από ιατρικό σαρωτή κλπ.
Η μηχανική όραση επιδιώκει να εφαρμόσει θεωρίες και μοντέλα στην κατασκευή μηχανικών συστημάτων με δυνατότητα όρασης. Παραδείγματα εφαρμογών τέτοιων συστημάτων είναι τα εξής:
  1. Έλεγχος διαδικασιών (π.χ. ένα βιομηχανικό ρομπότ ή ένα αυτόνομο όχημα)
  2. Ανίχνευση συμβάντων (π.χ. οπτική επιτήρηση)
  3. Οργάνωση πληροφοριών (π.χ. ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων)
  4. Εξομοίωση αντικειμένων και περιβαλλόντων (π.χ. βιομηχανική επιθεώρηση, ιατρική ανάλυση εικόνας ή τοπογραφική εξομοίωση)
  5. Αλληλεπίδραση χρηστών με υπολογιστικά συστήματα (π.χ. ως είσοδος σε μια συσκευή επικοινωνίας ανθρώπου / μηχανής).
Η μηχανική όραση μπορεί επίσης να περιγραφεί ως συμπλήρωμα (αλλά όχι απαραιτήτως αντίθετο) της βιολογικής όρασης. Στην τελευταία, μελετώνται η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών. Η μηχανική όραση από την άλλη μελετά και περιγράφει το τεχνητά συστήματα όρασης που εφαρμόζονται σε λογισμικό ή/και σε υλικό υπολογιστών. Η διεπιστημονική ανταλλαγή μεταξύ της βιολογικής και υπολογιστικής όρασης αποδεικνύεται όλο και περισσότερο καρποφόρα και για τους δύο τομείς.

Αντικείμενα και σχέση με άλλα επιστημονικά πεδία

Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την κατανόηση σκηνής, την ανίχνευση συμβάντων, την ανίχνευση κίνησης, την αναγνώριση αντικειμένων, τηνευρετηριοποίηση, την αναγνώριση κίνησης και την τριδιάστατη ανακατασκευή (παραγωγή τριδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο). Σε σχέση με άλλα, συγγενή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
  • Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν ως έξοδο εικόνες / βίντεο.
  • Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται ως είσοδο συμβολικές περιγραφές οπτικών σκηνών και παράγουν ως έξοδο εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
  • Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών σκηνών.
  • Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης, είναι ουσιαστικά εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου