Alexa, Siri και Google Δεν καταλαβαίνεις ένα λένε που λέτε

Αμαζόνα

Βοηθοί φωνής όπως η Alexa, ο Βοηθός Google και το Siri έρχονται πολύ μακριά τα τελευταία χρόνια. Αλλά, για όλες τις βελτιώσεις τους, ένα πράγμα τους κρατά πίσω: Δεν σας καταλαβαίνουν. Βασίζονται υπερβολικά σε συγκεκριμένες φωνητικές εντολές.

Η αναγνώριση ομιλίας είναι απλά ένα μαγικό τέχνασμα

Αμαζόνα

Οι βοηθοί φωνής δεν σας καταλαβαίνουν. Όχι πραγματικά, ούτως ή άλλως. Όταν μιλάτε σε ένα Google Home ή Amazon Echo, ουσιαστικά μετατρέπει τις λέξεις σας σε μια συμβολοσειρά κειμένου και στη συνέχεια συγκρίνει αυτό με τις αναμενόμενες εντολές. Αν βρει ακριβή αντιστοιχία, τότε ακολουθεί ένα σύνολο οδηγιών. Εάν δεν το κάνει, ψάχνει για μια εναλλακτική λύση για το τι πρέπει να κάνει με βάση τις πληροφορίες που έχει και αν αυτό δεν λειτουργεί, λαμβάνετε ένα μήνυμα αποτυχίας όπως "Λυπάμαι, αλλά δεν το ξέρω "Είναι λίγο περισσότερο από το χτύπημα της μαγείας των χεριών για να σας ξεγελάσουμε να νομίζετε ότι καταλαβαίνει.

Δεν μπορεί να χρησιμοποιήσει στοιχεία συμφραζομένων για να κάνει την καλύτερη εικασία ή ακόμα και να χρησιμοποιήσει την κατανόηση παρόμοιων θεμάτων για να ενημερώσει τις αποφάσεις της. Δεν είναι δύσκολο να καταρρίψουμε τους βοηθούς φωνής. Ενώ μπορείτε να ζητήσετε από την Alexa "Εργάζεστε για την NSA;" και να πάρετε μια απάντηση, εάν ρωτήσετε "Είστε μυστικό μέρος της NSA;" παίρνετε μια απάντηση "Δεν ξέρω ότι μία" (τουλάχιστον στο ώρα αυτού του γραψίματος).

Οι άνθρωποι, που πραγματικά καταλαβαίνουν την ομιλία, δεν δουλεύουν έτσι. Ας υποθέσουμε ότι ρωτάς έναν άνθρωπο: "Τι είναι αυτό το κλαβαίν στον ουρανό; Αυτός που είναι τοξωτός και γεμάτος ριγωτά χρώματα όπως το κόκκινο, το πορτοκαλί, το κίτρινο και το μπλε. "Παρά το ότι ο κlarvain είναι μια φτιαγμένη λέξη, το πρόσωπο που ρωτήσατε θα μπορούσε πιθανότατα να καταλάβει από το πλαίσιο ότι περιγράφετε ένα ουράνιο τόξο.

Ενώ θα μπορούσατε να υποστηρίξετε ότι ένας άνθρωπος μετατρέπει την ομιλία σε ιδέες, τότε ένας άνθρωπος μπορεί να εφαρμόσει τη γνώση και την κατανόηση για να ολοκληρώσει μια απάντηση. Εάν ρωτήσετε έναν άνθρωπο εάν εργάζονται κρυφά για την NSA, θα σας δώσουν μια ναι ή όχι απάντηση, ακόμα κι αν η απάντηση είναι ψέμα. Ένας άνθρωπος δεν θα έλεγε "δεν το ξέρω αυτό" σε μια τέτοια ερώτηση. Ότι οι άνθρωποι μπορούν να ψέψουν είναι κάτι που έρχεται με πραγματική κατανόηση.

Οι βοηθοί φωνής δεν μπορούν να ξεπεράσουν τον προγραμματισμό τους

Οι βοηθοί φωνής περιορίζονται τελικά σε προγραμματισμένες αναμενόμενες παραμέτρους και η περιπλάνηση εκτός αυτών θα σπάσει τη διαδικασία. Το γεγονός αυτό δείχνει πότε έρχονται τα παιχνίδια τρίτων. Συνήθως, η εντολή αλληλεπίδρασης με αυτά είναι πολύ δύσκαμπτη, που σημαίνει "πείτε στον κατασκευαστή της συσκευής να διοχετεύει προαιρετικό επιχείρημα." Ένα ακριβές παράδειγμα θα ήταν: "Πείτε στο Whirlpool να σταματήσει το στεγνωτήριο." Για ένα ακόμη πιο δύσκολο να θυμηθούμε παράδειγμα, η Geneva Alexa η ικανότητα ελέγχει μερικούς φούρνους GE. Ένας χρήστης της δεξιότητας πρέπει να θυμάται να "πείτε στη Γενεύη" όχι "να πείτε GE" τότε η υπόλοιπη εντολή. Και ενώ μπορείτε να ζητήσετε να προθερμάνετε το φούρνο στους 350 μοίρες, δεν μπορείτε να ακολουθήσετε το αίτημα για αύξηση της θερμοκρασίας κατά 50 μοίρες. Ένας άνθρωπος θα μπορούσε να ακολουθήσει αυτά τα αιτήματα εν τούτοις.

Amazon και Google έχουν εργαστεί πολύ σκληρά για να ξεπεράσουν αυτά τα εμπόδια, και δείχνει. Όταν κάποτε έπρεπε να ακολουθήσετε την παραπάνω ακολουθία για να ελέγξετε μια έξυπνη κλειδαριά, τώρα μπορείτε να πείτε "κλειδώστε την μπροστινή πόρτα". Η Alexa ήταν μπερδεμένη με το "μου λέει ένα αστείο σκυλί", αλλά ζητώ ένα σήμερα και θα λειτουργήσει. Έχουν προσθέσει παραλλαγές στις εντολές που χρησιμοποιείτε, αλλά τελικά πρέπει ακόμα να γνωρίζετε τη σωστή εντολή να πουν. Πρέπει να χρησιμοποιήσετε τη σωστή σύνταξη με τη σωστή σειρά.

Και αν νομίζετε ότι ακούγεται πολύ σαν γραμμή εντολών, δεν κάνετε λάθος.

Οι Βοηθοί Φωνής είναι μια φανταστική γραμμή εντολών

Μια γραμμή εντολών ορίζεται στενά για την εκτέλεση απλών εργασιών, αλλά μόνο αν γνωρίζετε την σωστή σύνταξη. Αν γλιστρήσετε από τη σωστή σύνταξη και πληκτρολογήσετε dyr αντί για dir, τότε η γραμμή εντολών θα σας δώσει ένα μήνυμα σφάλματος. Μπορείτε να χρησιμοποιήσετε ψευδώνυμα για πιο εύκολα να θυμάστε τις εντολές, αλλά πρέπει να έχετε μια ιδέα για το τι ήταν οι αρχικές εντολές, πώς λειτουργούν και πώς να χρησιμοποιείτε τα ψευδώνυμα αποτελεσματικά. Εάν δεν παίρνετε το χρόνο να μάθετε τα μέσα και έξω από την γραμμή εντολών, δεν θα πάρετε ποτέ πολλά από αυτό.

Οι βοηθοί φωνής δεν διαφέρουν. Πρέπει να γνωρίζετε τον σωστό τρόπο να πείτε μια εντολή ή να θέσετε μια ερώτηση. Και πρέπει να ξέρετε πώς να δημιουργήσετε ομάδες για το Google και την Alexa, γιατί η ομαδοποίηση των συσκευών σας είναι απαραίτητη και πώς να ονομάσετε τις έξυπνες συσκευές σας. Εάν δεν ακολουθήσετε αυτά τα απαραίτητα βήματα, θα αισθανθείτε την απογοήτευση να ζητήσετε από τον βοηθό φωνής σας να απενεργοποιήσει τη μελέτη μόνο για να του ζητηθεί "ποια μελέτη" πρέπει να απενεργοποιηθεί.

Ακόμη και όταν χρησιμοποιείτε τη σωστή σύνταξη με τη σωστή σειρά, η διαδικασία ενδέχεται να αποτύχει. Είτε με τη λανθασμένη απάντηση που εκδόθηκε είτε με ένα εκπληκτικό αποτέλεσμα. Δύο Google Homes στο ίδιο σπίτι μπορεί να δίνουν καιρικές συνθήκες σε διαφορετικές τοποθεσίες, παρόλο που έχουν πρόσβαση στις ίδιες πληροφορίες λογαριασμού χρήστη και σύνδεση στο διαδίκτυο.

Στο παραπάνω παράδειγμα, δίνεται η εντολή "Ρύθμιση χρονιστή για μισή ώρα". Ο κεντρικός κόμβος Google δημιούργησε ένα χρονόμετρο με το όνομα "Ώρα" και στη συνέχεια ρώτησε για πόσο χρονικό διάστημα θα πρέπει να είναι ο χρονοδιακόπτης. Και επαναλαμβάνοντας την ίδια εντολή τρεις άλλες φορές δούλεψε σωστά και δημιούργησε ένα χρονόμετρο 30 λεπτών. Χρησιμοποιώντας την εντολή "Ορισμός χρονομέτρου για 30 λεπτά" λειτουργεί σωστά σε πιο σταθερή βάση.

Ενώ η ομιλία σε ένα σπίτι ή ηχώ της Google μπορεί να είναι πιο ρευστό, κάτω από τους βοηθούς φωνής της κουκούλας και τις γραμμές εντολών λειτουργούν με τον ίδιο τρόπο. Μπορεί να μην χρειάζεται να μάθετε μια νέα γλώσσα, αλλά πρέπει να μάθετε μια νέα διάλεκτο.

Η στενή κατανόηση των φωνητικών βοηθών θα περιορίσει την ανάπτυξη

Τίποτα από αυτά δεν εμποδίζει τους βοηθούς φωνής όπως ο Βοηθός Google και η Alexa να δουλεύουν αρκετά καλά (αν και η Cortana είναι μια διαφορετική ιστορία). Βοηθός Google και Alexa και αναζητήστε on-line για ερωτήσεις αξιοπρεπώς, αν και δεν αποτελεί έκπληξη το Google είναι καλύτερα στην αναζήτηση και μπορεί να απαντήσει σε βασικές ερωτήσεις όπως μετατροπές μέτρησης και απλά μαθηματικά. Με ένα σωστά τοποθετημένο έξυπνο σπίτι και άρτια καταρτισμένο χρήστη, οι περισσότερες έξυπνες εντολές στο σπίτι θα λειτουργήσουν σύμφωνα με τον προορισμό τους. Αλλά αυτό ήρθε μέσω εργασίας και προσπάθειας, όχι διανοητικής κατανόησης.

Οι χρονομετρητές και οι συναγερμοί ήταν απλοϊκοί. Με την πάροδο του χρόνου προστέθηκε η ονομασία, κατόπιν η δυνατότητα να προσθέσετε χρόνο σε ένα χρονόμετρο. Κινούσαν από απλοϊκή σε πιο περίπλοκη. Οι βοηθοί φωνής μπορούν να απαντήσουν σε περισσότερες ερωτήσεις και κάθε μέρα φέρνουν νέες δεξιότητες και χαρακτηριστικά. Αλλά αυτό δεν είναι προϊόν αυτο-ανάπτυξης που προέρχεται από την εκμάθηση και την κατανόηση.

Και τίποτα από αυτά δεν προσφέρει την εγγενή δυνατότητα να χρησιμοποιήσει αυτό που είναι γνωστό ότι φτάνει στο άγνωστο. Για κάθε εντολή και ερώτηση που δουλεύει, θα υπάρχουν πάντα τρεις που δεν το κάνουν. Χωρίς μια σημαντική ανακάλυψη στην Α.Ι. που παρέχει ανθρώπινη ικανότητα κατανόησης, οι βοηθοί φωνής δεν είναι καθόλου βοηθοί. Είναι απλά γραμμές φωνητικής εντολής - χρήσιμες στο σωστό σενάριο αλλά περιορίζονται σε εκείνα τα σενάρια που έχουν προγραμματιστεί να κατανοήσουν.

Με άλλα λόγια: οι μηχανές μαθαίνουν τα πράγματα, αλλά δεν μπορούν να τα καταλάβουν.