Το ChatGPT υποστηρίζει ήδη μια λειτουργία φωνής που επιτρέπει στους χρήστες να αλληλεπιδρούν με το AI χρησιμοποιώντας φωνητικές εντολές. Ωστόσο, είναι μια τυπική λειτουργία φωνής με περιορισμένες δυνατότητες. Τώρα, το OpenAI λανσάρει την πολυαναμενόμενη προηγμένη λειτουργία φωνής, με βελτιωμένο τόνο, νέο περιβάλλον χρήστη, περισσότερες φωνές και πρόσθετες λειτουργίες. Εδώ είναι όλα όσα πρέπει να γνωρίζετε για την προηγμένη λειτουργία φωνής στο ChatGPT, πώς διαφέρει από την τυπική λειτουργία φωνής, τις δυνατότητες που προσφέρει και τους περιορισμούς της.
Ψάχνετε για υπηρεσία VPN; Το private interne taccess έχει μερικές εξαιρετικές προσφορές.
Διαβάστε επίσης :12 Συμβουλές ChatGPT για προγραμματιστές να επιταχύνουν τη ροή εργασίας
Τι είναι η Προηγμένη λειτουργία φωνής;
Η τυπική λειτουργία φωνής μεταγράφει την ομιλία σας σε κείμενο, παρέχει αποτελέσματα και στη συνέχεια μετατρέπει το κείμενο ξανά σε ομιλία. Αντίθετα, η Advanced Voice Mode βασίζεται στις εγγενείς δυνατότητες ήχου του GPT-4o, που σημαίνει ότι επεξεργάζεται απευθείας τον ίδιο τον ήχο. Έτσι, η Standard Voice Mode δεν είναι πραγματικά πολυτροπική στις δυνατότητές της AI, όπως η Advanced Voice Mode.
Ως αποτέλεσμα, η προηγμένη λειτουργία φωνής μπορεί να ακούγεται πιο φυσική στον τόνο της, να κατανοεί τις προφορές, ακόμη και να πιάνει λεκτικές ενδείξεις, όπως η ταχύτητα ομιλίας και να ανταποκρίνεται με συναισθήματα. Αν και δεν είναι διαθέσιμες όλες αυτές οι λειτουργίες επί του παρόντος, η προηγμένη λειτουργία φωνής εξακολουθεί να προσφέρει πολύ καλύτερες δυνατότητες κατανόησης και απόκρισης από την τυπική λειτουργία φωνής.
Πώς διαφέρει η σύνθετη λειτουργία φωνής από την τυπική λειτουργία φωνής
Επί του παρόντος, η προηγμένη λειτουργία φωνής είναι διαθέσιμη για το Plus (το ChatGPT Plus προσφέρει λίγες επιπλέον δυνατότητες) και τους χρήστες της ομάδας. Ωστόσο, δεν είναι ακόμη διαθέσιμο στην ΕΕ, το Ηνωμένο Βασίλειο, την Ελβετία, την Ισλανδία, τη Νορβηγία και το Λιχτενστάιν. Επίσης, προς το παρόν, μπορείτε να έχετε πρόσβαση μόνο από την έκδοση 1.2024.261 ή μεταγενέστερη της εφαρμογής για iPhone και Android του ChatGPT. Τούτου λεχθέντος, εδώ είναι όλες οι δυνατότητες και τα χαρακτηριστικά που προσφέρει η προηγμένη λειτουργία φωνής πέρα από την τυπική λειτουργία φωνής.
1. Νέα διεπαφή χρήστη για προηγμένη λειτουργία φωνής
Το πρώτο πράγμα που θα προσέξετε κατά τη μετάβαση σε Προηγμένη λειτουργία φωνής είναι η ενημερωμένη διεπαφή. Αντί για τις παλιές μαύρες κουκκίδες, θα δείτε μια δυναμική μπλε σφαίρα που πάλλεται καθώς η συζήτηση ρέει. Μια μικρή αλλαγή που σας βοηθά να προσδιορίσετε εάν χρησιμοποιείτε προηγμένη λειτουργία φωνής ή την τυπική.
2. Βελτιωμένοι τόνοι και τόνοι
Η Προηγμένη λειτουργία φωνής χειρίζεται τώρα τις προφορές πολύ καλύτερα από πριν και υποστηρίζει μερικές άλλες γλώσσες εκτός από τα αγγλικά. Ωστόσο, είναι κάτι περισσότερο από την απλή κατανόηση των λέξεων—προσαρμόζει τον τόνο και την προσωδία για να προσφέρει απαντήσεις που είναι φυσικές και ανθρώπινες. Η ικανότητα του AI να διαμορφώνει τον τόνο του και να δίνει έμφαση σε φράσεις-κλειδιά σημαίνει ότι μπορείτε να έχετε πιο ομαλές, πιο ελκυστικές συνομιλίες, ανεξάρτητα από την προφορά σας.
Το Advanced Voice κυκλοφορεί σε όλους τους χρήστες Plus και Team στην εφαρμογή ChatGPT κατά τη διάρκεια της εβδομάδας.
Όσο περιμένατε υπομονετικά, προσθέσαμε Προσαρμοσμένες Οδηγίες, Μνήμη, πέντε νέες φωνές και βελτιωμένους τόνους.
Μπορεί επίσης να πει “Συγγνώμη που άργησα” σε περισσότερες από 50 γλώσσες. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) 24 Σεπτεμβρίου 2024
3. Υποστήριξη διακοπής
Ένα από τα πιο συναρπαστικά χαρακτηριστικά είναι η υποστήριξη διακοπών σε πραγματικό χρόνο. Ακριβώς όπως σε μια κανονική συνομιλία, μπορείτε να κόψετε τη μέση πρόταση χωρίς να περιμένετε να ολοκληρώσει το ChatGPT την απάντησή του. Αυτό κάνει τις συζητήσεις με την τεχνητή νοημοσύνη πιο ρευστές και ανθρώπινες, ειδικά κατά τις μακροσκελείς απαντήσεις. Η δυνατότητα διακοπής είναι μια λειτουργία που μου άρεσε στο Gemini Live περισσότερο από το ChatGPT, αλλά τώρα με την προηγμένη λειτουργία φωνής, είναι διαθέσιμη και στο ChatGPT.
4. Νέες Φωνές
Το OpenAI παρουσίασε πέντε νέες φωνές: Arbor, Maple, Sol, Spruce και Vale, ανεβάζοντας το σύνολο σε εννέα. Δείτε πώς το OpenAI περιγράφει τις φωνές του:
- Arbor – Εύκολη και ευέλικτη
- Breeze – Κινούμενο και σοβαρό
- Cove – Σύνθεση και άμεση
- Ember – Βέβαιος και αισιόδοξος
- Juniper – Ανοιχτό και αισιόδοξο
- Maple – Χαρούμενος και ειλικρινής
- Sol – Καταλαβαίνω και χαλαρό
- Ερυθρελάτη – Ήρεμη και επιβεβαιωτική
- Vale – Φωτεινό και περίεργο
Για να αλλάξετε τη φωνή, ανοίξτε το ChatGPT, μεταβείτε στις Ρυθμίσεις > Φωνή και επιλέξτε αυτό που προτιμάτε.
5. Αναπαραγωγή στο παρασκήνιο
Εδώ είναι ένα άλλο νέο χαρακτηριστικό. Η σύνθετη λειτουργία φωνής υποστηρίζει πλέον την αναπαραγωγή στο παρασκήνιο, επιτρέποντάς σας να συνεχίσετε τις συνομιλίες ενώ χρησιμοποιείτε άλλες εφαρμογές στο τηλέφωνό σας ή ακόμα και όταν το τηλέφωνο είναι κλειδωμένο. Αυτό είναι χρήσιμο εάν θέλετε να ανοίξετε μια ιστοσελίδα για έρευνα ή να χρησιμοποιήσετε μια εφαρμογή σημειώσεων για να καταγράψετε τις σκέψεις κατά τη διάρκεια μιας συνομιλίας με το AI. Για να ενεργοποιήσετε την αναπαραγωγή στο παρασκήνιο, ανοίξτε ChatGPT > Ρυθμίσεις και ενεργοποιήστε την εναλλαγή για Συνομιλίες στο παρασκήνιο.
6. Προσαρμοσμένες οδηγίες και μνήμη στις φωνητικές συνομιλίες
Οι συνομιλίες σας με το ChatGPT μπορούν να εξατομικευτούν με προσαρμοσμένες οδηγίες και λειτουργίες μνήμης. Αυτά σας επιτρέπουν να καθορίσετε πώς θα ανταποκρίνεται το ChatGPT, τον τόνο που πρέπει να χρησιμοποιεί και πράγματα που πρέπει να θυμάται για εσάς. Αν και δεν λειτουργούν με την τυπική λειτουργία φωνής, η προηγμένη λειτουργία φωνής υποστηρίζει πλήρως προσαρμοσμένες οδηγίες και μνήμη. Για να τα ρυθμίσετε, ανοίξτε το ChatGPT εφαρμογή, μεταβείτε στο Ρυθμίσεις > Εξατομίκευσηκαι διαμορφώστε τις προτιμήσεις σας.
7. Ελέγξτε τα δεδομένα των ηχογραφήσεων φωνής σας
Το OpenAI έχει τοποθετήσει το απόρρητο των χρηστών μπροστά και στο κέντρο με αυτήν την ενημέρωση. Έχετε πλέον περισσότερο έλεγχο στις φωνητικές σας ηχογραφήσεις και μπορείτε να διαγράψετε ηχογραφήσεις των συνομιλιών σας. Μπορείτε επίσης να επιλέξετε εάν οι ηχογραφήσεις σας θα χρησιμοποιούνται για την εκπαίδευση του ChatGPT. Για να διαγράψετε μια εγγραφή φωνής, απλώς διαγράψτε τη συνομιλία που έγινε μέσω της λειτουργίας φωνής και ο σχετικός ήχος θα διαγραφεί αυτόματα.
Πόσο καιρό μπορείτε να συνομιλήσετε με τη σύνθετη λειτουργία φωνής
Υπάρχει ένα ημερήσιο όριο για το χρονικό διάστημα που μπορείτε να χρησιμοποιήσετε την προηγμένη λειτουργία φωνής, αν και το OpenAI δεν έχει δώσει συγκεκριμένες λεπτομέρειες. Όταν απομένουν μόνο 15 λεπτά για την ημέρα, θα λάβετε μια ειδοποίηση. Μόλις φτάσετε το ημερήσιο όριο, θα επιστρέψετε στην τυπική λειτουργία φωνής. Η τυπική λειτουργία φωνής έχει επίσης ένα ημερήσιο όριο που συνδέεται με το όριο των μηνυμάτων σας ανά ημέρα. Μόλις συμπληρωθεί το ημερήσιο όριο των 40 μηνυμάτων, δεν θα μπορείτε πλέον να χρησιμοποιείτε την τυπική λειτουργία φωνής.
Μπορείτε να έχετε προηγμένες φωνητικές συνομιλίες με τους GPT σας;
Όχι, δεν μπορείτε να έχετε προηγμένες φωνητικές συνομιλίες με GPT, είτε τις δημιουργήσατε είτε χρησιμοποιείτε αυτές από το GPTStore. Όταν κάνετε κλικ στο εικονίδιο φωνής σε ένα GPT, θα ανοίξει η Τυπική λειτουργία φωνής αντί για προχωρημένη. Μπορείτε να διακρίνετε τη διαφορά καθώς η τυπική λειτουργία φωνής χρησιμοποιεί ένα ασπρόμαυρο περιβάλλον εργασίας με φυσαλίδες, ενώ η προηγμένη λειτουργία χρησιμοποιεί τη νέα μπλε κινούμενη διεπαφή χρήστη.
Προηγμένη λειτουργία φωνής έναντι τυπικής λειτουργίας φωνής
Η Advanced Voice Mode του OpenAI είναι ένα σημαντικό άλμα προς τα εμπρός για να γίνουν οι συνομιλίες AI πιο φυσικές και φιλικές προς το χρήστη. Είτε πρόκειται για τη δυνατότητα διακοπής, το εύρος των φωνητικών επιλογών ή τον έλεγχο των δεδομένων σας, αυτή η ενημέρωση προσφέρει μια πιο εξατομικευμένη εμπειρία που μοιάζει με τον άνθρωπο. Εάν είστε χρήστης ChatGPT Plus ή Enterprise, αξίζει να δοκιμάσετε τη λειτουργία για να δείτε πώς μπορεί να βελτιώσει τις αλληλεπιδράσεις σας.