Τι είναι η επίθεση Man-in-the-Prompt και πώς να προστατευτείτε

Εμπιστεύεστε την Τεχνητή Νοημοσύνη σας να ακολουθήσει τις οδηγίες σας, αλλά τι γίνεται αν κάποιος άλλος τις τροποποιήσει κρυφά; Μια νέα επίθεση επιτρέπει σε κακόβουλους παράγοντες να καταλάβουν τις οδηγίες σας, με αποτέλεσμα το LLM να επιστρέφει παραπλανητικές ή επιβλαβείς απαντήσεις που κλέβουν δεδομένα ή εξαπατούν τους χρήστες. Ας εξερευνήσουμε πώς λειτουργεί αυτή η επίθεση man-in-the-prompt και πώς μπορείτε να αμυνθείτε εναντίον της.

⚠️ Το ψηφιακό σας δακτυλικό αποτύπωμα (διεύθυνση IP) είναι εκτεθειμένο!

Η διεύθυνση IP σας είναι: ανίχνευση…

Κάντε streaming/λήψη ανώνυμα με το Private Internet Access.

🌐 Μόνο 1,99€ / μήνα + 2 μήνες δώρο

Δεν αποθηκεύουμε τη διεύθυνση IP σας. Η ανίχνευση γίνεται τοπικά στον browser σας.

Ακολουθήστε το κανάλι του Tech στο Telegram

Οι πληροφορίες που περιέχονται στο techvortex.eu προορίζονται μόνο για γενικούς σκοπούς πληροφόρησης.

Τι είναι μια επίθεση τύπου “Man-in-the-Prompt”;

Όπως και με μια επίθεση man-in-the-middle, μια επίθεση man-in-the-prompt αναχαιτίζει την αλληλεπίδρασή σας με ένα εργαλείο μεγάλου γλωσσικού μοντέλου (LLM), όπως τα AI chatbots, για να επιστρέψει μια απροσδόκητη απάντηση. Μπορούν να εισάγουν μια ορατή ή ακόμα και μια αόρατη προτροπή μαζί με την προτροπή σας, για να δώσουν εντολή στον LLM να αποκαλύψει μυστικές πληροφορίες ή να παράσχει μια κακόβουλη απάντηση.

Μέχρι στιγμής, οι επεκτάσεις του προγράμματος περιήγησης είναι ο κύριος φορέας επίθεσης για αυτήν την επίθεση. Αυτό συμβαίνει κυρίως επειδή η είσοδος και η έξοδος των προτροπών LLM αποτελούν μέρος του Μοντέλου Αντικειμένου Εγγράφου (DOM) της σελίδας, στο οποίο οι επεκτάσεις του προγράμματος περιήγησης μπορούν να έχουν πρόσβαση χρησιμοποιώντας βασικά δικαιώματα. Ωστόσο, αυτή η επίθεση μπορεί επίσης να εκτελεστεί χρησιμοποιώντας άλλες μεθόδους, όπως η χρήση ενός εργαλείου δημιουργίας προτροπών για την εισαγωγή κακόβουλων οδηγιών.

Τα ιδιωτικά LLM, όπως και σε ένα εταιρικό περιβάλλον, είναι πιο ευάλωτα σε αυτήν την επίθεση, καθώς έχουν πρόσβαση σε ιδιωτικά δεδομένα εταιρειών, όπως κλειδιά API ή νομικά έγγραφα. Τα εξατομικευμένα εμπορικά chatbot είναι επίσης ευάλωτα, καθώς μπορούν να διατηρούν ευαίσθητες πληροφορίες. Για να μην αναφέρουμε ότι τα LLM μπορούν να εξαπατηθούν ώστε να πουν στον χρήστη να κάνει κλικ σε έναν κακόβουλο σύνδεσμο ή να εκτελέσει κακόβουλο κώδικα, όπως μια επίθεση FileFix ή Eddiestealer.

Αν θέλετε να βεβαιωθείτε ότι το AI chatbot σας δεν θα χρησιμοποιηθεί εναντίον σας, παρακάτω θα βρείτε μερικούς τρόπους για να προστατευτείτε.

Αστυνόμευση επεκτάσεων προγράμματος περιήγησης

Ενώ οι επεκτάσεις του προγράμματος περιήγησης είναι ο κύριος ένοχος, είναι δύσκολο να εντοπιστεί μια επίθεση man-in-the-prompt, καθώς η επέκταση δεν απαιτεί ειδικά δικαιώματα για την εκτέλεσή της. Το καλύτερο που έχετε να κάνετε είναι να αποφύγετε την εγκατάσταση τέτοιων επεκτάσεων. Ή, αν πρέπει, εγκαταστήστε μόνο επεκτάσεις από αξιόπιστους εκδότες που εμπιστεύεστε.

Μπορείτε επίσης να παρακολουθείτε τη δραστηριότητα παρασκηνίου της επέκτασης για να λαμβάνετε ενδείξεις. Όταν χρησιμοποιείτε ένα LLM, πατήστε τα πλήκτρα Shift+ Escγια να ανοίξετε τη Διαχείριση εργασιών του προγράμματος περιήγησης. Δείτε αν κάποια επέκταση αρχίζει να εκτελεί τις διεργασίες της ακόμα και όταν δεν υποτίθεται ότι λειτουργεί εκεί. Αυτό θα μπορούσε να υποδηλώνει ότι αλλάζει την προτροπή, ειδικά αν συμβαίνει μόνο όταν γράφετε στο πεδίο κειμένου του chatbot.

Διαδικασίες Διαχείρισης Εργασιών Περιηγητή

Επιπλέον, αποφύγετε τη χρήση επεκτάσεων που αλληλεπιδρούν άμεσα με τα εργαλεία LLM ή τροποποιούν μηνύματα. Ενδέχεται να λειτουργούν καλά στην αρχή, αλλά αργότερα ενδέχεται να αρχίσουν να κάνουν κακόβουλες αλλαγές.

Χειροκίνητη εισαγωγή ερωτημάτων και έλεγχος πριν από την αποστολή

Πολλά διαδικτυακά εργαλεία προτροπών μπορούν να επεξεργαστούν τις προτροπές σας για καλύτερα αποτελέσματα ή να παρέχουν πρότυπα προτροπών. Αν και είναι χρήσιμα, αυτά τα εργαλεία μπορούν επίσης να εισάγουν κακόβουλες οδηγίες στις προτροπές σας και δεν χρειάζονται άμεση πρόσβαση στο πρόγραμμα περιήγησης/τη συσκευή σας.

Προσπαθήστε να γράφετε χειροκίνητα μηνύματα στο παράθυρο του chatbot με τεχνητή νοημοσύνη και να ελέγχετε πάντα πριν πατήσετε το Enter. Εάν πρέπει να αντιγράψετε από άλλη πηγή, πρώτα επικολλήστε το σε ένα πρόγραμμα επεξεργασίας απλού κειμένου, όπως η εφαρμογή Σημειωματάριο στα Windows, και στη συνέχεια επικολλήστε το στο chatbot. Αυτό θα διασφαλίσει ότι θα αποκαλυφθούν τυχόν κρυφές οδηγίες. Εάν υπάρχουν κενά, βεβαιωθείτε ότι χρησιμοποιείτε το Backspaceπλήκτρο για να τα αφαιρέσετε.

Εάν χρειάζεται να χρησιμοποιήσετε πρότυπα προτροπής, δημιουργήστε τα δικά σας και φυλάξτε τα με ασφάλεια σε μια εφαρμογή σημειώσεων αντί να βασίζεστε σε πηγές τρίτων. Αυτές οι πηγές μπορούν να εισαγάγουν κακόβουλες οδηγίες αργότερα, όταν αρχίσετε να τις εμπιστεύεστε.

Ξεκινήστε νέες συνεδρίες συνομιλίας όποτε είναι δυνατόν

Οι επιθέσεις man-in-the-prompt μπορούν επίσης να κλέψουν πληροφορίες από μια τρέχουσα συνεδρία. Εάν έχετε κοινοποιήσει ευαίσθητες πληροφορίες στον υπεύθυνο LLM, είναι καλύτερο να ξεκινήσετε μια νέα συνεδρία συνομιλίας όταν αλλάξει το θέμα. Αυτό θα διασφαλίσει ότι ο υπεύθυνος LLM δεν θα αποκαλύψει ευαίσθητες πληροφορίες ακόμη και σε περίπτωση επίθεσης man-in-the-prompt.

Το αριστερό πλαίσιο του ChatGPT εμφανίζει νέα συνομιλία

Επιπλέον, εάν συμβεί μια τέτοια επίθεση, μια νέα συνομιλία μπορεί να την εμποδίσει να επηρεάσει περαιτέρω την συνεδρία.

Ελέγξτε τις απαντήσεις του μοντέλου

Όταν χρησιμοποιείτε chatbot τεχνητής νοημοσύνης, μην πιστεύετε όλα όσα απαντά. Πρέπει να είστε πολύ επιφυλακτικοί με την απάντηση του LLM, ειδικά όταν εντοπίσετε τυχόν ανωμαλίες. Εάν το chatbot σας δώσει ξαφνικά ευαίσθητες πληροφορίες χωρίς να το ρωτήσετε, θα πρέπει να κλείσετε αμέσως τη συνομιλία ή τουλάχιστον να ανοίξετε μια νέα συνεδρία. Οι περισσότερες οδηγίες man-in-the-prompt είτε θα αγνοήσουν πλήρως την αρχική προτροπή είτε θα ζητήσουν τις πρόσθετες πληροφορίες σε ξεχωριστή ενότητα στο τέλος.

Επιπλέον, μπορούν επίσης να ζητήσουν από τον LLM να απαντήσει με ασυνήθιστο τρόπο για να μπερδέψει τον χρήστη, όπως να βάλει τις πληροφορίες σε ένα μπλοκ επεξεργασίας κώδικα ή σε έναν πίνακα. Εάν παρατηρήσετε τέτοιες ανωμαλίες, πρέπει αμέσως να υποθέσετε ότι πρόκειται για επίθεση man-in-the-prompt.

Η είσοδος σε επιθέσεις Man-in-the-Prompt είναι πολύ εύκολη σε εταιρικά περιβάλλοντα, καθώς οι περισσότερες εταιρείες δεν ελέγχουν τις επεκτάσεις του προγράμματος περιήγησης των υπαλλήλων. Για μέγιστη ασφάλεια, μπορείτε επίσης να δοκιμάσετε να χρησιμοποιήσετε LLM σε κατάσταση ανώνυμης περιήγησης με απενεργοποιημένες τις επεκτάσεις. Ενώ το κάνετε αυτό, βεβαιωθείτε ότι έχετε προστατεύσει από επιθέσεις slopsquatting που εκμεταλλεύονται την παραίσθηση της τεχνητής νοημοσύνης.