18.9 C
Nicosia
Πέμπτη 28 Μάρτιος 2024 | 19:17

Τεχνητή νοημοσύνη έμαθε να κερδίζει παιχνίδια της δεκαετίας του 1980

Επιστήμονες ανέπτυξαν ενα πρόγραμμα υπολογιστή που μπορεί να κερδίζει μια σειρά παιχνιδιών πλατφόρμας/ εξερεύνησης της δεκαετίας του 1980, ανοίγοντας έτσι των δρόμο για πιο αυτόνομα ρομπότ.

Όπως γράφει το BBC, οι ερευνητές δημιούργησαν μια «οικογένεια» αλγορίθμων ικανών να κερδίζουν κλασικά παιχνίδια στο Atari, όπως το Pitfall. Στο παρελθόν αυτά τα παιχνίδια ήταν δύσκολο να κερδηθούν μέσω τεχνητής νοημοσύνης (ΑΙ).

Οι αλγόριθμοι αυτοί θα μπορούσαν να βοηθήσουν ρομπότ να πλοηγούνται καλύτερα σε περιβάλλοντα πραγματικού κόσμου- κάτι που συνεχίζει να αποτελεί σημαντική πρόκληση στους τομείς της ρομποτικής και της τεχνητής νοημοσύνης. Τα επίμαχα περιβάλλοντα περιλαμβάνουν περιοχές που έχουν πληγεί από καταστροφές, όπου τα ρομπότ θα μπορούσαν να αποστέλλονται προς αναζήτηση επιζώντων, ή ακόμα και το μέσο σπίτι.

Η συγκεκριμένη έρευνα εντάσσεται στο ευρύτερο πλαίσιο της έρευνας τεχνητής νοημοσύνης που είναι γνωστή ως reinforcement learning. Κάποια από τα παιχνίδια που χρησιμοποιήθηκαν στην έρευνα θέλουν ο παίκτης να εξερευνά λαβυρίνθους που περιέχουν ανταμοιβές, εμπόδια και κινδύνους. Η οικογένεια των αλγορίθμων, που είναι γνωστή συλλογικά ως Go-Explore, έχει δώσει σημαντικές βελτιώσεις σε σχέση με προηγούμενες προσπάθειες για να κερδίζονται τέτοια παιχνίδια- όπως πχ τα Montezuma’s Revenge, Freeway και Pitfall.

Μεταξύ άλλων, οι ερευνητές ανέπτυξαν αλγορίθμους που μπορούσαν να δημιουργούν αρχεία περιοχών που είχαν ήδη επισκεφθεί. «Η μέθοδός μας είναι όντως πολύ απλή και άμεση, αν και αυτό ισχύει συχνά με τα επιστημονικά επιτεύγματα» δήλωσαν στο BBC οι ερευνητές Αντριέν Εκοφέτ, Τζουστ Χουϊζίνγκα και Τζεφ Κλουν. «Ο λόγος που η προσέγγισή μας δεν είχε εξεταστεί στο παρελθόν είναι πως διαφέρει πολύ από την κυρίαρχη προσέγγιση που παραδοσιακά εχρησιμοποιείτο για την αντιμετώπιση αυτών των προβλημάτων στην κοινότητα του reinforcement learning, το αποκαλούμενο “intrinsic motivation”. Σε αυτό, αντί να διαχωρίζεται η εξερεύνηση στην επιστροφή και τη διερεύνηση όπως κάνουμε εμείς, ο δρων απλά ανταμείβεται για την ανακάλυψη νέων περιοχών».

Ένα πρόβλημα με την προσέγγιση του intrinsic motivation είναι πως, ενώ αναζητείται λύση, ο αλγόριθμος μπορεί να «ξεχνά» τις πολλά υποσχόμενες περιοχές που πρέπει ακόμα να εξερευνώνται. Αυτό είναι γνωστό ως «detachment». Οι ερευνητές βρήκαν τρόπο να το προσπερνούν αυτό: Δημιουργώντας αρχεί με τις περιοχές που έχει επισκεφθεί, ο αλγόριθμος μπορεί να επιστρέψει σε ένα υποσχόμενο ενδιάμεσο στάδιο του παιχνιδιού, ως ένα σημείο από όπου μπορεί να εξερευνά περαιτέρω.

Ωστόσο υπήρχε και ένα άλλο πρόβλημα με τις προηγούμενες προσεγγίσεις σε αυτά τα παιχνίδια: «Βασίζονται σε τυχαίες ενέργειες που μπορεί να ληφθούν σε οποιοδήποτε σημείο στον χρόνο, μεταξύ των οποίων και ενώ ο δρων πηγαίνει ακόμα προς την περιοχή που πρέπει να εξερευνηθεί» είπαν στο BBC News οι επιστήμονες. «Αν έχεις ένα περιβάλλον όπου οι ενέργειές σου πρέπει να είναι ακριβείς, όπως ένα παιχνίδι με πολλούς κινδύνους που μπορούν να σε σκοτώσουν άμεσα, τέτοιες τυχαίες ενέργειες μπορούν να σε εμποδίσουν από το να φτάσεις στην περιοχή που θες στα αλήθεια να εξερευνήσεις» (ο τεχνικός όρος για αυτό είναι derailment, εκτροχιασμός).

Η νέα μέθοδος, που περιγράφεται στο Nature, επιλύει το πρόβλημα του εκτροχιασμού διαχωρίζοντας τη διαδικασία της επιστροφής σε προηγούμενες περιοχές από τη διαδικασία της εξερεύνησης νέων- και το επιλύει με διαφορετικούς τρόπους.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Press Room

Τέσσερεις νόμους που αναθεωρούν εκλογικές διατάξεις για ΤΑ ψήφισε η Βουλή

Τέσσερεις νόμους που αναθεωρούν εκλογικές διατάξεις τον νομοθετικού πλαισίου της μεταρρύθμισης της Τοπικής Αυτοδιοίκησης ψήφισε η Ολομέλειας της Βουλής. Ο πρώτος νόμος αναθεωρεί τον περί...

Απαρέσκεια ΣΕΚ για τα μέτρα της κυβέρνησης – Δεν καλύπτουν τις ανάγκες

Τα πέντε μέτρα που ανακοίνωσε η Κυβέρνηση για αντιμετώπιση της ακρίβεια, δεν καλύπτουν τις πραγματικές ανάγκες του κοινωνικού συνόλου, αναφέρει η ΣΕΚ, εκφράζοντας με ανακοίνωση την απαρέσκειά της....

Ελεγκτική: Χωρίς έλεγχο τα έσοδα Γενικού Λογιστηρίου

Τη μη διενέργεια ελέγχου σε όλες τις περιπτώσεις των εσόδων που εισπράττονται και εσόδων που πιστώνονται σε Κονδύλια εσόδων της από το Γενικό Λογιστήριο...

Αναγκαίος ο ψηφιακός χρηματοοικονομικός αλφαβητισμός λέει ο Διοικητής ΚΤΚ (βίντεο)

Τα σημαντικά οφέλη που δημιουργεί ο ψηφιακός χρηματοοικονομικός αλφαβητισμός, εξηγεί ο Διοικητής της Κεντρικής Τράπεζας της Κύπρου (ΚΤΚ), Κωνσταντίνος Ηροδότου, στο δεύτερο από μία σειρά...

Ανοδικά κινήθηκε το Χρηματιστήριο

Ανοδικά έκλεισε την Πέμπτη το Χρηματιστήριο Αξιών Κύπρου, με τον Γενικό Δείκτη να καταγράφει κέρδη σε ποσοστό 0,65%, κλείνοντας στις 145,32 μονάδες. Ο Δείκτης FTSE/CySE 20 παρουσίασε άνοδο...

Έκθεση ΟΗΕ: Η διαίρεση της Κύπρου εμπόδιο στα ανθρώπινα δικαιώματα

Η διαίρεση της Κύπρου συνεχίζει να εμποδίζει την πλήρη απόλαυση των ανθρωπίνων δικαιωμάτων από όλα τα άτομα σε ολόκληρο το νησί, αναφέρεται στην ετήσια...

Μείνετε ενημερωμένοι με τo newsletter μας!