Ένα δισεκατομμύριο φωτογραφίες στο Instagram χρησιμοποιήθηκαν για την εκπαίδευση ενός αλγορίθμου του Facebook έτσι ώστε να «μάθει» να αναγνωρίζει εικόνες από μόνος του.
Κατά κανόνα οι αλγόριθμοι εκπαιδεύονται με βάση datasets τα οποία έχουν ήδη κατηγοριοποιηθεί από ανθρώπους. Ωστόσο, όπως αναφέρει το BBC, οι φωτογραφίες του Instagram παρουσιάστηκαν χωρίς σχετικές ταμπέλες. Στη συνέχεια ήταν σε θέση να αναγνωρίζει σωστά εικόνες με ακρίβεια 84,5%, σύμφωνα με το Facebook, που αποκαλεί το σύστημα Seer (συντομογραφία του self-supervised, αλλά και η αγγλική λέξη για τον «μάντη»).
Το Facebook ανέφερε πως αν και η τεχνική αυτή έχει ήδη σημειώσει επιτυχία σε αλγορίθμους που ασχολούνται με την processing language, οι εικόνες αποτελούν διαφορετικού είδους πρόκληση. Αυτό οφείλεται στο ότι μεμονωμένες λέξεις είναι ευκολότερο να αναγνωριστούν από τα διαφορετικά σημεία μιας εικόνας- ποιο μέρος της εικόνας είναι δέντρο, για παράδειγμα, ή ζώο, όταν μία εικόνα μπορεί να περιλαμβάνει και τα δύο, και μπορεί να βρίσκονται κοντά.
«Με τις εικόνες, ο αλγόριθμος πρέπει να αποφασίσει ποιο πίξελ ανήκει σε ποιο concept. Επιπρόσθετα, το ίδιο concept θα διαφέρει πολύ μεταξύ εικόνων, όπως με μια γάτα σε διαφορετικές πόζες ή από διαφορετικές γωνίες» αναφέρεται σε σχετικό blog της εταιρείας.
Το Facebook πρόσθεσε πως το να μπορούν να εκπαιδεύονται αλγόριθμοι σε τεράστια datasets που δεν έχουν πρώτα κατηγοριοποιηθεί από ανθρώπους θα μπορούσε επίσης να βοηθήσει στον αγώνα απέναντι σε προγράμματα που επιδεικνύουν προκαταλήψεις, οι οποίες έχουν την τάση να «διεισδύουν»- όπως πχ το ότι οι γυναίκες μπορεί να χαρακτηρίζονται περισσότερο με βάση φυσικά τους χαρακτηριστικά (πχ μαλλιά ή χαμόγελο) ενώ οι άνδρες με επίθετα όπως «επίσημος» ή «business» όταν η κατηγοριοποίηση γίνεται από ανθρώπους.