Ανοιχτό dataset για αυτόνομη οδήγηση με 1,4 εκατομμύρια εικόνες από τη nuTonomy

Το nuScenes, ένα dataset με πάνω από 1,4 εκατομμύρια εικόνες δημοσίευσε η nuTonomy σε συνεργασία με τη Scale. Το dataset μπορεί να χρησιμοποιηθεί για την «εκμάθηση» συστημάτων αυτόνομης οδήγησης.

Τα datasets αποτελούν δομικό στοιχείο των αλγόριθμων μηχανικής μάθησης, καθώς απαιτούνται για να «διδάξουν» την τεχνητή νοημοσύνη. Η nuTonomy ισχυρίζεται ότι το nuScenes ξεπερνά σε μέγεθος και ακρίβεια δημόσια datasets όπως τα KITTI, το ApolloScape της Baidu και τη βιβλιοθήκη Udacity Self-Driving Car.

Για το dataset η NuTonomy συνδύασε περισσότερες από 1.000 σκηνές που περιλαμβάνουν 1,4 εκατομμύρια εικόνες, 400.000 σαρώσεις από lidar και 1,1 εκατομμύρια 3D αντικείμενα τα οποία ανιχνεύονται με έναν συνδυασμό καμερών RGB, radar και lidar.

Για την ακρίβεια, χρησιμοποιήθηκε ένας συνδυασμός έξι καμερών, ενός lidar, πέντε ραντάρ, GPS και ενός αδρανειακού αισθητήρα. Τα δεδομένα προέρχονται από διαδρομές στη Σιγκαπούρη και στη Βοστόνη.

Τα δεδομένα έχουν κατηγοριοποιηθεί σχολαστικά μέσω του Sensor Fusion Annotation API της Scale και μπορούν να χρησιμοποιηθούν ελεύθερα από όποιον θέλει να κάνει χρήση τους.

Ολοένα και περισσότερα datasets για αυτόνομα οχήματα διατίθενται ελεύθερα στο κοινό. Το καλοκαίρι που μας πέρασε η Flir Systems δημοσιοποίησε 10.000 εικόνες από θερμικές κάμερες. Η Mapillary δημοσίευσε 25.000 εικόνες από οδούς και το Πανεπιστήμιο της Καλιφόρνια Berkeley ανάρτησε 100.000 ακολουθίες βίντεο από RGB κάμερες. Ωστόσο, οι Scale και nuTonomy ισχυρίζονται ότι το nuScenes είναι πιο περιεκτικό απ’οποιοδήποτε προηγούμενο dataset.

Πηγή