Υπολογιστής με τέλεια όραση θα μεταμορφώσει τη βοτανική…

Ο μπαμπάς μου είναι βιολόγος της άγριας ζωής και σε διάφορα ταξίδια που πηγαίναμε όταν μεγάλωνα περνούσε πολύ χρόνο μιλώντας για τα γρασίδια και τα δέντρα εκεί στον αυτοκινητόδρομο. Ήταν ένα παιχνίδι που έπαιζε, προσπαθώντας να μαντέψει σωστά τη χλωρίδα από τη θέση του οδηγού ενώ το αυτοκίνητο κινείτο. Ως παιδί με τάση ζαλάδας στο αυτοκίνητο και στριμωγμένο στο πίσω κάθισμα μίας Ford F150, το θεωρούσα πάρα πολύ βαρετό. Ως ενήλικας –ειδικά, ως ένας που μόλις συζήτησε με έναν παλαιοβοτανιστή- ξέρω κάτι για την συνήθεια που είχε ο πατέρας μου στα ταξίδια: το να εντοπίζεις την ταυτότητα των φύλλων δεν είναι εύκολο.

«Έχω κοιτάξει δεκάδες χιλιάδες ζωντανά και απολιθωμένα φύλλα», λέει εκείνος ο παλαιοβοτανιστή, Peter Wilf, του Κολλεγίου Επιστημών της Γης και των Μετάλλων της Πενσυλβανίας. «Κανείς δε θυμάται πώς είναι. Είναι αδύνατον – υπάρχουν δεκάδες χιλιάδες διακλαδώσεις». Υπάρχουν επίσης μοτίβα στα διαστήματα μεταξύ των φλεβών, διαφορετικά σχήματα οδοντωτών άκρων και ένα σύνολο επιπλέον χαρακτηριστικών που ξεχωρίζουν το ένα φύλλο από το άλλο. Ανήμποροι να απομνημονεύσουν όλες αυτές τις λεπτομέρειες, οι βοτανολόγοι βασίζονται σε μία πρακτική μέθοδο ταυτοποίησης που δημιουργήθηκε κατά το 1800. Εκείνη η μέθοδος –λεγόμενη «αρχιτεκτονική του φύλλου»- δεν έχει αλλάξει πολύ έκτοτε. Βασίζεται σε ένα μεγάλο βιβλίο αναφοράς γεμάτο από «ένα σίγουρο και σταθερό σύστημα όρων για την περιγραφή της μορφής των φύλλων και των φλεβών» και είναι εξαντλητική διαδικασία∙ ο Wilf λέει ότι η σωστή ταυτοποίηση της ταξινομίας ενός φύλλου μπορεί να πάρει δύο ώρες.

Για αυτό το λόγο, τα τελευταία εννέα χρόνια ο Wilf δουλεύει με έναν υπολογιστικό νευρολόγο από το Πανεπιστήμιο Brown προγραμματίζοντας λογισμικό για να κάνει αυτό που το ανθρώπινο μάτι δεν μπορεί: να ταυτοποιήσει οικογένειες φύλλων σε μερικά χιλιοστά του δευτερολέπτου. Το λογισμικό, το οποίο ο Wilf και οι συνεργάτες του περιγράφουν με λεπτομέρεια σε πρόσφατο τεύχος του Proceedings of the National Academy of Sciences, συνδυάζουν υπολογιστική όραση και αλγορίθμους εκμάθησης μηχανών για να ταυτοποιήσουν μοτίβα στα φύλλα, συνδέοντάς τα σε οικογένειες φύλλων από τις οποίες πιθανόν εξελίχθηκαν με ποσοστό ακρίβειας 72%. Με αυτόν τον τρόπο, ο Wilf έχει σχεδιάσει μία φιλική προς το χρήστη λύση σε έναν κοπιαστικό τομέα της παλαιοβοτανικής. Το πρόγραμμα, λέει, «πρόκειται πραγματικά να αλλάξει τον τρόπο με τον οποίο αντιλαμβανόμαστε την εξέλιξη των φυτών».

Το project ξεκίνησε το 2007, αφότου ο Wilf διάβασε ένα άρθρο στην εφημερίδα The Economist με τίτλο “Easy on the eyes” («Χάρμα Οφθαλμών»). Κατέγραφε τη δουλειά του Thomas Serre, νευροεπιστήμονα του Brown, πάνω σε λογισμικό αναγνώρισης εικόνων. Ο Serre ήταν στο MIT εκείνη την εποχή και είχε διδάξει σε έναν υπολογιστή να ξεχωρίζει τις εικόνες με ζώα από εκείνες χωρίς ζώα με ποσοστό ακρίβειας 82%. Αυτό ήταν καλύτερο από τους φοιτητές που πετύχαιναν μόλις στο 80% των περιπτώσεων. «Ένας συναγερμός χτύπησε στο κεφάλι μου», λέει ο Wilf, ο οποίος αμέσως κάλεσε τον Serre και τον ρώτησε αν αυτό το πρόγραμμα μπορεί να διδαχθεί να αναγνωρίζει μοτίβα στα φύλλα. Ο Serre είπε ναι, και οι δύο επιστήμονες συναρμολόγησαν ένα προκαταρκτικό σύνολο φύλλων από σχεδόν πέντε οικογένειες και ξεκίνησαν διάφορες δοκιμές αναγνώρισης στον υπολογιστή. Γρήγορα πέτυχαν ποσοστό ακρίβειας 35%.

Μέχρι τώρα, οι Wilf και Serre έχουν τροφοδοτήσει το πρόγραμμα με μια βάση δεδομένων από 7597 εικόνες φύλλων που έχουν λευκανθεί με χημικό τρόπο και έπειτα κηλιδωθεί ώστε να φανούν λεπτομέρειες όπως τα μοτίβα των φλεβών και οι οδοντωτές άκρες. Μικρές ατέλειες όπως οι δαγκωματιές από έντομα και τα σκισίματα έχουν επίτηδες συμπεριληφθεί, καθώς αυτές οι λεπτομέρειες παρέχουν στοιχεία για τις καταβολές του φυτού. Όταν το λογισμικό επεξεργαστεί αυτά τα εικονικά αντίγραφα, δημιουργεί έναν θερμικό χάρτη πάνω από αυτά. Κόκκινες κουκκίδες επισημαίνουν τη σημασία των διάφορων στοιχείων κωδικοποίησης ή μικροσκοπικές εικόνες που απεικονίζουν μερικά από τα 50 χαρακτηριστικά των φύλλων. Οι κόκκινες κουκκίδες σε σύνολο επισημαίνουν τις περιοχές που σχετίζονται με την οικογένεια στην οποία το φύλλο πιθανόν να ανήκει.

Αυτό, αντί για την ανίχνευση των ειδών, είναι ο απώτερος σκοπός για τον Wilf. Θέλει να ξεκινήσει να τροφοδοτεί το λογισμικό δεκάδες χιλιάδες εικόνες από μη ταυτοποιημένα, απολιθωμένα φυτά. Αν προσπαθείς να βρεις την ταυτότητα ενός απολιθώματος, λέει ο Wilf, είναι σχεδόν πάντα ενός εξαφανισμένου είδους, «ώστε η εύρεση της εξελικτικής οικογένειας είναι ένα από τα κίνητρά μας». Γνωρίζοντας το είδος του φύλλου δεν είναι τόσο βοηθητικό όσο το να γνωρίζουμε από πού προήλθε το φύλλο ή με ποια ζωντανά φύλλα συγγενεύει –ανεκτίμητες πληροφορίες για έναν παλαιοβοτανιστή.

Με αυτόν τον τρόπο, το εργαλείο των Wilf και Serre δημιουργεί μια δυνατότερη γέφυρα ανάμεσα στους ταξινομικούς τομείς της παλαιοβοτανικής και την οικολογική άποψη των πραγμάτων. Η Ellen Currano, επίκουρη καθηγήτρια του Τμήματος Γεωλογίας και Γεωφυσικής του Πανεπιστημίου του Γουαϊόμινγκ, λέει ότι η γέφυρα αυτή έχει σοβαρές ελλείψεις. «Θα μπορούσες να πας σε ένα φυτώριο και να κοιτάξεις τα φύλλα ή να πεις ‘βλέπω μεγάλα φύλλα, άρα πρέπει να προέρχεται από υγρό μέρος’, αλλά αυτό είναι κάτι λιγότερο από αποτελεσματικό». Η Currano, η οποία είχε συνεργαστεί στο παρελθόν με τον Wilf αλλά δεν εργάστηκε σε αυτή την μελέτη, επίσης επισημαίνει ότι οι σύγχρονοι βοτανολόγοι μπορούν συχνά να διακρίνουν την ταξινομία ενός φύλλου κοιτώντας τα άνθη ή τους καρπούς, αλλά εκείνα συχνά απολιθώνονται ξεχωριστά. «Είναι τρομερή πρόκληση να αποκτήσεις το φύλλο, αλλά όχι άνθος ή καρπό», λέει. «Οπότε [το εργαλείο του Wilf] είναι καινοτόμο στο ότι είναι ταξινομία βάσει των φύλλων».

Είναι επίσης ταξινομία βασισμένη στη μηχανική μάθηση και την αναγνώριση εικόνων. «Όλοι» -τουλάχιστον κάθε παλαιοβοτανιστής- «είχαν αυτό το όνειρο στο κεφάλι τους, αν μπορούσα να τραβήξω μια φωτογραφία από αυτό και να λάβω την ταυτότητά του», λέει η Currano. Ζητώντας να ικανοποιήσει αυτήν την επιθυμία, ο Wilf έχει την ίδια προσέγγιση στη μελέτη των απολιθωμάτων με εκείνη των μηχανικών της Google στην κατανομή των αποτελεσμάτων αναζήτησης ή τη διδασκαλίας ενός υπολογιστή να νικάει στο Go. Ο Wilf φτάνει στο σημείο να αποκαλέσει το εργαλείο του «βοηθό».

«Βοηθός» είναι μία ορθή περιγραφή. Άλλωστε, η δημιουργία του Wilf δεν παρέχει πάντα ακλόνητες απαντήσεις (το λογισμικό, επαναλαμβάνει, είναι 72% ακριβές, όχι 100%), αλλά πράγματι προσφέρει βοηθητικά στοιχεία και ιδέες. Ο υπολογιστής μπορεί γρήγορα και αμερόληπτα να δει ό, τι ένας καλά εκπαιδευμένος βοτανιστής πιθανόν να παραβλέψει  αλλιώς- και όταν ο υπολογιστής παρουσιάσει μια υποσχόμενη ροή ερωτημάτων, τότε η ανάλυση από τους ανθρώπους μπορεί να συνεχίσει. Είναι το είδος του εργαλείου για το οποίο ο Wilf είναι αισιόδοξος ότι θα αποκαλύψει «μία πλημμύρα από νέες βοτανικές πληροφορίες»- αλλά φυσικά δεν ανησυχεί για τη δουλειά του. «Δεν πρόκειται να αντικαταστήσει τους βοτανιστές», λέει, «αλλά πρόκειται να τους δείξει πού να κοιτάξουν».

Margaret Rhodes – wired.com