πόκερ

Πόκερ: Ο αλγόριθμος που άλλαξε για πάντα το παιχνίδι - Μπορούσε να προβλέψει 316 τετράκις εκατ. αποτελέσματα

Ο server που έκανε τους καλούς, κορυφαίους

Στις αρχές Νοεμβρίου, στο καζίνο Rio του Λας Βέγκας, στο Amazon Room, περίπου 25 άντρες που φορούσαν φανελάκια και καπέλα του baseball, καθόντουσαν γύρω από τρία τραπέζια του πόκερ και έπαιζαν Texas Hold’ Em.

Πού και πού σταματούσαν κάποιοι περαστικοι για να δουν τι διαμείβεται. Αν τους παρατηρούσε κάποιος, θα νόμιζε ότι πρόκειται για τίποτα άσχετους ή άπειρους ή για ανθρώπους που δεν παίζουν για μεγάλα ποσά. Ήταν άνευροι, αδιάφοροι.

Αυτό που έβλεπαν οι περαστικοί ήταν το ξεκίνημα ενός τουρνουά με τίτλο World Series of Poker Super High Roller, με κάθε παίκτη να έχει ποντάρει 250.000 δολάρια. Ανάμεσα στους παίκτες ήταν ο Seth Davies, 33 ετών, πρώην παίκτης baseball σε κολλεγιακό επίπεδο, ο οποίος είχε μαζέψει μετά σχεδόν 2 εκατομμύρια δολάρια, έχοντας κερδίσει μάλιστα με το 6 και το 7 καρό στα χέρια του.

Ο ντίλερ είχε απλώσει έναν ρήγα, ένα 4 και ένα 5, όλα σπαθιά, κάτι που οδηγούσε τον Davies σε ήττα. Ο αντίπαλος του, Dan Smith, έπαιξε με τσεκάρισμα. Ο Davies πόνταρε. Ο Smith έκανε call.

Το επόμενο χαρτί που γύρισε ήταν το 2 καρό.  Έγινε πάλι η ίδια διαδικασία. Το 5ο χαρτί που άνοιξε ο ντίλερ ήταν το 2 σπαθί. Ο Davies ήλπιζε σε ένα 3 για να κάνει κέντα, αλλά τίποτα. Στο τραπέζι είχαν πονταριστεί ένα εκατομμύριο δολάρια σε μάρκες.

Με το τελευταίο δυάρι, υπήρχαν 4 σπαθιά στο τραπέζι. Αν ο Smith είχε έστω ένα σπαθί, είχε κάνει φλος. Ο Smith έκανε πάλι τσεκάρισμα όμως. Ο Davies άρχισε να σκέφτεται πως ο Smith δεν είχε σπαθί.

Μετά από ένα λεπτό σκέψης, ο Davies πήγε με μια all in μπλόφα. Αν ο Smith απαντούσε, θα είχε χάσει ο Davies τα 250.000 που ήταν το ποσό εισόδου για το τουρνουά. Ο Smith πάλεψε να διαβάσει το poker face του αντιπάλου του, αλλά δε μπόρεσε. Τελικά, πήγε πάσο και ο Davies πήρε τα σχεδόν 2 εκατομμύρια.

Το κυνήγι της τελειότητας στο πόκερ

Όταν ο Davies γύρισε εκείνο το βράδυ στο σπίτι του, μπήκε στο γραφείο του μπροστά στο γκαράζ, άνοιξε στονν υπολογιστή του το πρόγραμμα PioSolver και «έτρεξε» εκεί την παρτίδα. Το εργαλείο του είπε ότι έπραξε πολύ σωστά στο τελευταίο ποντάρισμα. Τη στιγμή που βγήκε το πρώτο δυάρι, θα έπρεπε να ποντάρει το 80% του ποσού και όχι το 50%, αλλά στο τέλος έπραξε σωστά που πήγε με τη μπλόφα των 1.7 εκατομμυρίων.

«Εκεί ένιωσα πολύ καλά. Ήταν μεγαλύτερη η ικανοποίηση και από την ίδια τη νίκη. Το να ξέρω ότι είχα κάνει τις σωστές κινήσεις», είπε αργότερα σε δηλώσεις του ο Davies. Το πόκερ έχει αλλάξει. Υπάρχουν προγράμματα που κάνουν diagnostics και σε προπονούν για κάθε πιθανό σενάριο. Ο Davies είχε νιώσει καλά με τον εαυτό του όχι γιατί πήρε τα λεφτά. Αλλά γιατί κινήθηκε άρτια στρατηγικά. Αν δεν το είχε κάνει, θα ήξερε πως είχε πάρει τεράστιο ρίσκο.

Αυτό που έκανε ο Davies ήταν το κυνήγι της τελειότητας στο πόκερ. Ένα κυνήγι που έχει ξεκινήσει από τη δεκαετία του ’50, από τον μαθηματικό John von Neumann και τον οικονομολόγο Oskar Morgenster. Οι δυο τους συνεργάστηκαν για το βιβλίο Θεωρία Παιγνίων και Οικονομικής Συμπεριφοράς, με στόχο να διορθώσουν τις δομικές ανακρίβειες στον τομέα των οικονομικών.

«Ελπίζουμε να βρούμε τους μαθηματικά απόλυτους κανόνες που καθορίζουν την λογική συμπεριφορά του συμμετέχοντα σε μια κοινωνική οικονομία και να βγάλουμε απ΄αυτό τα γενικά χαρακτηριστικά της συμπεριφοράς».

Σύμφωνα με τους δύο θεωρητικούς της οικονομίας, η οικονομική ζωή είναι μια σειρά από προβλήματα που μεγεθύνονται και στα οποία οι ατομικοί παίκτες διαγωνίζονται για να κάνουν όσο πιο χρήσιμο μπορούν τον καθημερινό τους μόχθο.

Το μοντέλο του von Neumann

Αυτή τους η προσδοκία τους έφερε στο να φτιάξουν ένα οικονομικό μοντέλο αποφάσεων και μετά μια θεωρία παιγνίων. Ο von Neumann απέρριψε όλα τα παιχνίδια ως ακατάλληλα για το μοντέλο που ήθελαν να φτιάξουν, με το σκάκι να είναι το χειρότερο.

«Στην αληθινή ζωή δε βλέπεις όλα τα πιόνια του αντιπάλου. Δεν έχεις όλες τις πληροφορίες. Η αληθινή ζωή έχει μπλόφα, έχει τακτική, έχει αποπλάνηση, έχει την απορία για το τι θα κάνει ο άλλος και τι θα θεωρήσει ο άλλος ότι θες να κάνεις. Και τα παιχνίδια στη δική μου θεωρία με αυτό καταπιάνονται».

Με αυτά τα λόγια ο Neumann φωτογράφιζε το πόκερ. Τρέχοντας λοιπόν την δική του εκδοχή του παιχνιδιού, με δύο παίκτες να έχουν τυχαίους αριθμούς στα χέρια τους και ζητώντας τους να κάνουν συγκεκριμένα πονταρίσματα, ανάλογα με το ποιος είχε μεγαλύτερο αριθμό, ο Neumann κατέληξε στη βάση μιας όψιμης στρατηγικής.

Οι παίκτες πρέπει να ποντάρουν υψηλά ποσά είτε έχουν το καλύτερο χέρι είτε τις περισσότερες περιπτώσεις κακού χεριού. Είχε μάλιστα βγάλει ένα ποσοστό κακών συνδυασμών χαρτιών που αντέχουν τη μπλόφα.

Αυτό το ποσοστό εξαρτιόταν φυσικά από το μέγαθος του πονταρίσματος σε σχέση με το μέγεθος του pot. Ο Neumann κατάφερε να δείξει πως με τη μπλόφα και με το call σε συγκεκριμένη συχνότητα, οι παίκτες θα έβγαιναν στη χειρότερη των περιπτώσεων ισόπαλοι, ακόμα κι αν εξηγούσαν την στρατηγική τους στους αντιπάλους. Κι αν οι αντίπαλοι τους είχαν μια στρατηγική λιγότερο από το τέλειο, τότε σίγουρα θα έχαναν.

Γιατί το πόκερ διαφέρει από κάθε άλλο επιτραπέζιο παιχνίδι

Αυτή η Θεωρία Παιγνίων του Neumann μας φέρνει στο σήμερα, όπου οι αγώνες πόκερ έχουν κριθεί σε ένα μεγάλο ποσοστό πριν φτάσουν οι παίκτες στο τραπέζι. Το Τμήμα Υπολογιστικής Επιστήμης από το Πανεπιστήμιο της Αλμπέρτα στον Καναδά ξεκίνησε στα μέσα των 90’s, υπό την επίβλεψη του καθηγητή Jonathan Schaeffer, να φτιάχνει αλγόριθμους εξέλιξης παιγνίων όπως το πόκερ, το curling, το Othello και το StarCraft.

Το πόκερ βέβαια ήταν ένα πιο ακανθώδες ζήτημα. Όσο περισσότερη κρυμμένη πληροφορία, τόσο καλύτερη αντίδραση θα έχει ένας παίκτης. Αυτό υποστήριζαν τα μαθηματικά του Neumann. Σε αντίθεση με το σκάκι ή το τάβλι, στο πόκερ ένας πρέπει να ερμηνεύσει τα πονταρίσματα του αντιπάλου, χωρίς να έχει ιδέα τι κρατά στα χέρια του.

Και τα πράγματα γίνονται ακόμα πιο περίπλοκα, αν σκεφτεί κανείς τους πιθανούς συνδυασμούς, ακόμα και με προκαθορισμένα ποσά πονταρίσματος. Οι θεωρητικοί των παιγνίων χρησιμοποιούν ένα διάγραμμα με ένα δέντρο με κλαδιά για να αποτυπώσουν τους διαφορετικούς τρόπους με τους οποίους μπορεί να εξελιχθεί ένα παιχνίδι.

Σε ένα παιχνίδι που έχει 3 δεδομένα, όπως ας πούμε το Πέτρα-Ψαλίδι-Χαρτί, οι πιθανότητες είναι περιορισμένες. Υπάρχουν τρεις κινήσεις που μπορεί να κάνει ο αντίπαλος.

Σε ένα παιχνίδι πόκερ όμως, οι κινήσεις είναι απειράριθμες. Ακόμα και σε μια απλουστευμένη εκδοχή του Texas Hold’em μεταξύ δύο παικτών και με προκαθορισμένο μέγεθος των bets, οι κινήσεις που μπορεί να γίνουν ξεπερνούν τις 316.000.000.000.000.000.

Ο αλγόριθμος που έδινε τύχη και στους άσχετους να διεκδικήσουν το pot

Πέντε τριάδες με μηδενικά, καλά βλέπεις. 316 τετράκις εκατομμύρια, για να το στριμώξουμε. Αν δε είναι μια εκδοχή πόκερ χωρίς περιορισμούς στα bets, τα παρακλάδια είναι σε αριθμό όσα και τα μόρια στο σύμπαν.

Πώς μπορείς λοιπόν να βγάλεις έναν μπούσουλα μέσα από έναν τέτοιο αριθμό πιθανοτήτων; Με τεχνητή νοημοσύνη και με έναν αλγόριθμο που ονομάστηκε «ελαχιστοποίηση της αντίθετης μετάνοιας». Τι σημαίνει αυτό; Οι ερευνητές από την Αλμπέρτα έβαλαν τα προγράμματα να παίξουν δισεκατομμύρια φορές το ενα εναντίον του άλλου και ανέλυσαν ποιες κινήσεις είχαν το λιγότερο κέρδος, δηλαδή οι κινήσεις της μετάνοιας.

Αυτές οι κινήσεις άρχισαν σιγά σιγά να αποβάλλονται από τις επιλογές της τεχνητής νοημοσύνης. Το 2015 το πείραμα στέφθηκε με επιτυχία και κυκλοφόρησε ένας μπούσουλας με τίτλο «Heads-Up Limit Hold’em Poker Is Solved».

Αυτός ο μπούσουλας εργαλειοποιούσε την επιτυχία στο πόκερ και έδινε πιθανότητες επιτυχίας ακόμα και στους πιο άσχετους. Λογικά λοιπόν, οι παλιοί, οι έμπειροι, που ζούσαν από τις παρτίδες, ένιωσαν απειλή. Ο Terrence Chan αναφέρει χαρακτηριστικά στους New York Times ότι είπε μέσα του «Οκ, καλά ήταν ως εδώ».

Από κει και μετά, ο ουρανός ήταν το όριο. Πάρα πολλοί παίκτες προσέγγισαν developers από εταιρείες που ασχολούνται με τo online poker και τους πλήρωναν για να αναπτύξουν bots που θα μπορούσαν να κερδίσουν ανθρώπους. Ένας Πολωνός, ο Piotrek Lopusiewicz, έφτιαξε το PioSOLVER, ένα πρόγραμμα που μπορούσε να κατεβάσει ο οποιοσδήποτε για 249 δολάρια και είχε όλες τις λύσεις για τις πιο περίπλοκες εκδοχές ενός Texas Hold’em.

Η ευφυΐα του Jason Koon

Ένας από τους πιο σεσημασμένους παίκτες, ο Jason Koon, που ξεκίνησε το 2006 και από τότε έχει κερδίσει 30 εκατομμύρια σε τουρνουά σε Λας Βέγκας και Μακάου, το PioSOLVER του έχει προσφέρει μια νέα προσέγγιση στο παιχνίδι του, καθώς του έχει μάθει ποιο είναι το ιδανικό bet για κάθε διαφορετική συνθήκη.

Κάποιες φορές απαιτείται μικρό ποντάρισμα, άλλες το 1/5 ή το 1/10 του pot. Άλλες πάλι το διπλάσιο ή τριπλάσιο. Αυτό είναι κάτι που ούτε οι κορυφαίοι του είδους, που ξέρουν πότε να μπλοφάρουν και πότε να παίξουν ανοιχτά, δεν το πετυχαίνουν.

«Αν είχε αυτή τη γνώση πριν 15 χρόνια, θα διέλυε τους καλύτερους παίκτες εκείνης της εποχής. Όλοι οι παίκτες θα νόμιζαν ότι είναι ψάρακες. Σήμερα υπάρχουν πολλά περίεργα παιχνίδια που κάνουν αυτοί οι τύποι και είναι αποτελεσματικά. Τόσο περίεργα που αν τα έκαναν στις μέρες μου, θα τους καλούσαν κάθε βράδυ σε παιχνίδια», λέει ο Erik Seidel, μύστης του πόκερ στα 80s, για τον Koon.

Ο Koon βέβαια δεν αρκέστηκε σε αυτό που του έδινε η τεχνητή νοημοσύνη. Σε αρκετές περιπτώσεις έκανε μεγαλύτερη μπλόφα ή πόνταρε περισσότερα απ΄όσα του έλεγε το σύστημα, για να εκμεταλλευτεί τα λάθη των αντιπάλων του.

Ήθελε να τους σύρει στο λάκκο των λεόντων. Απέναντι όμως στους κορυφαίους, απλώς αναπαρήγαγε αυτό που του έλεγε το πρόγραμμα. Από ένα σημείο και μετά απομνημόνευσε τις κατευθύνσεις της τεχνητής νοημοσύνης, του εντυπώθηκε το μοτίβο και σε αρκετά παιχνίδια δεν το χρησιμοποίησε καν.

Ο server με τον οποίο εξασφαλίζεις το buy-in σου

Κοιτούσε το ρολόι του ή το λόγκο του εκάστοτε καζίνο και έκανε την κίνησή του. «Έλεγα “οκ, ρόλαρα στο 9 ακριβώς (κίνηση ρολογιού που σημαίνει τα 3/4). Αυτό είναι το 75%. Είναι αρκετά επιθετική τακτική”».

Σε μια τέτοια περίπτωση, ο Koon επέλεγε μεγαλύτερο ποσοστό από την πρόταση του προγράμματος, ενώ αν στο δεύτερο χέρι το πρόγραμμα έδειχνε 3 ακριβώς, δηλαδή 25%, απλώς έκανε check. Με αυτή την τακτική, ο Koon δεν κέρδισε πάντα, αλλά εξασφάλιζε ότι δεν θα έχανε κιόλας το ποντάρισμα του. Αν πρόκειται να παίξεις χιλιάδες παιχνίδια έναντι του προγράμματος, θα κερδίσει στο σύνολο.

Φυσικά, το να έχεις στο πλάι σου ένα προγράμμα που σου μιλάει με υπολογισμούς και αριθμούς, δεν είναι πανάκεια. Μετά από παιχνίδια 12 ωρών, στα οποία μπορεί να έχεις κερδίσει ή χάσει μεγάλα pots, υπάρχουν μεγάλες προκλήσεις για την πνευματική διαύγεια. Απλώς, το μεγάλο στοίχημα για τους παίκτες είναι η προετοιμασία.

Το μεγαλύτερο μέρος της επιτυχίας βασίζεται σε κινήσεις που έχουν γίνει πριν κάτσουν στο τραπέζι. Ο Koon διαβάζει όλη τη βδομάδα πριν από ένα παιχνίδι και προσπαθεί να βρει τη λογική πίσω από τις επιλογές του προγράμματος. «Είναι σαν να διαβάζεις ξανά και ξανά ένα βιβλίο 100.000 σελίδων. Είναι τόσο δύσκολο».

Ο Koon νοικοιάζει κάθε εβδομάδα 200 terabytes από τις αποθήκες του cloud για να βάλει εκεί τα game trees που έχει αναπτύξει, από τότε που άρχισε να χρησιμοποιεί το PioSOLVER. Για τον Koon όμως είναι ένα εργαλείο που χρησιμοποιεί πριν και μετά το παιχνίδι.

Το online πόκερ έχει αλλοιώσει την ουσία του παιχνιδιού

Άλλοι, στη διάρκεια των online παιχνιδιών, έχουν μια οθόνη ανοιχτή με το πρόγραμμα και άλλη μία με το παιχνίδι. Και περνάνε τα δεδομένα στο πρόγραμμα για να τους καθοδηγήσει. Αυτό είναι «τσιτιά». Και πάρα πολλοί αποκλείονται από online τραπέζια για το real-time assistance.

Γι΄αυτό και πια δεν είναι τόσο απλό να καταλάβεις ποιος είναι ο πολύ καλός παίκτης, ο καλύτερος στο τραπέζι. Σε ένα τουρνουά πόκερ τριών ημερών, είναι τα λίγα τα χέρια που θα δει ένας παίκτης και γι΄αυτό η τύχη παίζει ακόμα μεγάλο ρόλο.

Άλλωστε, αν όλοι έχουν ένα PioSOLVER ή κάποιο άλλο πρόγραμμα, είναι σαν να βρίσκονται στο ίδιο τραπέζι 20-25 ίδια ή και διαφορετικά προγράμματα. Τεχνητή νοημοσύνη vs τεχνητή νοημοσύνη. Πάντοτε θα πρέπει να νικάει ένας και να χάνει ένας.

Σε ένα σκληρό τουρνουά, οι χειρότεροι παίκτες θα χάσουν ένα 30 με 40% του buy-in τους. Οι πιο δυνατοί ερασιτέχνες θα χάσουν το 15% των χρημάτων τους, ενώ οι επαγγελματίες θα κερδίσουν συνολικά ένα 5 με 10%.

Αρκετοί επιλέγουν, για να μειώσουν τη χασούρα, να κλείσουν deals με άλλους παίκτες ώστε να μοιραστούν το επιπλέον ποσοστό που θα κερδίσει ένας από τους δύο ή να χαρίσουν μελλοντικά stakes.

Μια μάρκα κάνει τεράστια διαφορά

Στο Super High Roller που αναφέρθηκε στην αρχή, όταν έφτασαν στην τρίτη και τελευταία ημέρα, οι 5 παίκτες που απέμειναν και ήταν οι μόνοι που μοιράστηκαν το pot, μεταφέρθηκαν σε μια μεγαλύτερη αίθουσα για να παιχτεί η τελική φάση ενώπιον καμερών και εκεί ο 27χρονος Ισπανός Adrián Mateos, που είχε τις περισσότερες μάρκες, κινήθηκε επιθετικά.

Έπαιζε συνεχώς με τεράστια πονταρίσματα και τους ρωτούσε κάθε φορά αν αυτό είναι το χέρι που θέλουν να κάνουν την τελευταία τους επίθεση ή αν θα ήθελαν να πάνε fold και να περιμένουν κάποιον άλλο να ηττηθεί, ώστε αυτοί να μείνουν τρίτοι ή τέταρτοι και να έχουν μεγαλύτερο κέρδος, από 300.000 ως 700.000 δολάρια.

Μόλις φτάσει κανείς σε αυτό το σημείο, το πρόγραμμα δεν είναι το ίδιο αποτελεσματικό. Αν έχουν αποχωρήσει ένας ή δύο παίκτες, κάθε μάρκα μπορεί να ισούται με εκατοντάδες χιλιάδες ως και εκατομμύριο. Πλέον, το παιχνίδι είναι κορώνα ή γράμματα.

Ο Davies, που ήταν απέναντι στον Mateos, ήταν ο παίκτης με τις λιγότερες μάρκες μετά τον αποκλεισμό ενός ανταγωνιστή. Είχε μείνει ακόμα ένας παίκτης να κάνει την κίνησή του μετά απ΄αυτόν. Ο Davies έπαιξε all-in έχοντας στο χέρι του άσο και εφτά μπαστούνη. Ο Ben Heath, ο έτερος παίκτης, έκανε γρήγορα call και γύρισε ένα ζευγάρι βαλέδες που είχε.

Η ενόχληση των «παλιών»

Πλέον, είχε 67% πιθανότητες να κερδίσει το χέρι. Από τις 5 κάρτες που είχε ανοίξει ο dealer, καμία δεν έκανε καλύτερο αυτό που είχε ο Davies στο χέρι του. Έτσι, ο Heath κέρδισε όντως και ο Davies έμεινε τέταρτος. Στα χέρια του κρατούσε 930.000 δολάρια, δηλαδή 3 φορές το buy-in του. Η τεχνητή νοημοσύνη τον είχε φέρει σε αυτό το σημείο.

Ο Davies ήταν χαρούμενος και είχε μάθει πια να αναγνωρίζει πότε ένα τραπέζι θα είναι στην χειρότερη ελάχιστα κερδοφόρο. Δεν είναι όμως όλοι ευχαριστημένοι με αυτή την αλλαγή σκηνικού που έχει επιφέρει η τεχνητή νοημοσύνη στο πόκερ.

Ο Doug Polk, επαγγελματίας που έπαιζε μέχρι το 2017 και αποσύρθηκε μετά από δεκάδες εκατομμύρια δολάρια σε κέρδη, κάνει λόγο για το τέλος του πόκερ. «Νιώθω σαν να σκοτώσουν την ψυχή του παιχνιδιού. Από εκεί που ο καλύτερος ήταν αυτός που μπορούσε να λύσει ένα πρόβλημα με τον πιο δημιουργικό τρόπο, τώρα ο καλύτερος είναι αυτός που απομνημονεύει περισσότερες πληροφορίες και τις εφαρμόζει».

Όπως αναφέρει όμως ο Piotrek Lopusiewicz, οι παλιότεροι χρησιμοποιούσαν κι αυτοί άλλα προγράμματα που συνέλεγαν δεδομένα για τους αντιπαλους και ανέλυαν πιθανές αδυναμίες. Οπότε, αυτό που συμβάινει την τελευταία 5ετία, είναι απλώς η εξέλιξη, η εμφάνιση ενός καλύτερου όπλου.

«Ξαφνικά, οι τύποι που δεν ήταν σε θέση να βγάλουν κέρδος πια, είπαν “Ναι, θέλουμε τα εργαλεία μας, όχι καλύτερα εργαλεία”. Σήμερα, όλοι είναι αναγκασμένοι σε ένα βαθμό να σεβαστούν τα μαθηματικά. Δε μπορούν να τα αγνοήσουν πλέον».

Πηγή: New York Times

* Φωτογραφία: Unsplash/Keenan Constance