Die Off-Policy-Theorie des Glücklichseins

Warum Philosophen zustimmen, was es braucht, um glücklich zu sein.

Wikimedia commons.

Quelle: Wikimedia Commons.

Ich war ein College-Student im College, als mir zum ersten Mal klar wurde, dass meine Eltern mir nie gesagt hatten: “Sohn, wir wollen nur, dass du glücklich bist.” Es schien, als hätten die anderen Eltern ihnen gesagt, dass alles in Ordnung sei es machte sie glücklich. Warum, fragte ich mich, hatten meine Eltern mir das nie gesagt?

Ich verstand sofort, als ich eine Stelle aus der Autobiographie von John Stuart Mill fand.

Mill war ein interessanter Typ. Er hatte einen der höchsten IQ in der Geschichte der Menschheit (sie hatten zu der Zeit keine Intelligenztests, aber Psychologische Historiker haben versucht, seinen IQ aus anderen Beweisen zu rekonstruieren). Sein Vater, der ehrwürdige Historiker James Mill, begann im Alter von drei Jahren, ihn als Altgriechisch zu unterrichten. Um acht hatte er im Original die ganze Geschichte von Herodot gelesen. Also dachte ich, seine Lebensgeschichte könnte eine interessante Lektüre ergeben. Aber es ist nicht. Seine Autobiografie ist ein totales Snooze-Fest. Soweit ich mich erinnere, ist die Arbeit eine erschöpfende Zusammenstellung der am wenigsten interessanten Dinge, die Mill jemals gelesen, gesehen oder betrachtet hat. Eine repräsentative Passage: “Als wir genug von der politischen Ökonomie hatten, nahmen wir die syllogistische Logik in der gleichen Weise auf, Grote, der sich uns jetzt anschloss. Unser erstes Lehrbuch war Aldrich, aber von seiner Oberflächlichkeit angewidert, druckten wir eines der am meisten fertigen unter den vielen Handbüchern der Schullogik , die mein Vater, ein großer Sammler solcher Bücher, besass, die Manuductio ad Logicam der Jesuit Du Trieu. Nachdem wir das getan hatten, nahmen wir Whatelys Logik auf , die zuerst aus der Encyclopedia Metropolitana und schließlich aus der Computatio sive Logica von Hobbes herauskam. “Aus Liebe zu Gott, John. Wen interessiert das?

Obwohl ich mir nicht ganz sicher bin warum, habe ich es durchgestapft. Und ich bin froh, dass ich es getan habe.

Aber um zu verstehen, was Mill über Glück sagt, müssen Sie zuerst ein Konzept aus künstlicher Intelligenz verstehen. Es heißt Verstärkungslernen.

Die Grundidee des Verstärkungslernens ist einfach. Es ist eine Methode, um einen Agenten – sei es eine Person, ein Roboter oder ein Computerprogramm – intelligent zu verhalten. Die Definition von Intelligenz bezeichnen Computerwissenschaftler als “Belohnungsmaximierung”. Einfach gesagt, gibt es etwas, das Sie wollen, und intelligentes Verhalten besteht darin, so viel wie möglich davon zu bekommen. Zum Beispiel, wenn Ihr Agent ein Roboter ist, der Basketball spielt, dann kommt seine Belohnung in Form von Punkten. Je mehr Körbe der Roboter macht, desto mehr Punkte erhält er und desto intelligenter verhält sie sich. Reinforcement Learning ist eine mathematische Lösung für die Art und Weise, wie der Roboter lernen würde, mehr und mehr Punkte zu sammeln.

Im Kern des Verstärkenden Lernens ist das, was als “Politik” bekannt ist. Es ist das Spielbuch des Roboters. Eine Politik sagt in mathematischer Abstraktion: “Hier bin ich gerade. Das ist es, was ich als nächstes tun muss, um meine Belohnung zu maximieren. “Im Basketball könnte es eine gute Strategie sein, den Ball zu bekommen, ihn in den Korb zu dribbeln und eine Lay-up zu werfen. Jedes Mal, wenn der Roboter das macht, sieht sie, wie effektiv sie Punkte sammeln kann, und passt ihr Verhalten an, um es beim nächsten Mal besser zu machen. Der Roboter könnte schlecht anfangen, aber mit verstärkendem Lernen könnte sie im Laufe der Zeit besser werden. Das bedeutet Intelligenz hier – im Laufe der Zeit wird es immer besser, Ihr Ziel zu erreichen.

Die Idee könnte einfach sein, aber die Nuance im Verstärkungslernen kommt genau davon, wie Sie diese Politik lernen. Zum Beispiel, ist die beste Politik, um in den Korb zu fahren? Oder solltest du dich zurücklehnen und auf Springer schießen? Woher weißt du, was beim nächsten Mal besser wird? Wird dieselbe Politik gegen einen anderen Gegner vorgehen?

Es gibt zwei allgemeine Strategien, wie man eine Politik lernt. Die erste wird On-Policy genannt . Es ist die einfachere der beiden Strategien. On-Policy bedeutet, dass der Roboter dieselben Informationen verwendet, um Entscheidungen zu treffen und zu bewerten, ob es sich um gute Entscheidungen handelt oder nicht. Wenn ihre Politik sagt, dass sie in Richtung des Korbes fahren soll und das viele Punkte bringt, wird sie wahrscheinlich in Zukunft mit dieser Politik weitermachen. Die zweite Strategie wird als Off-Policy bezeichnet . Dies bedeutet, dass der Roboter verschiedene Informationen verwendet, um Entscheidungen zu treffen, als sie zu bewerten. Der Agent könnte Entscheidungen treffen, zum Beispiel basierend auf ihrer Ballbesitzzeit. Sie könnte dann auf der Grundlage dieser Politik auf ihr Spiel zurückblicken und sehen, ob die Konzentration auf etwas anderes tatsächlich ihre Anzahl von Körben am Ende erhöht hat.

Am Anfang mag es scheinen, als ob die bessere Strategie immer in der Politik sein wird. Wie könnten Sie mehr Punkte erzielen, wenn Sie sich auf etwas völlig Irrelevantes konzentrieren? Aber das stimmt nicht unbedingt. Die empirische Tatsache in der künstlichen Intelligenzforschung ist, dass einige Probleme besser durch nicht-politische Methoden gelöst werden können. Manchmal ist der beste Weg, um ein Ziel zu erreichen, indirekt.

Genau darüber streitet Mill über Glück. Der Weg, dein Glück sozusagen zu maximieren, besteht darin, etwas anderes anzustreben. Widme dich etwas, das größer ist als dein eigenes Glück. Arbeite hart daran. Dann wirst du zurückschauen und erkennen, dass du die ganze Zeit Glück gesammelt hast. Mühle schreibt,

“Die Genüsse des Lebens reichen aus, um es angenehm zu machen, wenn sie ins Leere genommen werden, ohne zu einem Hauptziel gemacht zu werden. Sobald Sie sie so gemacht haben, werden Sie sie sofort als unzureichend empfinden. Sie werden keine Überprüfungsprüfung ablegen. Frage dich, ob du glücklich bist, und du hörst auf, es zu sein. Die einzige Chance besteht darin, dass du als Lebensziel nicht Glück, sondern etwas Äußeres hast. Lass dein Selbstbewusstsein, deine Untersuchung, deine Selbstbefragung sich davon erschöpfen; und wenn Sie glücklicherweise andersumgänglich sind, werden Sie das Glück mit der Luft atmen, die Sie atmen, ohne sich daran zu halten oder darüber nachzudenken, es der Einbildung zuvorzukommen oder es durch fatale Fragen in die Flucht zu schlagen. ”

Mit anderen Worten, die Strategie für die Politik funktioniert nicht für Glück. Wenn Sie versuchen, es direkt zu maximieren, dann werden Sie schlechter dran sein, als wenn Sie einen anderen Ansatz gewählt hätten. Glück ist eines dieser Probleme, das mit der off-policy Strategie besser funktioniert. Es muss eine Trennung zwischen Aktion und Evaluierung geben. Wenn Sie Ihr eigenes Glück als Maßstab verwenden, um Ihre nächste Entscheidung zu bewerten, kann der Umfang Ihres Anliegens nicht über Ihre eigenen Gefühle hinausgehen. Stattdessen, so argumentiert Mill, konzentriere dich auf etwas, das größer ist als du und du wirst eines Tages aufwachen, um zu erkennen, dass du Glück mit der Luft atmest, die du atmest .

Der Grund dafür, dass meine Eltern mir nie gesagt haben, dass ich direkt nach Glück streben sollte, war der, dass sie, wie Mill, an einen außerpolitischen Zugang zum Glück glauben. Wenn jemand Ihnen sagt, dass Sie “tun sollten, was Sie glücklich macht”, dann befürworten Sie einen politischen Ansatz, um Entscheidungen zum Glücklichsein zu treffen und sie anhand desselben Maßes zu bewerten. Genau das wollten meine Eltern nicht. Und während meine Eltern das aus der Lektüre von Mill nicht gelernt haben, ist das Erstaunliche an dieser Position über das Glück, dass es – in der einen oder anderen Version – von praktisch jedem anderen Philosophen geteilt wird, der sich in die Sache vertieft hat.

Einer meiner Favoriten dieser Berichte gehört Bertrand Russell. Er sagt mehr oder weniger dasselbe wie Mill, aber mit einer gewissen Nonchalance im Gegensatz zu Mills feierlicher Schwere. Russell schreibt in The Conquest of Happiness : “Grundlegendes Glück hängt mehr als alles andere von einem freundlichen Interesse an Personen und Dingen ab.” Er fährt fort: “Lass deine Interessen so weit wie möglich sein und lass deine Reaktionen auf die Dinge und Personen, die dich interessieren, sind so freundlich wie möglich zu sein. ”

Glück, mit anderen Worten, ist das natürliche Ergebnis der Beobachtung, dass es sehr viele Personen und Dinge in der Welt gibt, die es wert sind, sich freundlich dafür zu interessieren, und nur einer von ihnen ist du selbst. Mit dieser Idee möchte ich diesen Blog schreiben.

Verweise

Mühle, JS (1873/2003). Autobiographie. Projekt Guternberg.

Russell, B. (1930). Die Eroberung des Glücks. New York, NY: Liveright Verlag Corp.