Künstliche Intelligenz gegen Mensch: DeepMind AlphaStar
Inhaltsverzeichnis
AlphaStar – geschaffen um Menschen zu besiegen.
Google hat es erneut auf Menschen abgesehen. Wir wurden schon in Januar (erneut) von Maschinen geschlagen. Was AlphaStar, eine künstliche Intelligenz für das Videospiel StarCraft 2, mit den Profi-Spielern TLO und MaNa anstellte, grenzte fast an Demütigung. Blizzard (die Publisher des Spiels StarCraft 2) und DeepMind (eine Tochterfirma von Google) kündigten Mitte 2019 an, dass das Projekt den nächsten Schritt gehen wird.
Im Jahre 2019 sorgt es kaum mehr für Überraschung, wenn Computer bestimmte Tätigkeiten viel effizienter, präziser und schneller erledigen können als ihre menschlichen Erschaffer. Dies ist der treibende Grundgedanke hinter Industrie 4.0. Heute können innovative Softwarelösungen Flugzeuge landen1, Krebs diagnostizieren2 oder an der Börse handeln3. Es existiert mittlerweile ein spannender Wettbewerb zwischen IT-Firmen: darum wer künstliche Intelligenz am effektivsten einsetzen und komplexe Aufgabenstellungen dadurch lösen wird. Wer diesen Trend beobachten möchte, kann zum Beispiel einen Blick in die Branche des autonomen Fahrens werfen — Stichwörter: Tesla, Uber, Google.
Wie gelingt es uns aber, die Qualität eines Algorithmus auf den Prüfstand zu stellen? Die einzigen Referenzen, auf die sich berufen werden kann sind die Leistungen von Menschen. Dadurch entsteht für die führenden Unternehmen der Branche der Anreiz, diese mit ihren Algorithmen zu schlagen. Schließlich wird sich die künstliche Intelligenz nur dann etablieren, wenn sie die Durchführung einer Aufgabe „besser“ meistert als ihre menschliche Konkurrenz4. Beim autonomen Fahren wird das zum Beispiel indirekt durch Unfallstatistik verglichen5. Ein direkter Vergleich zwischen Mensch und Maschine bleibt trotzdem die zuverlässigste Methode. Aus diesem Grund kommt es häufig vor, dass Unternehmen Profis gegen ihre Algorithmen antreten lassen. So ließ das israelische Unternehmen LawGeex Anfang 2018 sein gleichnamiges Produkt (eine Art KI-Anwalt) gegen 20 weitere prominente Anwälte antreten und hat diese gewonnen67. Google’s DeepMind hat sich auch für einen ähnlichen Ansatz entschieden: direkte Herausforderung von Profi-Spielern.
Was ist StarCraft 2?
StarCraft 2 ist ein Computerspiel der Firma Blizzard und gehört zu dem Genre „Real Time Strategy“ (RTS). Dabei müssen die Spieler strategische Entscheidungen treffen. Es geht hauptsächlich darum, zur Verfügung stehende Ressourcen zu sammeln und diese so effizient wie möglich zu nutzen. Historisch gesehen geht es in einem RTS-Spiel um den Aufbau und Steuerung einer Armee. Heute beinhaltet das Genre auch zahlreiche politik- und wirtschaftsbezogene Spiele.
StarCraft 2 und ähnliche Echtzeit-Strategiespiele haben grundsätzlich zwei Techniken, die beherrscht werden müssen. Macro (Macroeconomics) beschreibt die wirtschaftliche Vorgehensweise eines Spielers. Dazu gehören Entscheidungen wie die Build Order. In dem Bereich beschäftigen sich die Spieler mit der Frage: Wann baue ich welche Gebäude / Einheiten und erforsche neue Technologie? Die zweite Disziplin nennt sich Micro (Micromanagement). Hier beschäftigen sind die Spieler damit, ihre einzelnen Einheiten zu managen.
Was ist AlphaStar?
Googles DeepMind entwickelte eine künstliche Intelligenz, die darauf spezialisiert ist, StarCraft 2 zu spielen. Was sich zunächst wie eine Spielerei in großen Dimensionen anhört, ist ein großangelegtes Forschungsprojekt. DeepMind erhofft sich, durch das Projekt neue Erkenntnisse im Bereich Modellierung komplexer Probleme für maschinelles Lernen zu erlangen.8 Maschinelles Lernen kommt Beispielsweise bei Sprach- und Texterkennung, selbstständiges erkennen von Spam-Mails oder autonomes Fahren zum Einsatz
Der nordamerikanische Profispieler und Caster WinterSC hat es später in seiner Stream mehrfach erwähnt, dass er von AlphaStar sehr positiv überrascht war. Der Skilllevel von AlphaStar übertrifft seine Erwartungen. Er machte zusätzlich auf das eigenartige — sich von dem menschlichen drastisch unterscheidende — Entscheidungsmodell aufmerksam.
Niederländische StarCraft 2 Caster LowkoTV äußerte sich ebenfalls über Entscheidungsfindung der AlphaStar. Es ist tatsächlich sehr interessant, weshalb er seine Mineral-Line immer übersättigt hat. Ebenfalls ist es sehr interessant, weshalb er keine Mauer gebaut hat. Ebenfalls gab es von LowkoTV ein Lob an die Entscheidungslogik in einem weiteren Tweet so wie in seinem Youtube-Analysevideo.
TLO, der ebenfalls gegen AlphaStar spielte und verlor verteidigte die Niederlage seiner Teamkameraden MaNa und lobte AlphaStar.
Viel mehr analysierten viele prominente Spieler die Spielweise AlphaStars. Neben MaNa, die gegen AlphaStar antritt analysierten weitere Caster und Prospieler die Spiele. Dazu gehörten Beispielsweise Beastyqt, Artosis, Alex007, PiG, WinterSC und LowkoTV. Jede Videos macht auf unterschiedliche Stärken und Schwächen der AlphaStar aufmerksam, eines haben sie allerdings gemein: Die Entscheidungen der AlphaStar sind eigenartig doch effektiv. Die Skilllevel ist unerwartet hoch. LowkoTV bringt es in seinem Tweet sehr gut auf den Punkt.
AlphaStar aktuell
Blizzard gab Mitte Juli bekannt, dass das Projekt den nächsten Schritt einnimmt. AlphaStar kann jetzt alle drei Rassen gegen beliebige Gegner auf beliebige Karten spielen. Dementsprechend soll die KI gegen echte Spieler überall auf der Welt spielen.9 Um Hawthorne Effekt auszuschließen, werden die AlphaStar Agenten anonymisert. Hawthorne Effekt beschreibt, dass das Wissen Gegenstand einer Untersuchung zu sein das Verhalten der Probanden ändert.10 In diesem Fall könnten die Spieler sich besonders anstrengen oder eine extra cheesy (unkonventionelle) Strategie verfolgen, die ein normaler Spieler nie machen würde.
Die drei „bestätigten“ AlphaStar Accounts sind unten aufgelistet, falls ihr euch die Statistiken und Spielweise anschauen wollt. Ebenfalls verlinke ich die zur Verfügung stehende Replays der AlphaStar Spiele. Um diese anzuschauen, benötigt ihr einen installierten StarCraft 2. Meine persönliche Empfehlung ist das Spiel zwischen AlphaStar Zerg und StekepaNNe. AlphaStar wendet unterschiedlichste Taktiken wie Reaper Scout, Helion Harass, 1-1-1 Opener, einen Bio Switch und eine sehr aggresive Spielweise.
AlphaStar und dessen Bedeutung für die Gesellschaft
Ich werde eine umfassende Analyse der elf Spiele aus der Hinsicht eines KI-Entwicklers und Starcraft Spielers vorführen. Ich werde die Highlights und Techniken erklären, wie die Menschen 10-1 verlieren konnten. Ebenfalls werde ich auf die Frage eingehen, ob der Sieg dieser künstlichen Intelligenz fair war. Ebenfalls müssen wir den Sieg von MaNa analysieren, wie es dazu kommen konnte. Bevor das alles möchte ich aber erst mal die gesellschaftliche Bedeutung der AlphaStar darlegen, ohne tief ins Detail zu gehen.
Sind Computer besser als Menschen?
Ein klares Jain ist an dieser Stelle angebracht. Auch wenn manche Menschen den Sieg der AlphaStar dementieren, sind viele Profispieler — inklusive TLO und MaNa, die gegen AlphaStar verloren haben — sich einig. AlphaStar gewann, weil er in vielerlei Hinsicht besser war. Es ist kein Geheimnis mehr, dass durch die steigende Rechenleistung und sinkende Preise für Computer, bestimmte Jobs durch den Computer übernommen werden. Was AlphaStar uns als Gesellschaft klar machen sollte: Es ist für Computer möglich nicht nur einfache Jobs zu ersetzen. Es ist möglich, komplexere Aufgaben zu automatisieren, die sogar strategische Entscheidungen beinhalten. Denn eine komplexe Aufgabe ist nichts anderes als mehrere sequenziell erfolgende einfache Aufgaben. Das Herunterbrechen und mathematisch Beschreiben ist dann die Aufgabe der Informatiker.
Es bleibt jedenfalls spannend, ob die Jobs, die durch die neuen Technologien geschaffen werden, die Anzahl abdecken, die dadurch wegfallen. Ich möchte aber nicht von einer dystopischen Welt erzählen, in dem die Computer die Menschen obsolet machten. Mich beschäftigt viel mehr ein anderer Aspekt der AlphaStar: Die Spielweise der AlphaStar war grundlegend anders. Er hat sich nicht auf die menschlichen Methoden konzentriert, die sich im Laufe der letzten Jahre etabliert haben.
Die zukünftige Rolle der Menschen
Bislang wurde die Technologie – sei es Automatisierung oder KI – dafür genutzt, die alte Praktiken effizienter zu erledigen. AlphaStar fokussierte sich stattdessen auf seine eigenen Stärken und baute seine Strategie darauf auf. Während das Erfolgsrezept der Mensch in StarCraft 2 bislang auf wirtschaftliche Dominanz oder List basierte, dominierte AlphaStar mit Multitasking, schnelle Informationsanalyse und präzise Reaktion auf die menschliche Interaktion. Im Umkehrschluss bedeutet das für die Gesellschaft, dass wir eines Tages aus wirtschaftlichen Gründen einen Schritt wagen könnten, bei dem der Mensch im Falle eines Computer-Ausfalls keinen Ersatz mehr darstellt. Die gängigen Methoden könnten eines Tages nicht für Menschen geeignet sein.
Nutzen der KI-Wettbewerbe für die Gesellschaft
Es wäre falsch, KI Wettbewerbe als Muskelprotz-Wettbewerb abzutun. Wir profitieren heute schon von solchen Wettbewerben. Eine Verwendung der gewonnenen Erkenntnisse findet durch Wissenstransfer statt. DeepMinds AlphaGo, eine KI für das Brettspiel Go erzeugte zahlreiche Erkenntnisse in dem Bereich „deep reinforced learning“. Diese Erkenntnisse werden jetzt in Zusammenarbeit mit National Grid UK für die Optimierung der britischen Stromnetze eingesetzt.11
Ebenfalls hat DeepMinds Wettbewerber OpenAI durch sein Projekt in Dota 2 Erkenntnisse in KI erlangt. Diese Erkenntnisse kamen später in einer Roboterhand zum Einsatz, die selbstständig Objekte erkennen und fassen gelernt hat.12 Diese Fähigkeit erlangte die künstliche Intelligenz selber, ohne dass ein Mensch ihn je erklärt hat, wie man nach Objekten greift.
Quellen
- https://www.flightdeckfriend.com/can-a-plane-land-automatically
- https://www.theguardian.com/technology/2018/jun/10/artificial-intelligence-cancer-detectors-the-five
- https://www.investopedia.com/terms/a/algorithmictrading.asp
- https://www.harvardbusiness.org/dont-wait-for-ai-to-be-perfect/
- https://www.kfz-betrieb.vogel.de/unfallstatistik-autonome-autos-in-den-meisten-faellen-nicht-schuld-a-785596/
- https://www.lawgeex.com/resources/aivslawyer/
- https://hackernoon.com/20-top-lawyers-were-beaten-by-legal-ai-here-are-their-surprising-responses-5dafdf25554d
- https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/
- https://news.blizzard.com/en-us/starcraft2/22933138/deepmind-research-on-ladder
- F.J.Roethlisberger \& William J. Dickson: \textit{THE RELAY ASSEMBLY TEST ROOM SUPERVISION}. In: THE EARLY SOCIOLOGY OF MANAGEMENT AND ORGANIZATIONS, S. 137-138
- https://www.wired.com/2017/05/googles-alphago-levels-board-games-power-grids/
- https://openai.com/blog/learning-dexterity/