Googles fortschrittliches Gemini-Modell auf Basis von Deep Think holt bei der Internationalen Mathematik-Olympiade Gold mit Problemlösung auf menschl

Bitget App

Trade smarter

MPOST2025/07/24 10:10

Von:MPOST

In Kürze Eine erweiterte Version des KI-Modells Gemini von Google DeepMind erreichte bei der Internationalen Mathematik-Olympiade mit der Lösung von fünf von sechs Problemen eine Leistung auf Goldmedaillenniveau – ein wichtiger Meilenstein der KI im Bereich des mathematischen Denkens auf menschlichem Niveau.

Die Abteilung für künstliche Intelligenz von Google, Google DeepMind gab bekannt, dass eine erweiterte Version seines Gemini Deep Think-Modells bei der Internationalen Mathematik-Olympiade (IMO) fünf von sechs Aufgaben erfolgreich löste und dabei 35 Punkte erreichte – das entspricht einer Goldmedaille. Dies war einer der ersten Fälle, in denen die IMO-Koordinatoren die Ergebnisse eines Modells offiziell nach denselben Maßstäben bewerteten und zertifizierten, die auch für menschliche Teilnehmer gelten.

Das für diese Demonstration verwendete Gemini Deep Think-System featured Verbesserte Denkfähigkeiten, zugeschnitten auf komplexe mathematische Probleme. Es berücksichtigt aktuelle Forschungsentwicklungen, darunter eine Methode namens „Paralleles Denken“, die es dem Modell ermöglicht, mehrere Lösungswege gleichzeitig zu erkunden und zu integrieren, bevor es zu einer endgültigen Antwort gelangt, anstatt einem einzigen linearen Prozess zu folgen.

Um seine Leistung zu verbessern, wurde das Modell mithilfe von Reinforcement-Learning-Techniken trainiert, die das mehrstufige Denken, das Beweisen von Theoremen und die allgemeine Problemlösung verbessern sollen. Das System erhielt außerdem Zugriff auf eine kuratierte Sammlung hochwertiger mathematischer Lösungen sowie Anleitungen zur Bearbeitung von IMO-Fragen.

Eine eingeschränkte Version dieses Deep Think-Modells wird ausgewählten Testern, darunter Mathematikern, zur Verfügung gestellt, bevor es für Abonnenten von Google AI Ultra in größerem Umfang freigegeben wird.

Diese Entwicklung stellt einen bedeutenden Schritt über die Erfolge des letzten Jahres hinaus dar. Im Jahr 2024 erforderten Modelle wie AlphaGeometry und AlphaProof menschliches Eingreifen, um Probleme in domänenspezifische Sprachen (wie Lean) und umgekehrt zu übersetzen. Zudem dauerte die Lösung der Probleme mehrere Tage Rechenzeit. Im Gegensatz dazu ist die aktualisierte Zwillingsmodell erstellte mathematisch anspruchsvolle Lösungen direkt aus den offiziellen IMO-Problemstellungen, vollständig in natürlicher Sprache und innerhalb des standardmäßigen Wettbewerbszeitrahmens von 4.5 Stunden.

Eine erweiterte Version von Gemini mit Deep Think hat bei der Internationalen Mathematik-Olympiade offiziell eine Leistung auf Goldmedaillenniveau erreicht. 🥇

Es löste 5 von 6 außergewöhnlich schwierigen Problemen aus den Bereichen Algebra, Kombinatorik, Geometrie und Zahlentheorie. So geht's 🧵 pic.twitter.com/6jz1eF56wG
– Google DeepMind (@GoogleDeepMind) July 21, 2025

IMO wird zum wichtigsten Maßstab für KI im fortgeschrittenen mathematischen Denken

Die IMO ist ein langjähriger globaler Wettbewerb, der die besten Schülerinnen und Schüler zusammenbringt, um sechs anspruchsvolle mathematische Aufgaben aus den Bereichen Algebra, Kombinatorik, Geometrie und Zahlentheorie zu lösen. Die IMO wurde 1959 ins Leben gerufen und gilt als einer der anspruchsvollsten Mathematikwettbewerbe weltweit. Jedes teilnehmende Land stellt ein Team aus sechs Schülerinnen und Schülern, und die besten 50 % der Teilnehmer erhalten Medaillen, wobei rund 8 % eine Goldmedaille erhalten.

In den letzten Jahren hat sich der Wettbewerb auch als Maßstab für die Bewertung der Fähigkeiten künstlicher Intelligenz bei der Lösung komplexer Probleme und beim mathematischen Denken etabliert. Im Jahr 2024 erreichte ein kombiniertes System von Google DeepMind – AlphaProof und AlphaGeometry 2 – die Silber-Klasse, indem es vier der sechs Probleme löste und 28 Punkte erreichte. Dieses Ergebnis, das auf formalen mathematischen Sprachen basierte, markierte einen bemerkenswerten Fortschritt und demonstrierte das Potenzial der KI, mit den fortgeschrittenen mathematischen Fähigkeiten des Menschen mitzuhalten.

Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.

PoolX: Locked to Earn

APR von bis zu 10%. Mehr verdienen, indem Sie mehr Lockedn.

Jetzt Lockedn!