Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

FrontierMath

Veröffentlichung
November 2024
Bestes Modell
Score-Bereich
0 – 100 %
Modelle getestet
19
Logik & Schlussfolgerung
Forschungsniveau

FrontierMath — Übersicht

FrontierMath ist ein MathematikBenchmark für LLMs. FrontierMath besteht aus hunderten anspruchsvollen mathematischen Problemstellungen, die von über 60 führenden Mathematikern erstellt und überprüft wurden (u.a. befand Terence Tao die Aufgaben als "außergewöhnlich anspruchsvoll"). Die Aufgaben decken die meisten großen Teilgebiete der modernen Mathematik ab. Sie reichen von rechenintensiven Problemen der Zahlentheorie und der reellen Analysis bis hin zu abstrakten Fragestellungen der algebraischen Geometrie und Kategorientheorie. 300 der FrontierMath Fragen sind in die Schwierigkeitsstufen 1-3 (Bachelor- bis frühes Doktoranden-Niveau) kategorisiert. Die restlichen 50 gehören zur Stufe 4, dem aktuellen Forschungsniveau. Insgesamt wurden nur 12 Aufgaben aus dem Benchmark veröffentlicht, um eine Datenkontamination, bzw. das Post-Training von Modellen zum Verfälschen der Benchmark-Ergebnisse, zu verhindern. Die Lösung eines typischen Problems aus dem FrontierMath Datensatz erfordert von einem Mathematiker, der sich im jeweiligen Fachgebiet auskenn, mehrere Stunden an Arbeit. Für die schwierigsten Aufgaben können menschliche Probanden gar mehrere Tage für die Lösung brauchen.

FrontierMath Leaderboard

Ranking aller getesteten Modelle im FrontierMath Benchmark, sortiert nach Score.



Beispielaufgaben aus dem FrontierMath Benchmark

Die folgenden Beispielaufgaben zeigen typische Fragestellungen, die im FrontierMath Benchmark vorkommen.

For a positive integer n, let v_p(n) denote the largest integer v such that p^v | n. For p a prime and a not congruent to 0 (mod p), we let ord_p(a) denote the smallest positive integer o such that a^o = 1 (mod p). For x > 0, define ord_{p,x}(a) = prod_{q <= x, q prime} q^{v_q(ord_p(a))} * prod_{q > x, q prime} q^{v_q(p-1)}. Let S_x denote the set of primes p for which ord_{p,x}(2) > ord_{p,x}(3). Let d_x = |S_x| / |{p <= x : p is prime}| and d_inf = lim_{x -> inf} d_x. Compute floor(10^7 * d_inf).

3677073

Construct a degree 19 polynomial p(x) in C[x] such that X := {p(x) = p(y)} subset P^1 x P^1 has at least 3 (but not all linear) irreducible components over C. The polynomial p(x) must be odd, monic, possess real coefficients, and have linear coefficient -19. Calculate p(19).

1876572071974094803391179

Let a_n for n in Z be the sequence defined by a_n = (1.981 * 10^11) * a_{n-1} + (3.549 * 10^11) * a_{n-1} + (4.277 * 10^11) * a_{n-2} + (3.706 * 10^8) * a_{n-3}, with initial conditions a_i = i for 0 <= i <= 3. Find the smallest prime p congruent to 4 (mod 7) for which the function Z -> Z given by n -> a_n can be extended to a continuous function on Z_p.

9811