Alle AI-Trends
Direkt in dein Postfach
Erhalte exklusive AI-Tutorials, Praxistipps und KI-News direkt in dein Postfach.
*Mit deiner Anmeldung akzeptierst du unsere Datenschutzrichtlinien.
Jetzt neu bei Byte: Unser WhatsApp Channel 📱

LiveCodeBench

Veröffentlichung
März 2024
Bestes Modell
Score-Bereich
0 – 100 %
Modelle getestet
31
Programmierung
Fortgeschritten

LiveCodeBench — Übersicht

LiveCodeBench ist ein kontaminationsfreier Coding-Benchmark für LLMs, der regelmäßig mit neuen Probleme aktualisiert wird. LiveCodeBench sammelt Coding-Probleme von LeetCode, AtCoder und CodeForces und fokussiert sich über die reine Code-Generierung hinaus auf breitere Fähigkeiten wie Bugfixing, Code-Execution und Test-Output-Vorhersage. Aktuell umfasst LiveCodeBench über 700 Coding-Probleme, die zwischen Mai 2023 und September 2024 veröffentlicht wurden.

LiveCodeBench Leaderboard

Ranking aller getesteten Modelle im LiveCodeBench Benchmark, sortiert nach Score.



Beispielaufgaben aus dem LiveCodeBench Benchmark

Die folgenden Beispielaufgaben zeigen typische Fragestellungen, die im LiveCodeBench Benchmark vorkommen.

Code Generation: Given an array of integers, implement a function that finds the longest increasing subsequence. The function should return the length of the longest subsequence. Input: [10,9,2,5,3,7,101,18] Expected Output: 4

def lengthOfLIS(nums): dp = [1] * len(nums); for i in range(1, len(nums)): for j in range(i): if nums[j] < nums[i]: dp[i] = max(dp[i], dp[j] + 1); return max(dp)

Self Repair: Debug this function that should calculate factorial: def factorial(n): result = 1; for i in range(n): result *= i; return result

def factorial(n): result = 1; for i in range(1, n+1): result *= i; return result # Fix: range should start from 1, not 0