LiveCodeBench
LiveCodeBench — Übersicht
LiveCodeBench ist ein kontaminationsfreier Coding-Benchmark für LLMs, der regelmäßig mit neuen Probleme aktualisiert wird. LiveCodeBench sammelt Coding-Probleme von LeetCode, AtCoder und CodeForces und fokussiert sich über die reine Code-Generierung hinaus auf breitere Fähigkeiten wie Bugfixing, Code-Execution und Test-Output-Vorhersage. Aktuell umfasst LiveCodeBench über 700 Coding-Probleme, die zwischen Mai 2023 und September 2024 veröffentlicht wurden.
LiveCodeBench Leaderboard
Ranking aller getesteten Modelle im LiveCodeBench Benchmark, sortiert nach Score.
Beispielaufgaben aus dem LiveCodeBench Benchmark
Die folgenden Beispielaufgaben zeigen typische Fragestellungen, die im LiveCodeBench Benchmark vorkommen.
Code Generation:
Given an array of integers, implement a function that finds the longest increasing subsequence. The function should return the length of the longest subsequence.
Input: [10,9,2,5,3,7,101,18]
Expected Output: 4
def lengthOfLIS(nums): dp = [1] * len(nums); for i in range(1, len(nums)): for j in range(i): if nums[j] < nums[i]: dp[i] = max(dp[i], dp[j] + 1); return max(dp)
Self Repair:
Debug this function that should calculate factorial:
def factorial(n):
result = 1;
for i in range(n):
result *= i;
return result
def factorial(n): result = 1; for i in range(1, n+1): result *= i; return result # Fix: range should start from 1, not 0