#124: GAIA: a benchmark for General AI Assistants

Misreading Chat - A podcast by Hajime Morrita, Jun Mukai

Categories:

LLM に解かせる難問集と採点結果を向井が睨みました。