#124: GAIA: a benchmark for General AI Assistants Misreading Chat - A podcast by Hajime Morrita, Jun Mukai Play Categories: Technology LLM に解かせる難問集と採点結果を向井が睨みました。