Efficient multi-prompt evaluation of LLMs