GRIFFIN: Effective Token Alignment for Faster Speculative Decoding

Jun-13-2026, 23:52:31 GMT–Neural Information Processing Systems

Speculative decoding accelerates inference in large language models (LLMs) by generating multiple draft tokens simultaneously.

artificial intelligence, large language model, natural language, (7 more...)

Neural Information Processing Systems

Jun-13-2026, 23:52:31 GMT

Conferences Web Page

Technology:
- Information Technology > Artificial Intelligence > Natural Language > Large Language Model (0.61)