DiTFastAttn: Attention Compression for Diffusion Transformer Models

Dec-27-2025, 15:54:28 GMT–Neural Information Processing Systems

Diffusion Transformers (DiT) excel at image and video generation but face computational challenges due to the quadratic complexity of self-attention operators. We propose DiTFastAttn, a post-training compression method to alleviate the computational bottleneck of DiT.

attention output, computation, ditfastattn, (15 more...)

Neural Information Processing Systems

Dec-27-2025, 15:54:28 GMT

Conferences PDF

Add feedback

Country:
- South America > Chile
  - Santiago Metropolitan Region > Santiago Province > Santiago (0.04)
- Asia > China
  - Shanghai > Shanghai (0.04)
  - Beijing > Beijing (0.04)

Genre:
- Workflow (0.93)
- Research Report
  - New Finding (1.00)
  - Experimental Study (1.00)

Industry:
- Information Technology (0.46)

Technology:
- Information Technology > Artificial Intelligence
  - Vision (1.00)
  - Natural Language (1.00)
  - Machine Learning > Neural Networks (1.00)
  - Representation & Reasoning (0.93)

Duplicate Docs Excel Report

Title
0267925e3c276e79189251585b4100bf-Paper-Conference.pdf

Similar Docs Excel Report more

Title	Similarity	Source
None found