S-STE: Continuous Pruning Function for Efficient 2: 4 Sparse Pre-training

May-29-2025, 04:57:31 GMT–Neural Information Processing Systems

Training deep neural networks (DNNs) is costly. Fortunately, Nvidia Ampere and Hopper GPUs can accelerate matrix multiplications twice as fast as a dense equivalent by implementing 2:4 sparsity.

artificial intelligence, machine learning, proceedings, (18 more...)

Neural Information Processing Systems

May-29-2025, 04:57:31 GMT

Conferences PDF

Add feedback

Country:
- North America > United States
  - Pennsylvania (0.14)
  - Texas (0.14)

Genre:
- Research Report > Experimental Study (0.93)

Industry:
- Information Technology (0.48)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Neural Networks > Deep Learning (0.67)