GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism

Yanping Huang, Youlong Cheng, Ankur Bapna, Orhan Firat, Dehao Chen, Mia Chen, HyoukJoong Lee, Jiquan Ngiam, Quoc V. Le, Yonghui Wu, zhifeng Chen

Feb-11-2026, 10:05:42 GMT–Neural Information Processing Systems

Inmany cases, increasing model capacity beyond the memory limit of a single acceleratorhas required developing special algorithms orinfrastructure. These solutions are often architecture-specific and do not transfer to other tasks.

artificial intelligence, machine learning, natural language, (18 more...)

Neural Information Processing Systems

Feb-11-2026, 10:05:42 GMT

Conferences PDF

Add feedback

Country:
- North America > Canada > British Columbia > Metro Vancouver Regional District > Vancouver (0.04)

Technology:
- Information Technology > Artificial Intelligence
  - Natural Language > Machine Translation (0.69)
  - Machine Learning
    - Neural Networks (0.70)
    - Statistical Learning (0.47)

Duplicate Docs Excel Report

Title
GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism

Similar Docs Excel Report more

Title	Similarity	Source
None found