André Loureiro Espírito Santo – Kudos: Growing the influence of research

All Stories

Accelerating MoE Model Inference with Expert Sharding

Article • March 2025, ACM (Association for Computing Machinery)

Oana Balmau, André Loureiro Espírito Santo