Haoran Qiu

All Stories

TAPAS: Thermal- and Power-Aware Scheduling for LLM Inference in Cloud Platforms

Article • March 2025, ACM (Association for Computing Machinery)

Haoran Qiu
Queue Management for SLO-Oriented Large Language Model Serving

Article • November 2024, ACM (Association for Computing Machinery)

Haoran Qiu
SIMPPO: A Scalable and Incremental Online Learning Framework for Serverless Resource Management

Article • November 2022, ACM (Association for Computing Machinery)

Haoran Qiu
Evaluating Hardware Memory Disaggregation under Delay and Contention

Article • May 2022, Institute of Electrical & Electronics Engineers (IEEE)

Haoran Qiu
Reinforcement learning for resource management in multi-tenant serverless platforms

Article • April 2022, ACM (Association for Computing Machinery)

Haoran Qiu, Hubertus Franke
A Geography-Based P2P Overlay Network for Fast and Robust Blockchain Systems

Article • IEEE Transactions on Services Computing, January 2022, Institute of Electrical & Electronics Engineers (IEEE)

Haoran Qiu
Is Function-as-a-Service a Good Fit for Latency-Critical Services?

Article • December 2021, ACM (Association for Computing Machinery)

Haoran Qiu, Hubertus Franke
Delay sensitivity-driven congestion mitigation for HPC systems

Article • June 2021, ACM (Association for Computing Machinery)

Haoran Qiu
OWL: Understanding and Detecting Concurrency Attacks

Article • June 2018, Institute of Electrical & Electronics Engineers (IEEE)

Haoran Qiu