LLM open-framework inference measuremrnt

Framework:

Token latency
1. Avg latency
2. Variance
Pause time
1. Total pause time
2. Pause ratio: pause time / end-to-end inference time
Time to first token
1. Prefilling time
2. Queuing time

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
text-generation-inference		text-generation-inference
vllm		vllm
README.md		README.md