feature(wqj): add vllm_test.py in ding/worker #853

wqj2004 · 2025-01-16T13:29:39Z

Overview

The whole RLHF training pipeline

Goal

In this PR, we need to finish the collector part in the above figure and add its unittest.

TODO

add vllm inferencer for LLM/VLM
scale up vllm inferencer in multi-GPUs
add several datasets definition @PaParaZz1
survey proper VQA dataset for RLHF training
add the final collector and test it on the above dataset
add tutorial and API doc
(optional) add search tools @PaParaZz1

ding/worker/vllm_test_wqj.py

PaParaZz1 · 2025-01-19T09:54:11Z

ding/worker/vllm_test_wqj.py

+
+model=HuggingFaceModelGenerator('/mnt/afs/share/Qwen2-VL-7B',temperature=0.5) #设置一个temperature就好了,可以做到生成多个候选答案
+
+def get_prompts_qwen(questions: list,modality: str):


polish code style

PaParaZz1 · 2025-01-19T09:54:21Z

ding/worker/vllm_test_wqj.py

+    stop_token_ids = None
+    return prompts,stop_token_ids
+
+def get_multi_modal_input(modality,filenames,questions):


add python typing lint

ding/worker/vllm_test_wqj.py

PaParaZz1 · 2025-01-19T13:46:16Z

ding/worker/vllm_test_wqj.py

+#img_names=['/mnt/afs/niuyazhe/data/meme/data/Eimages/Eimages/Eimages/image_ (2)']
+num_prompts=len(questions)
+image_repeat_prob=None
+modality = 'image'


use enum class to control this field rather than the naive string

ding/worker/vllm_test_wqj.py

vllm_test.py in ding/worker

d857bd6

wqj2004 changed the title ~~vllm_test.py in ding/worker~~ add vllm_test.py in ding/worker(wqj) Jan 17, 2025

wqj2004 changed the title ~~add vllm_test.py in ding/worker(wqj)~~ feature(wqj):add vllm_test.py in ding/worker Jan 17, 2025

PaParaZz1 added the enhancement New feature or request label Jan 19, 2025

PaParaZz1 changed the title ~~feature(wqj):add vllm_test.py in ding/worker~~ feature(wqj): add vllm_test.py in ding/worker Jan 19, 2025

PaParaZz1 requested changes Jan 19, 2025

View reviewed changes

wqj2004 added 6 commits January 21, 2025 05:51

add vllm_collector and test_vllm

db30764

formatted vllm & test_vllm

91a5a15

enum+typing lint

4eb8e1d

add test_vllm_collector_multigpu.py

47212da

Add test_vllm_collector_multigpu

44ec9ce

formatted test_vllm_collector_multigpu

2caa7c7

PaParaZz1 mentioned this pull request Jan 24, 2025

feature(nyz): add rlhf dataset #854

Open

3 tasks

wqj2004 added 6 commits January 26, 2025 04:45

Merge remote-tracking branch 'upstream/main'

2b4911d

formatted

fca8e72

style_fixed

46cd3cf

formatted

1d83026

formatted

f04472b

formatted

36a8fdc

PaParaZz1 mentioned this pull request Jan 27, 2025

Roadmap for DI-engine #548

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feature(wqj): add vllm_test.py in ding/worker #853

feature(wqj): add vllm_test.py in ding/worker #853

wqj2004 commented Jan 16, 2025 •

edited

Loading

PaParaZz1 Jan 19, 2025

PaParaZz1 Jan 19, 2025

PaParaZz1 Jan 19, 2025


		model=HuggingFaceModelGenerator('/mnt/afs/share/Qwen2-VL-7B',temperature=0.5) #设置一个temperature就好了,可以做到生成多个候选答案

		def get_prompts_qwen(questions: list,modality: str):

feature(wqj): add vllm_test.py in ding/worker #853

Are you sure you want to change the base?

feature(wqj): add vllm_test.py in ding/worker #853

Conversation

wqj2004 commented Jan 16, 2025 • edited Loading

Overview

The whole RLHF training pipeline

Goal

TODO

PaParaZz1 Jan 19, 2025

Choose a reason for hiding this comment

PaParaZz1 Jan 19, 2025

Choose a reason for hiding this comment

PaParaZz1 Jan 19, 2025

Choose a reason for hiding this comment

wqj2004 commented Jan 16, 2025 •

edited

Loading