需要34b-chat-16k 量化版本 #28

weiminw · 2024-06-06T16:47:52Z

感谢你们发布强悍的模型，是否可以发出 awq或者 gptq-int4

Yimi81 · 2024-06-08T13:44:53Z

好的我会反馈需求。此外，社区已经有相应的版本，你可以测试使用~

zhanghx0905 · 2024-06-11T06:00:12Z

目前还未找到34b-chat-16k的4bit量化模型，只见过4k上下文版本的量化模型。
如果大家发现了量化后的34b-chat-16k模型，能否分享一下？谢谢！

Yimi81 · 2024-06-11T07:35:45Z

masterwang22327 · 2024-07-31T09:13:22Z

原始的Yi-1.5-34B-Chat-16K太慢了同样的Qwen1.5-32B 速度快它一倍代码生成能力也烂到爆炸

Haijian06 added the question Further information is requested label Aug 2, 2024

Provide feedback