QuantTrio
/

MiniMax-M2-REAP-162B-A10B-AWQ

Text Generation

4-bit precision

Model card Files Files and versions

JunHowie commited on 11 days ago

Commit

24d603f

·

verified ·

1 Parent(s): 92f557a

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -39,7 +39,7 @@ otherwise the expert tensors wouldn’t be evenly sharded across GPU devices.</i
 ```
 CONTEXT_LENGTH=32768
 vllm serve \
-    tclf90/MiniMax-M2-REAP-162B-A10B-AWQ \
     --served-model-name MY_MODEL \
     --enable-auto-tool-choice \
     --tool-call-parser minimax_m2 \
@@ -69,8 +69,8 @@ vllm serve \
 ### 【Model Download】
 ```python
-from modelscope import snapshot_download
-snapshot_download('tclf90/MiniMax-M2-REAP-162B-A10B-AWQ', cache_dir="your_local_path")
 ```
 ### 【Overview】

 ```
 CONTEXT_LENGTH=32768
 vllm serve \
+    QuantTrio/MiniMax-M2-REAP-162B-A10B-AWQ \
     --served-model-name MY_MODEL \
     --enable-auto-tool-choice \
     --tool-call-parser minimax_m2 \
 ### 【Model Download】
 ```python
+from huggingface_hub import snapshot_download
+snapshot_download('QuantTrio/MiniMax-M2-REAP-162B-A10B-AWQ', cache_dir="your_local_path")
 ```
 ### 【Overview】