Master local LLM inference, model selection, VRAM optimization, and local deployment using Ollama, llama.cpp, vLLM, and LM Studio. Expert in quantization formats (GGUF, EXL2) and local AI privacy.
精通使用 Ollama、llama.cpp、vLLM 和 LM Studio 进行本地 LLM 推理、模型选择、VRAM 优化与本地部署,熟悉量化格式(GGUF、EXL2)及本地 AI 隐私保护
直接复制以下提示词,发送给你的 AI 助手即可完成安装。
点击右上角 下载SKILL 按钮