技能说明

Master local LLM inference, model selection, VRAM optimization, and local deployment using Ollama, llama.cpp, vLLM, and LM Studio. Expert in quantization formats (GGUF, EXL2) and local AI privacy.


中文介绍

精通使用 Ollama、llama.cpp、vLLM 和 LM Studio 进行本地 LLM 推理、模型选择、VRAM 优化与本地部署,熟悉量化格式(GGUF、EXL2)及本地 AI 隐私保护

直接复制以下提示词,发送给你的 AI 助手即可完成安装。

帮我下载并安装这个SKILL:https://skillhub.cstcloud.cn/download/local-llm-expert

点击右上角 下载SKILL 按钮

元信息

分类:Development
下载:6
浏览:6
标签:
local LLM inference model quantization local AI deployment