CSTCloud SkillHub - 安全可信的 AI Skill 广场

技能说明

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

中文介绍

当用户要求实现“使用大语言模型作为评判者”、“比较模型输出”、“创建评估标准”、“减少评估偏差”，或提及直接打分、成对比较、位置偏差、评估流程、自动化质量评估时，应使用此技能

直接复制以下提示词，发送给你的 AI 助手即可完成安装。

帮我下载并安装这个SKILL：https://skillhub.cstcloud.cn/download/advanced-evaluation

点击右上角下载SKILL 按钮

元信息

分类：Data AI

下载：4

浏览：4

标签：

LLM-as-judge pairwise comparison evaluation pipeline