技能说明

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.


中文介绍

当用户要求实现“使用大语言模型作为评判者”、“比较模型输出”、“创建评估标准”、“减少评估偏差”,或提及直接打分、成对比较、位置偏差、评估流程、自动化质量评估时,应使用此技能

直接复制以下提示词,发送给你的 AI 助手即可完成安装。

帮我下载并安装这个SKILL:https://skillhub.cstcloud.cn/download/advanced-evaluation

点击右上角 下载SKILL 按钮

元信息

分类:Data AI
下载:4
浏览:4
标签:
LLM-as-judge pairwise comparison evaluation pipeline