标准制定

我正在编写一项关于大模型短期记忆能力的标准,目的是评估参测AI大模型短期记忆短期痕迹检索能力。需要有具体评估指标和方法,包含性能指标的描述,罗列计算公式,给出评级范围。对于侧重功能考察的项目,可罗列考察功能点,按功能点满足数量给出评级范围。需要注意的是,评级一共分为5级,1级最弱,5级最强。需给出明确评判描述。对于实在

我正在编写一项关于大模型短期记忆能力的标准,目的是评估参测AI大模型短期记忆短期痕迹检索能力。需要有具体评估指标和方法,包含性能指标的描述,罗列计算公式,给出评级范围。对于侧重功能考察的项目,可罗列考察功能点,按功能点满足数量给出评级范围。需要注意的是,评级一共分为5级,1级最弱,5级最强。需给出明确评判描述。对于实在无法分出5级的项目,可按1级、3级、5级划分,1级最弱,5级最强,给出明确评判描述。