法律大模型测评
中国司法大数据研究院信息化测评中心依托中国合格评定国家认可委员会(CNAS)颁发的检测实验室资质、依据GB/T 25000.51标准、基于10W+法律大模型测试集(Super Legal Bench)和5大维度的评估指标,能够在记忆、理解、逻辑推理、生成和安全方面对法律大模型的质量评估提供专业的第三方测评报告,并可对法律大模型做对比测评,为用户选型提供强有力的支撑。
记忆
测试集
理解
测试集
逻辑推理
测试集
生成
测试集
安全
测试集
咨询测评业务请通过以下方式与我们取得联系
咨询电话:
010-81121651
需求评估:
联系我们
测评需求评估
所在城市
测评服务
验收测评
课题集成验证测评
课题成果测评
性能效率测评
安全性测评
大模型测评
手机号码
*
提交