摩杜云开发者社区-摩杜云

Html/CSS

自然语言理解标签描述

文章 | 大模型评测工具&评测基准

  ● 评测工具：用于评估模型的整体能力 ● 评测基准：用于评估模型在特定任务方面的能力   评测集名称核心维度测试模型的描述评测类型 MMLU 多模态语言理解理解文本、图像和音频等多种模态数据之间的关系方面的能力评测工具 AGIEVAL 通用人工智能自然语言理解、机器翻译、视觉识别等多种不同任务方面的能力评测工具 ARC 对话理解理解对话场景中的意图和信息方面的能力评测工具 CEval 自然语言推理理解和推理自然语言中的逻辑关系方面的能力评测工具 Race 阅读理解理解文本的语义和结构方面的...

Mo38EtKtgCNG 2023年12月12日 14 0 0 自然语言理解模态机器翻译自然语言理解模态机器翻译