#0. 前言这是什么性质的横评?答:针对使用中文,利用AI帮助自己日常生活和辅助工作的场景设计的AI考核题目,不够权威,不够全面。有没有黑幕?答:没有,我一个路人,没有厂商会收买我。题目也不使用任何互联网公开题目,避免厂家针对性提前训练。9月的评测见:https://www.bilibili.com/read/cv26781548 #1. 评测原则 从本月起,评测分为基础题和写作题两套。其中基础题目前仍然使用v2题库,规则如下: 基础题考察模型基本功:指令理解,阅读理解,逻辑推理,数学计算,科学常...【查看原文】