任务详情
反向词典的任务:用户输入一段描述,模型将其编码为向量,与模型内词汇进行余弦相似度计算,返回与用户描述相近的千100个词。我有两个公开的Bert预训练语言模型,微调用训练集也已经准备好了。需要用训练集微调Bert语言模型,损失值用“余弦损失”。因为计算余弦损失时需要一个“固定的词向量信息”做“真值”,而这个资源我没有。因此,我需要将已有的Bert预训练模型的向量作为“固定的词向量信息”,让微调训练集的输出与其做近似。测评数据也已经整理好了,以上述的微调完后,用测评数据自动输出,看看准确率。