您的位置:首页 > 任务详情
招标模式 AI算法工程师
  • 雇主:mike
  • 发布时间:2024-04-24
  • 分类:程序开发

¥ 8000

免责声明 该外包需求信息来源于站外平台,本站仅提供公开信息部分字段展示与订阅服务,更多请查看免责声明。

任务详情

对BERT-base模型使用fp4/log4数据类型混合量化,量化后的模型推理准确度下降程度小于1 %。 2.技术内容: 1) 需要量化BERT-base模型中每一个Transformer block(一共12个); 2)每一个Transformer block中,需要量化生成QKV矩阵的权重矩阵WQ/WK/WV和输入token矩阵,输入token的数据类型要求fp8或fp16,权重的数据类型要求fp4; 3)每一个Transformer block中,FFN层、proj层的输入量化为fp8或fp16,权重量化为fp4; 4)每一个Transformer block中的每一个自注意

任务附件 (0)

暂无稿件哦!

预期中标

已中标

0

快去分享,提高任务的曝光率吧

  • 发布需求     2024.04.24
  • 服务商报价    
  • 选择服务商并托管资金    
  • 服务商工作    
  • 验收付款    
  • 评价