【比赛报告】biendata_2021搜狐校园文本匹配算法大赛_解决方案

张开发
2026/4/19 3:26:02 15 分钟阅读

分享文章

【比赛报告】biendata_2021搜狐校园文本匹配算法大赛_解决方案
【比赛报告】biendata_2021搜狐校园文本匹配算法大赛_解决方案前言一、赛题二、模型设计三、训练技巧和提升方案四、总结代码开源前言比赛网页之前写过相关的赛题解读想了解的朋友移步《语义匹配二搜狐文本匹配大赛BaseLine比较》本次比赛成绩初赛第4复赛第9决赛第8。虽然最后因为才发现了提交代码有bug但还是分享一下自己的PPT方案。一、赛题二、模型设计三、训练技巧和提升方案四、总结本次比赛主要是为了让自己多多尝试模型的改造与优化对于数据的处理和洞察几乎没有怎么下功夫。导致在最后决赛上发现各个队伍都通过大量的数据处理加上简单的模型就可以达到比较高的分数。总的来说听了其他选手的方案介绍模型设计上没有做太多的创新一般都是基于多任务学习的常规套路给每个任务设置不同的头部组件拼接在bert上。个人的收获是自蒸馏不一定有用大模型真的很难训。对抗训练、Muti-sample Dropout YYDS数据预处理 YYDS对于这种不同颗粒度匹配的任务在实际业务生产中应该更多的手机可以用于对比学习的数据让模型学习到颗粒度之间的明确区别。因为只给出了PPT有不少细节没有全部展现有疑问的朋友欢迎留言我会解答代码开源代码还在整理ing有需要的读者可以留言我加加速QAQ

更多文章