https://tianchi.aliyun.com/competition/entrance/231754/introduction
感谢比赛期间JavisPeng开源的优质baseline
问题描述:依据心电图机8导联的数据和年龄、性别特征,预测心电异常事件
比赛数据:32142条初赛数据和20036条复赛数据(初赛数据有重复,初复赛标签分布差异大)
评价指标:MicroF1
标签相关性:计算公式为两标签交集数量除以两标签并集数量,0表示完全互斥。该相关性也可视为一种“特征”。
不同导联节拍一致:尖峰位置一致。
不同导联十分相似:将不同导联画在同一坐标轴上,可看出相似性。如何构建模型以利用这种相似性是最为关键的思路。
针对多导联心电图分类任务,我创新地提出一种网络结构,将其称之为ECGNet: Multi-scale ResNet for Multi-lead ECG Data。该模型是本次比赛的致胜关键。(细节可见PPT)
模型融合阶段效果提升,我认为主要有两点原因:
不足之处:
此外,植物提出的嫁接学习也是种很有意思的思路。
线下对20类标签用单模型评估效果,反正比我自己判断的(仅限电轴偏转方向)好得多。
在处理多导联心电图数据时:
以下是一些失败的尝试(不代表这些方法真的不行,也许是我的打开方式有问题):
总之还是要多思考多去尝试吧,没有什么事能一帆风顺的。
本次比赛收获颇丰,除了实质性奖励以外,还锻炼了我赛题思考、数据分析、模型构建、论文阅读、编程实现以及答辩的能力,且与其他选手交流了一些有趣的思路。
客观上来看,本次比赛有很大的运气成分的,自己还有很多不足。总之,继续努力,再接再厉吧。
单人参赛好累啊,还有复现阶段需要抓紧时间,我差点没在期限内整出来。
很多细节我没有详细介绍,有兴趣地可以看PPT或答辩视频。