百度生物特征识别大赛-复赛

写在前面

首届生物特征识别大赛,科赛网。内容包括吗,mtcnn进行人脸检测,matlab下仿射变换在python下的实现,数据清洗与数据均衡。

最终名次,第8。准确率94.4%。

使用paddlepaddle.fluid。

预处理

1.采用mtcnn进行人脸裁剪并对齐,尽可能保留相关元素。

2.采用随机裁剪、色彩增强等方式对数据集进行上采样扩充,尽量控制数据集均衡。实验证明,均衡后的数据集训练效果更好,但是由于数据集更大,训练时间更长。

训练网络

采用sphereface20-net,效果比较理想。

学习率采用warmup策略,结合early stop,有不错提升。由于数据集较大,batch size=512需要跑1300多个batch才一轮epoch,最终未能训练到最优。

整个过程主要调整参数为lr, weight decay。

尝试构造centerloss, amsoftmax均失败,原因是paddle有些接口存在bug,这个没办法,尽力了QAQ。

人脸验证

采用mirror trick测试,最后max out会有较好结果,大概能提升2%~

源码链接

完整源码文件在我的github

jupyternote book参阅kesci平台

本文标题:百度生物特征识别大赛-复赛

文章作者:Lumo Wang

发布时间:2018年09月14日 - 13:09

最后更新:2018年11月07日 - 15:11

原始链接:https://luameows.github.io/2018/09/14/比赛-百度生物特征识别大赛-复赛/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

请我喝杯咖啡,我会继续熬夜的~