作为3D人脸重建、人脸识别、表情迁移及美化等应用的核心基础技术,人脸关键点检测算法一直是工业界和学术界的研究热点。
近日,在第25届国际模式识别大会(ICPR2020)举办的人脸106关键点检测挑战赛中,搜狗AI团队荣获冠军,彰显其在计算机视觉领域的核心技术实力。
ICPR2020大会是模式识别领域的顶级国际会议,由国际权威学术组织---国际模式识别协会(TheInternationalAssociationforPatternRecognition,IAPR)主办,在本届大会组织的人脸识别领域竞赛单元-人脸106关键点检测比赛中,搜狗AI团队在预赛验证和决赛测试两阶段均取得第一,击败OPPO研究院、美团视觉中心、东南大学、西安交大等多支强队,最终一举摘得桂冠。
图1本届挑战赛决赛阶段前五名结果
ICPR人脸106关键点检测挑战赛是什么?
人脸关键点检测算法的研究重点是在不同表情、性别、年龄、姿态、光照条件下,准确定位人脸轮廓及五官关键点,近年来偏向实用的人脸关键点检测的国际评测陆续举办,国际顶级计算机会议ICME2019就曾举办人脸关键点检测的比赛。
人脸106关键点检测挑战赛(GrandChallengeof106-pFacialLandmarkLocalization)是ICPR2020举办的八项比赛之一,相较于之前的评测,本次ICPR2020大会举办的评测难度更大。其测试样本涵盖大姿态、极端表情、遮挡等多种高难度、复杂的情况,且训练样本少,对算法的泛化能力、准确性及鲁棒性等多个方面提出了巨大的挑战,在比拼检测精度的同时,更加追求技术的实用化程度,对模型复杂度做了更加严格的要求,模型大小需要低于20MB,运算复杂度不超过1GFLOPs,希望推动更加高效并且鲁棒的轻量级人脸关键点检测算法的技术进步,因此极富学术和实用价值,吸引了数十家企业和高校的参赛队伍参赛。
图2本届比赛数据集图片样例
搜狗本届比赛夺冠的技术优势是什么?
作为本届赛事的冠军队伍,搜狗AI团队在人脸关键点检测技术上有三个重要突破。
首先,采用基于HRNet基础模型的改进版本,利用不同分辨率之间特征全融合的方式,有效学习不同尺度图像的语义信息,同时为了保证算法的精度,搜狗增加了HRNet不同分辨率分支的通道数,从而在人脸关键点检测任务上表现出了出色的效果;
图3使用的HRnet网络结构
其次,在卷积层部分采用组卷积,并且把其中的瓶颈层(BottleNeck)改换为MobileNetV2中的逆残差结构(InvertedResiduals),设置逆残差结构的扩展参数为1,从而有效的降低了模型的复杂度;经典残差结构:1x1(压缩)->3x3(卷积)->1x1(升维),逆残差结构:1x1(升维)->3x3(dwconv+relu)->1x1(降维+线性变换),这对基于移动端设计的小模型有广泛的效果提升作用。
图4残差结构图
最后,除了使用常规的平移、旋转等数据增强策略,还使用了PDB(Pose-basedDataBalancing)策略。该策略统计训练数据集中的不同姿态的图片的数量,然后通过简单的复制数量较少的姿态的图片,从而解决了不同的姿态的数据不均衡的问题,对大姿态下关键点的预测起到有效的作用。
表1本届比赛使用的网络结构
最终搜狗的算法在模型大小12MB,模型计算复杂度0.887GFLOPs的基础上,取得了本次比赛中最好的性能,模型累计误差分布曲线面积指标(AUC)达到80.52,归一化平均误差(NME)为1.58,预测失误率(FR@0.08)只有0.05。
图5人脸关键点的累计误差分布图
(曲线与横轴围成的面积越大算法性能越优异)
图5搜狗AI的比赛测试结果样例
坚持技术创新与应用落地并重,搜狗核心AI技术持续领先
搜狗在自然交互与知识计算的人工智能战略指引下,坚持以语言为核心的人工智能研究,近年来在语音、计算机视觉、问答、翻译、对话等核心技术领域取得突破性进展。
在技术创新方面,搜狗在计算机视觉领域一直保持着强劲实力。通用技术方向,于2018年在CVPRWAD自动驾驶视觉竞赛中夺得道路目标检测任务第一名;在国际自动驾驶领域权威评测集Cityscapes实例分割评测任务中同样拿到第一名的好成绩。OCR方向,于2019年11月刷新了ICDAR2019ArT检测、识别、端到端三项单元的新记录;人脸识别方向,于2018年11月在人脸识别顶级评测MegaFace的FaceIdentification(人脸识别)任务中,基于百万规模级别的人脸数据库以99.939%的识别准确率斩获大赛第一名;本次ICPR2020人脸106关键点检测挑战赛中又一次取得技术突破获得冠军,证明了搜狗在计算机视觉领域的领先实力。
在应用落地方面,搜狗自研的人脸相关技术已经应用于搜狗核心产品及解决方案中,其中,领先行业的数字人解决方案-搜狗分身已大量使用了自研的人脸关键点检测、识别以及生成技术,技术的不断突破有力确保了搜狗分身的领先优势;搜狗首创的基于模态注意力机制的语音+唇语的多模态识别技术,强噪声场景下识别准确率提升36%;搜狗最新发布的搜狗AI录音笔-E2在语音能力之外新增了视觉能力,能够支持文档图像识别OCR等技术,后续会陆续扩展人脸识别等相关应用。本次参赛的技术以应用落地为导向,已具备了大规模部署的能力,不久的将来会与搜狗分身、AI硬件、多模态识别等能力产生联动效应,进一步提升搜狗AI创新产品的用户体验。
未来,搜狗将持续在计算机视觉领域推动核心技术研发及创新,不断扩展技术成果的应用落地,带给用户更多差异化的优质体验。
相关文章
-
搜狗扬言要超过百度搜索
公开信息显示,搜狗目前的主要产品分别是输入法、浏览器和搜索。,目前,搜狗输入法已经获得86.3%的市占率,可以源源不断为浏览器输送弹药。,对于如何能够战胜360,王小川表示:“还在想招,这个确实有难度。
2024-03-22 10:48 -
场景式营销撬动移动大局
2013年,与腾讯达成战略合作,这对于搜狗可谓注入了更多的市场可能性,可以更好地发力移动互联网。,来源:世界经理人与腾讯合作随着移动互联网的发展,各家企业纷纷公众号、Q|Q等平台为搜狗搜索提供入口,这无疑给搜狗产品线带来了巨大的支持和补充,尤其是其移动端的发展。,”移动端为搜狗场景营销发展提供了更多机会,而在PC端、移动端开展跨屏联动,这就需要搜狗搭建的场景营销体系能够更为顺畅、多元地满足客户与消
2024-03-22 09:22 -
搜狗地图上线AR实景驾驶导航 未来可能瞄准室内导航
新浪科技讯1月9日晚间消息,近日搜狗地图发布手机地图AR实景驾驶导航功能,以视觉感知和计算能力为基础、AR为表现形式实现高精导航。,”据介绍,搜狗地图本次发布的手机AR实景导航,具有沉浸、精准、安全三大特征。,基于以上三大特征,搜狗地图AR实景导航具备了广泛的应用空间。
2024-03-22 08:55 -
大数据分析宣传十一大抓手第顾客行为人与特点评估
大数据可以采集负面定义内容,及时启动危机跟踪和报警,按照人群社会属性分析,聚类事件过程中的观点,识别关键人物及传播路径,进而可以保护企业、产品的声誉,抓住源头和关键节点,快速有效地处理危机。,跨屏—跨平台用户映射广告大数据应用—人群分类广告效果提升明显35%,用户标签以特征的形式作用于预估模型中,璧合为每一个行业建立独有的模型。,品牌期望将数据应用于营销实践,实现与消费者更有效的沟通。
2024-03-22 08:51 -
大统计数据网络营销与可要视化发展规划设计
大数据营销案例-美国警察降低犯罪案例美国警察降低犯罪案例纽约的犯罪凶杀从1994年1561起下降到1177起车辆盗窃从95凶杀案下降到466起CompStat项目的工作人员每天通过电话和传真向全纽约76个警区收集数据,再将数据统一录入到CompStat,进行加总和分析。,数据可视化:借助于图形化手段,清晰有效地传达与沟通信息。,在此情形下,宝洁、平安都已成为百度亿元级广告主,而在过去,这种量级的投
2024-03-22 08:50 -
搜狗输入法错误推送地震信息:误操作,已下线
新浪科技讯2月4日上午消息,2月3日上午11时左右,部分搜狗输入法用户收到了河北兴隆发生12级地震的地震预警信息,河北省地震局随后辟谣。,目前我们已经紧急下线了这一功能,将在确保产品达到理想状态后再上线。,我们将汲取教训引以为戒,全面加强管理,为用户带来更好的使用体验。
2024-03-22 08:50 -
搜狗高管解读财报:过去两周广告收入已经出现复苏
北京时间3月9日晚间消息,北京时间3月9日下午消息,搜狗今日公布了截至2019年12月31日的第四季及全年未经审计财务报告。第四季度总营收为3.01亿美元,同比增长1%。归属于搜狗公司的净利润为3500万美元,同比增长33%。非美国通用会计准则下,归属于搜狗公司的净利润为3900万美元,同比增长44%。2019年全年总营收为11.7亿美元,同比增长4%,全年归属于搜狗公司的净利润为8910万美元。
2024-03-22 08:32 -
搜狗股权曝光:张朝阳与搜狐共持股40.2% 略超腾讯
作者/雷建平来源:雷帝网(ID:touchweb)原标题:搜狗股权曝光:张朝阳与搜狐共持股40.2%小幅超腾讯搜狗日前向美国SEC递交20-F文件,文件显示,截至2020年3月31日,搜狐CEO张朝阳持有24,686,863股A类股,拥有6.4%股权,及0.9%的投票权;搜狗CEO王小川有21,216,400股A类普通股,有5.5%股权,及0.7%投票权。,当前,受广告市场低迷的影响,搜狗市值为1
2024-03-22 08:08 -
时趣黄叶荣获五门键盘“最佳字母推广网络平台”等三项二等奖
我们从数据分析到内容创意以及销售线索、商机转化来看看“小数据”营销的全过程。,然而在当时,创业并不火热,融资更是难上公众号、市场活动、电话营销、信息流推送等把信息发送给客户。,时趣广告荣获“年度最佳平台”大奖,时趣为饮品酷儿打造的“2016酷?和?年的滋味项目”获大赛银奖,“不满足于知道,试试搜狗”和“Olay双十一#挑战冻龄笑容#”也各自收获铜奖一枚。
2024-03-22 08:05 -
博客全球论坛,搜索字母推广优质服务管理机制扩容
作为技术出身的他,即使离开了阿里妈妈,相信仍将离不开广告技术圈。,时趣广告荣获“年度最佳平台”大奖,时趣为饮品酷儿打造的“2016酷?和?年的滋味项目”获大赛银奖,“不满足于知道,试试搜狗”和“Olay双十一#挑战冻龄笑容#”也各自收获铜奖一枚。,追访商业传奇之《中国二十四功臣》Avazu石一在那腥风血雨的行业,有多少英豪满怀雄心壮志奋力拼杀。
2024-03-22 08:03
热门标签
-
抖音上怎样辨别官方旗舰店?抖音什么店铺是官方正品?
2024-03-21 21:19
-
淘宝客单价怎么提升?提升客单价的意义
2024-03-21 21:19
-
云原生技术服务商时速云完成C1轮融资,开启“双引擎”驱动增长战略
2024-03-21 21:19
-
云鲸“小白鲸”面世一周年,让更多人享受中国智慧科技魅力
2024-03-21 21:19
-
2023年淘宝9月淘宝好价节&国庆狂欢可以撤销吗?
2024-03-21 21:19
-
荷兰蔻帝V3.0专卖店形象:从第一代到第五代的升级
2024-03-21 21:19
-
手机农村淘宝店如何设置客服?怎么操作?
2024-03-21 21:19
-
联想打印机双十一活动都在这了!京东平台优惠多多,最高直降300元
2024-03-21 21:19
-
北京人才吸引力指数重回首位,旅游业三季度?才需求环?增幅跻身前三
2024-03-21 21:19
-
抖音上热门不能用抖币充值吗?哪里充抖音币便宜?
2024-03-21 21:19
-
ARCFOX DAY“甭设限探索日”如何演绎四大破圈时刻
2024-03-21 21:19
-
今年中秋节淘宝有活动吗?今年中秋节淘宝如何引流?
2024-03-21 21:19
-
企业版 WhatsApp 即将收费
2024-03-21 21:19
-
2023年淘宝全国爱牙日什么时候开始?淘宝全国爱牙日优惠吗?
2024-03-21 21:19
-
匠心独运 三星Galaxy Z Fold2 5G 供不应求的秘密
2024-03-21 21:19
-
淘宝账号会员名怎么改?在哪里看?
2024-03-21 21:19
-
腾讯携手佳发推出英语听说智能考试新系统 引入AI技术助力教育智慧化升级
2024-03-21 21:19
-
2023年淘宝全国爱牙日报名要求是什么?
2024-03-21 21:19
-
《跨次元新星》杨颖王琳凯虞书欣为她疯狂 童年回忆杀上线酷狗
2024-03-21 21:19
-
外媒:苹果供应商正崴今年将在印度新工厂开启量产
2024-03-21 21:19