《益气陈珏上汤科技》入选CVPR 2018年44篇论文 发布时间:2020-03-24
IEEE CVPR 2018 (IEEE国际计算机视觉和模式识别会议)将于6月在盐湖城举行。来自世界各地的总共979篇论文将被接纳参加这次会议。CVPR是计算机视觉领域最高水平的研究会议,其录取论文代表了2018年计算机视觉领域最新、最高水平的科学技术和未来发展趋势。
CVPR官方网站显示,今年提交了3300多篇会议论文,979篇论文被录取,比去年增长了25%(2016年有783篇论文被录取)。这些招生的最新科学研究结果涵盖了计算机视觉领域的所有前沿工作。2018年中国国际工业博览会包括21个教程和48个研讨会,来自世界各地的115家企业将参加今年的CVPR工业展览会。
本次CVPR会议共接受了来自上汤科技、香港中文大学-上汤科技联合实验室等上汤科技联合实验室的44篇论文,其中包括3篇口头报告论文(接受率仅为62/3300=1.88%),13篇重点报告论文,接受论文数明显高于2017年中国期刊全文数据库的23篇论文,成绩显著。世界领先的科学研究成果显示了汤在科学、技术、智力和视觉领域的强大人才储备、科研背景和创新能力。
上塘科技2018年招生论文在以下领域取得突破:大规模分布式训练、人体理解和行人再识别、自动驾驶场景理解和分析、底层视觉算法、视觉和自然语言的综合理解、目标检测、识别和跟踪、深度生成模型、视频和行为理解等。这些新颖的计算机视觉算法不仅具有丰富的应用场景,使得更多的智能视觉算法能够应用到日常生活中,而且为后续的研究提供了宝贵的经验和方向。
大规模分布式培训
代表性论文:深度强化学习自动网络结构的口语设计
本文旨在解决深层神经网络结构的自动设计问题。不同于一般的人工结构设计,本文提出了一种通过强化学习自动设计最优网络结构的有效算法。传统的神经网络结构设计通常需要大量的专家知识和试错成本,甚至需要一些灵感。每年只设计几个重要的网络结构。因此,网络结构的人工设计是一项非常困难的任务。最近自动搜索网络结构的算法通常需要巨大的计算资源(数百个图形处理器,近一个月的训练),并且产生的模型不够便携,不能真正实用。
提出了一种基于强化学习的自动网络结构设计算法。通过“网络块”的设计思想,大大减少了搜索空间,设计的网络具有很强的可移植性。同时,本文采用“早停”和分布式体系结构加快了整个网络结构学习过程,速度比以前的算法(32个GPU,3天训练)快100倍。在实验面上,它生成的网络结构达到并超过了人类在CIFAR数据集上设计的网络结构的精度,并且其结构可以移植到性能良好的大规模ImageNet数据上。
人类理解和行人识别
代表性论文:基于群体一致性约束的口语行人识别
行人再识别是新一代智能安全系统的重要组成部分之一。给定行人图像,行人再识别需要基于同一行人在不同摄像机上的视觉外观对其进行精确匹配和识别。现有的深度学习算法通常使用过于局部的约束损失函数进行行人特征学习,因此不能准确地学习行人图像之间的视觉相似度。针对这一问题,提出了一种新的群一致性约束条件,该约束条件由连续条件随机场建模。将连续条件随机场加入深度神经网络,实现深度模型的端到端训练。实验结果表明,一致性条件可以大大提高训练和测试中最终视觉特征的鲁棒性和区分度,实现高精度的行人识别。
自动驾驶场景理解
代表性论文:
低延迟聚焦视频语义分割
本文主要研究面向自主驾驶场景的视频实时语义分割。尽管近年来图像语义分割取得了很大进展,但是面向视频的语义分割仍然存在挑战。主要困难是:1)视频需要更多的计算;2)许多实时应用(如自动驾驶)需要实现低延迟。
本文致力于解决这两个问题,尽可能保证分割的准确性。在视频分割中,相邻帧之间语义标签的变化相对较小,因此没有必要使用完整的网络来提取每帧的语义标签。基于这种理解,本文提出了一种如图所示的语义分割框架,将整个网络分为高层次和低层次两部分,低层次部分消耗较少的计算量。本文的框架只在关键帧中运行一个完整的网络来提取高级特征用于语义分割,而在其他帧中它传播来自前一个关键帧的特征用于语义分割。相应的框架由两部分组成:1)关键帧调度模块和2)特征跨帧传播模块,它们都基于低层特征执行相应的计算,因此相对完整的网络计算要小得多。同时,为了减少延迟,当当前帧被检测为关键帧时,使用低延迟调度策略。本文提出的方法在两个数据集上验证了该方法的有效性,获得了较低的延迟,并保持了准确的分割精度。
基于单视图的聚光灯立体匹配
用于自动驾驶场景的单目深度估计方法通常使用来自一个视角的图像数据作为输入来直接预测图像中每个像素对应的深度值,这导致现有方法通常需要大量标注有深度信息的数据。最近的研究提出了在训练过程中引入几何约束的改进,但是在测试过程中仍然缺乏明确的几何约束。本文提出将单目深度估计分解为两个子过程,即视图合成过程和双目匹配过程。经过这样的分解,该模型不仅可以在测试阶段明确引入几何约束,而且大大降低了对深度标注数据的依赖。实验表明,在KITTI数据集上,本文提出的方法仅用少量的深度数据就能超越以往的所有方法。单目图像数据首次超越了双目匹配算法块匹配,进一步推动了单目深度估计技术的落地。
底部视觉算法
代表性论文:基于深度增强学习的点通用图像复原
本文提出了一种新的深度学习图像复原方法。现有的复原算法大多只针对某一类图像复原问题,对各种退化图像缺乏普适性。为了解决这个问题,本文提出的RL-Restore算法首先针对不同退化图像训练一系列小神经网络。同时,设计了一个评价图像恢复质量的奖励函数,并利用强化学习算法学习如何合理组合这些小神经网络。针对不同的退化图像,获得不同的恢复算法组件组合,实现复杂退化图像的有效恢复。
视觉和自然语言的综合理解
代表性论文:用于视觉问题回答的点-双视觉问题生成
为了解决开放式可视问答中训练数据太少的问题,提出了一种“可逆问答网络”。该模型可以通过重组不同的模块,使一组模型同时完成“问题回答”和“问题生成”两个交互任务。该模型充分利用了视觉问答和视觉问题产生的双重性,提高了模型在有限训练数据下的效率。该方法利用两个任务同时训练同一个模型,使网络能够更深入地理解问题和图片之间的关系,从而在问题生成和问题回答任务中取得更好的准确性和效果。
人脸识别和人脸分析
代表性论文:
人脸识别之外的海报-人脸分离特征空间学习
本文同时解决了三个问题:人脸识别、属性分类和任意人脸生成。大多数人的人脸特征学习工作通常使网络学习获得一个具有很强身份或属性鉴别能力的特征,可应用于人脸识别、属性分类等任务。或者学习一种具有全局信息的功能,以应用于面部生成和编辑等应用。为什么我们不能学习一个完整的特征空间,使语义信息高度分化,从而实现一个特征可以完成所有的任务?本文提出了一个信息提取和驱逐网络的框架。仅使用身份信息作为监督信息,并学习具有强信息鉴别和全局信息的稠密凸特征空间。在LFW、LFWA、CelebA等数据集上的实验表明,人脸在该特征空间中的投影具有极高的身份和属性识别能力,并且该空间中的任何一点都具有很强的身份和属性语义,能够生成具有该语义的人脸图像。
基于边缘感知的海报人脸关键点定位
提出了一种基于边缘感知的人脸关键点检测算法,将人脸边缘线描述的结构信息融入到关键点检测中,大大提高了算法在大侧面、夸张表情、遮挡、模糊等极端情况下的检测精度。本文主要解决两个主要问题:1 .不同数据集之间人脸关键点的模糊性和定义的不一致性。在本文中,捕捉了人脸中较为常见的边缘线信息,并将其用作从人脸到关键点的中间媒介,使得即使关键点存在差异,不同的数据集仍然可以在训练中相互帮助。2.复杂条件下的关键点检测精度问题。本文通过消息传递结合对抗学习获得高精度的边缘线检测结果,并将边缘线信息集成到多语义层次的关键点检测中,大大提高了算法在复杂情况下的鲁棒性。
此外,本文还提出了一种新的人脸关键点检测数据集widerfaciallandmarksin-the-the-wild(wflw),该数据集包含10,000个标记了98个点和6个属性的人脸数据,以帮助学术界更有效地评估关键点算法在各种条件下的鲁棒性。
目标检测、识别和跟踪
代表性论文:
基于双候选区域网的聚光灯高性能视觉跟踪
提出了一种基于端到端深度学习框架的高性能单目标跟踪算法。现有的单目标跟踪算法通常难以平衡性能和速度,只能优于一个指标。本文利用暹罗网络和区域提议网络构造了一种高速高精度的单目标跟踪算法。这两个子网络通过卷积运算按比例放大,并在端到端深层神经网络框架中统一。在训练过程中,该算法可以使用带有密集标注和稀疏标注的数据集进行训练。与现有方法相比,稀疏标记数据集极大地增加了训练数据的来源,使得深度神经网络能够得到更充分的训练。区域候选网络中的坐标回归可以使跟踪框架更加精确,并节省多尺度测试所花费的时间。实验结果表明,本文提出的跟踪算法在160帧的速度下,可以达到当前VOT2015和VOT2016数据集的先进水平。
海报快速端到端多角度文本检测与识别方法
本文首次提出了一种端到端的多角度文本检测和识别方法。文本检测和识别是计算机视觉领域的经典问题。过去,文本检测和识别被分别视为两个需要解决的问题。本文提出了一种端到端的文本检测和识别方法,验证了两种任务的互补性。网络培训的联合监管可以使这两项任务达到更好的准确性。由于这两个任务共享一个特征提取网络,其速度大约是文本检测和识别速度的两倍。同时,本文还提出了旋转操作,扩展了旋转对齐的概念,可以应用于旋转物体的检测。本文在几个数据集上超越了现有的方法。
深度生成模型
代表性论文:海报——基于特征装饰的实时零风格迁移
目前,对于图像风格化的实时应用,大多数需要为特定风格的地图设计特定的风格转换模型。如果需要实现任何风格图的迁移,计算复杂度和迁移效果大多无法保证。本文提出了一种实时零点图像风格传递模型,以实现任意风格图像的多尺度高质量风格传递。该方法基于被称为风格修饰器的特征迁移网络结构,并且可以容易地嵌入到图像重建网络中以实现多尺度风格特征迁移。网络结构使得生成的风格化图像能够在风格化图像中完全表达特定的纹理图案,同时保留原始图像中的语义信息。实验表明,该网络对各种类型的风格地图具有较高的风格化能力,可以有效地扩展到多风格迁移和视频风格迁移等应用中。
附录:
商汤科技与商汤科技联合实验室共收到44篇论文,具体如下:
1.3 humanposeeumptionthewildbydversarialearning
未央、宛柳镇、王小龙、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
2.注意-awareconforpositionnetworkfor person-identificati on
徐静、赵睿、朱峰、王华明、宛里欧
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
3.虚拟网络:多尺度零快照风格转移特征装饰
鲁生*、景绍*、子音林和肖刚王(*平级贡献)
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
4.BeyondHolisticObjectRecognition:enrichingimageunderstandingwithtpartstates
塞武路、苏浩、李永录、永义路、易立、齐-克隆唐、列昂尼德。Guibas
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
5.collaborationveanddversarialnetworkforunsupervisieddomain adaptation
韦珍章、宛力欧阳、徐东、李文
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
6.contextencodingforematicsegmentation
张航、克里斯汀娜、石建萍、张忠岳、王晓刚、阿姆里什泰吉、阿米塔格拉瓦尔
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
7.deep cocktailnetworks:Multi-source unsuperviseddomainationwithcategorysshift
芮佳旭、陈子亮、王梦佐、俊杰岩、林良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
8.深度组-ShuFlingGrandOmWalkForPersonre-identificati on
严涛申、李洪生、肖童、帅一、陈大鹏、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
9.dynamicsceneedulurringsingspatiallyvariantrecurrentneurnetworks
张佳玮、金山班、吉米仁、艾炳松、林超宝、林森禄、明宣阳
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
10.消除背景-biasforrobusperson-identificati on
茅庆田、李洪生、帅一、张学森、石建萍、俊杰岩、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
11.端到端深度克隆产品匹配人员重新识别
严涛申、肖童、李洪生、帅一、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
12.端到端流相关控制支持空间-时间关注
朱正、魏武、邹伟、俊杰岩
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
13.exploring DisentangLedFeatureRepresentationBeyondFaceIdentity
刘玉*、方银伟*、景绍*、鲁生、俊杰、肖刚旺(*equalcontribution)
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
14.环境升级增强学习用于on-differential问题多阶段管道
舒琴燮、紫田琛、许超、塞武路
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
15.FOTS:FastOrientedTextSportingWithAunifiedNetwork
雪泊柳、丁亮、十堰、大观园、玉桥、俊杰岩
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
16.GeoNet:UnPervisedLearningofdenseDepth,MotionFieldandCameraPose
石建萍尹智超
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
17.group consistentsimilaritylearningviadeepcrfsfor person-identificati on
陈大鹏、徐丹、李洪生、印度尼西亚、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
18.高性能视频跟踪网络
勃利、魏武、朱正、俊杰岩
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
19.学习不对称三-游戏角色身份识别-保留角色合成
俞俊申、平洛、俊杰言、王晓刚、肖傲堂
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
20.learniatoolchainforimagerestore
柯宇、朝东、林良、陈昌洛
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
21.学习新级别视觉
金山班、思飞流、孙德清、张佳玮、刘阳、吉米仁、泽朝里、金惠堂、胡传禄、俞永泰、明宣阳
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
22.learning globalyoptimizedobjectdetector viapolicygradient
永明饶、大华林、季文禄
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
23.LiteFlowNet:AlightWeightCrowalnEuralNetworkFororOpticalFloweAssession
TakWaiHui,XiaoouTang,ChenChangeLoy
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
24.低延迟视频语义分割
尤礼来、石建萍、大化林
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
25.LookatBoundary:富里-awarefecalignmentalgorithm
韦纽乌、陈谦、杨朔、王泉
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
26.lstmompsemachines
罗月、吉米仁、周霞望、温秀森、金山畔、刘建波、贾浩邦、林良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
27.个人重新识别的蒙版指南
宋春锋、黄炎、宛里欧、王良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
28.opticalflowguiddfeature:afastandrobustmodementrepresentationforvideoactionrecognition
舒阳孙、章辉匡、鲁生、宛里欧阳、张伟
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
29.优化视频对象检测viaascale-时间网格
陈开、王佳琪、杨朔、邢承璋、袁军雄、陈昌洛、大华林
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
30.PAD-Net:多任务引导的预测和蒸馏网络
徐丹,宛里欧,王晓刚,尼古塞贝
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
31.path aggregationnetworkforinstancesegmentation
刘舒、卢奇、海防、石建萍、佳雅嘉
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
32.pose-robustFacerecognitionviadeepresidualequivariantMapping
凯迪卡、裕廊、李成、小奥特塘、陈昌洛
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
33.PracticalBlock-WiseNeuranNetworkarchitectureGeneration
、俊杰岩、、景绍、程
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
34.recognizeactionsbydisentangingcomponentsofdynamics
岳照、苑军雄、大华林
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
35.recoveringrealistictextureimagesuper-resolutionbySpatialFeatureModulation
新陶王、柯宇、晁东、陈昌洛
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
36.单视图立体匹配
罗月、吉米仁、穆德林、贾浩邦、温秀森、李洪生、林良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
37.暂时性幻觉记忆识别带少量静止图像
雷州、王亚丽、余桥
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
38.TowardsHuman-machine cooperation:evolvingaactivelearning with self-supervisedProcessforObjectDetection
柯泽旺、肖鹏燕、张磊、林良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
39.个人识别的统一识别和上下文学习
清秋煌、熊昱、大化林
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
40.非参数化实例级识别
吴之荣、苑军雄、周星宇、大化林
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
41.VideoPersonre-identificationwithcompetitiveSnippet-similarityagAggregationandco-attentificateSnippetembedding
陈大鹏、李洪生、肖童、舒艾伊、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
42.visualquestiongenerationsdualtaskofvisualquestionanswering
义康力、南端、伯里州、初晓、宛里欧阳、王晓刚
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
43.weakly supervised humanbody partparsingviapose-guided知识转移
郝、关松露、、简文协、于
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
44.ZoomandLearn:generalingdeepstereomatchingtonovedOmains
贾浩邦、温秀森、杨承熹、季米仁、芮朝晓、靳增、林良
ieeeconferenceonputervisionandpatternrecognition(CVPR),2018。
www.sensetime.com
这篇文章是由网站管理员的用户提交的。未经网站管理员同意,严禁复制。例如,如果大多数用户在稿件中发现虚假报告,欢迎读者反馈、纠正和报告问题(反馈入口)。
免责声明:本文是对用户的贡献。站长之家发布这篇文章只是为了传达信息。这并不意味着站长之家同意其观点,不对内容的真实性负责,仅供用户参考,不构成任何投资或使用建议。读者被要求核实真实性和可能的风险,任何后果将由读者自己承担。
相关文章推荐
- 山东省为湖北省防疫和控制捐赠了10亿
- 金被发现在音乐会上作弊,并一度假装
- 刘备见人时说他是钟的。刘备和刘胜是
- 揭示雍正帝的特殊爱好,喜欢给大臣们
- 钟一生中从未打过一次著名的战役。为
- 当海印的财富管理公司计划裁员三分之
- 200,000名股东激动不已!从下限到上
- 苏宁瑞城启动230万美元基准科技城建
- 中国在意大利的防疫:从误解到赞美
- 2020年,空调品牌承受不起损失
- 龙脊股份(601012。上海:控股股东李春
- 不到两周,情节就会逆转!美国拒绝接
- 谁比NBA总决赛冠军更强?乔丹8-4,科
- 买车后,这10样东西一定在你的车里。
- 独立教练:我非常希望把阿奎罗和卢卡
- 李:西班牙体力和驾照都在手。我的家
- 七年前的今天,热火失去了詹伟,波什
- 前意大利小姐在科斯塔库塔吐口水:和
- [晨谈]是时候展示你的大脑了!让我们
- 4月1日河北疫情最新消息:2例新输入病
- 如果没有奔驰和宝马,BAIC华晨的“空
- 通用汽车下周交付首批20,000个口罩
- 穆尼:我的目标是在巴黎疫情期间和我
- 赖斯身体:巴洛特利失去了俱乐部和球
- 谢晖:从助理教练到教练是很自然的。
- 巴拉圭前锋的近1000件球衣被盗!包括
- 博腾事故:无人员伤亡,财产损失约25
- "显然我应该战术性地为梅西服务!"
- 怡保体育用爱心赞助波尔多,携手展示
- 马德里竞技主席:现在讨论军事问题没
- 美国新增确诊病例累计超过170,000例
- ANSA:孔蒂和国际球员都愿意减薪,目

