Activity Understanding meets 3D Representation

PRCV 2018, Talk by Cewu Lu

地点:广州白云国际会议中心,2号楼 2楼汕头厅

时间:2018年11月24号 16:30-17:00

三维视觉

pointSIFT Pointwise Rotation-Invariant Network DBNET
Github paper Github paper Dataset paper
描述:一个高效且通用的3D点云表征模块
性能:在S3DIS/Scannet数据集上分别取得12%/8.4%的IoU相对提高
描述:很大程度地解决了点云的旋转不变性表征问题
性能:旋转过的测试集上获得20 mIoU的提高(相对提高55%)
描述:一个大规模的点云与视频到驾驶行为的端对端数据集

行为理解

Deep RNN AlphaPose beyond COCO Interactiveness Prior
Github paper Github paper Github paper
描述:我们提出一套面向视觉问题(比如视频)的 Deep RNN 方案,实现了15层(甚至更深)的RNN叠加
性能:比起传统LSTM/RNN在四个视觉代表任务上平均相对提高25%
内容:汇报我们alphapose的进展与规划,我讨论了COCO数据中的不足,引出一个新的问题pose estimation in crowd
性能:提出JC SPPE算法,在hard数据上比mask-RCNN提高 8.9 mAP
描述:针对提出HOI任务一种通用可迁移的Interactioness prior, 展望基于知识引擎的HOI识别系统
性能:在HICO-DET的多个任务取得16%-36%的提高