电商| 物流| 科技| 创业| 经商| 运营| 科普| 财经| 文娱| AI| 物联| 品牌| 会议| 政策| 时尚| 健康| 家居| 金融| 农业| 汽车| 房产| 百科| 生活| 游戏| 管理| 快讯
 
首页 » 资讯 » AI » 突破AI和机器理解的界限,牛津博士论文学习重建和分割3D物体

突破AI和机器理解的界限,牛津博士论文学习重建和分割3D物体

放大字体  缩小字体 时间:2020-11-26 10:32    热度:971
让机器拥有像人类一样感知 3D 物体和环境的能力,是人工智能领域的一项重要课题。牛津大学计算机科学系博士生 Bo Yang 在其毕业论文中详细解读了如何重建和分割 3D 物体,进而赋予机器感知 3D 环境的能力,突破了人工智能和机器理解的界限。。。。

突破AI和机器理解的界限,牛津博士论文学习重建和分割3D物体

赋予机器像人类一样感知三维真实世界的能力,这是人工智能领域的一个根本且长期存在的主题。考虑到视觉输入具有不同类型,如二维或三维传感器获取的图像或点云,该领域研究中一个重要的目标是理解三维环境的几何结构和语义。

传统方法通常利用手工构建的特征来估计物体或场景的形状和语义。但是,这些方法难以泛化至新物体和新场景,也很难克服视觉遮挡的关键问题。

今年九月毕业于牛津大学计算机科学系的博士生 Bo Yang 在其毕业论文《Learning to Reconstruct and Segment 3D Objects》中对这一主题展开了研究。与传统方法不同,作者通过在大规模真实世界的三维数据上训练的深度神经网络来学习通用和鲁棒表示,进而理解场景以及场景中的物体。

总体而言,本文开发了一系列新型数据驱动算法,以实现机器感知到真实世界三维环境的目的。作者表示:「本文可以说是突破了人工智能和机器理解的界限。」

这篇博士论文有 143 页,共六章。机器之心对该论文的核心内容进行了简要介绍,感兴趣的读者可以阅读论文原文。

 

论文地址:https://arxiv.org/pdf/2010.09582.pdf

论文概述

作者在第 2 章首先回顾了以往 3D 物体重建和分割方面的研究工作,包括单视图和多视图 3D 物体重建、3D 点云分割、对抗生成网络(GAN)、注意力机制以及集合上的深度学习。此外,本章最后还介绍了在单视图 / 多视图 3D 重建和 3D 点云分割方面,该研究相较于 SOTA 方法的新颖之处。

基于单视图的 3D 物体重建

在第 3 章,作者提出以一种基于 GAN 的深度神经架构来从单一的深度视图学习物体的密集 3D 形状。作者将这种简单但有效的模型称为 3D-RecGAN++,它将残差连接(skip-connected)的 3D 编码器 - 解码器和对抗学习结合,以生成单一 2.5D 视图条件下的完整细粒度 3D 结构。该模型网络架构的训练和测试流程如下图所示:

 

接着,作者利用条件对抗训练来细化编码器 - 解码器估计的 3D 形状,其中用于 3D 形状细化的判别器结构示意图如下:

 

最后,作者将提出的 3D-RecGAN++ 与 SOTA 方法做了对比,并进行了控制变量研究。在合成和真实数据集上的大量实验结果表明,该模型性能良好。

基于多视图的 3D 物体重建

在第 4 章,作者提出以一种新的基于注意力机制的神经模块来从多视图中推理出更好的 3D 物体形状。这种简单但高效的注意力聚合模块被称为 AttSets,其结构如下图所示。与现有方法相比,这种方法可以学习从不同图像中聚合有用信息。

 

此外,研究者还引入了两阶段训练算法,以确保在给出一定数量输入图像的情况下,预估的 3D 形状具有鲁棒性。研究者在多个数据集上进行了实验,证明该方法能够精确地恢复物体的 3D 形状。

从点云中学习分割 3D 物体

在第五章中,研究者提出了一个新的框架来识别大规模 3D 场景中的所有单个 3D 物体。与现有的研究相比,该研究的框架能够直接并且同时进行检测、分割和识别所有的目标实例,而无需任何繁琐的前 / 后处理步骤。研究者在多个大型实际数据集上展现了该方法相对于基线的性能提升。

作者介绍

本文作者 Bo Yang 现为香港理工大学计算机系助理教授。他本科和硕士分别毕业于北京邮电大学和香港大学,然后进入牛津大学计算机科学系攻读博士学位,其导师为 Niki Trigoni 和 Andrew Markham 教授。

Bo Yang 作为一作以及合著的论文曾被《计算机视觉国际期刊》(IJCV)以及 NeurIPS 和 CVPR 等学术会议接收,谷歌学术主页上显示他共著有 22 篇论文,被引用数超过 400。

 

论文目录如下:

 

 

关于突破AI和机器理解的界限,牛津博士论文学习重建和分割3D物体的要点介绍,希望对大家了解突破AI和机器理解的界限,牛津博士论文学习重建和分割3D物体有所帮助,如有侵权,联系我们37442552@qq.com。
标签: AI
 
你可能感兴趣:
 
AI Factory如何快速安全地从概念进入产业化

2021-01-07

人工智能(AI)被组织视为获得竞争优势的一项重要技术。市场数据表明,2020年人工智能业务的使用量同比增长了25%,其中63%的组织高

AI 和 SEO 的结合:是福还是祸?

2020-12-30

自成立以来,搜索引擎已经从基本搜索代理变成了基于人工智能(AI)和机器学习(ML)的复杂算法。这些创新技术从两个完全相反的角

AI 时代,教育公平正在到来!

2020-09-18

教育公平的观念源远流长,追求教育公平是人类社会古老的理念。从历史上看,古希腊的大思想家柏拉图最早提出教育公平的思想,亚里

AI,5G和云计算如何在2021年影响边缘计算

2020-11-03

到目前为止,边缘计算一直是有希望的,但是它仍在发展。到2021年,将出现新的商业模式,这将有利于在生产中使用边缘。到2021年将

AI2020全球人工智能大会-AI展览会(北京)

2020-07-21

AI2020全球人工智能大会-AI展览会(北京)近年来,人工智能开发和推广应用取得较大突

AIAI报名中2022第十五届北京国际人工智能产品展

2022-02-23 物联网,大数据,新零售,人工智能,智慧工地,智慧城市,智能家居,工业互联网

2022北京国际人工智能展览会(2022北京智博会),将于2022年4月在中国国际展览中心举办,本次展会与中国制造2025”制定“互联网+”行动计划相结合,推动物联网…

AIDA64 6.30 发布:支持可能不存在的英特尔 Roc

2020-10-29

硬件识别、检测软件 AIDA64 今天推出了最新的 6.30 正式版,新增大量特性,例如支持国产兆芯开先 KX-6000 处理器的 AVX 加速 64

Airbnb计划在纳斯达克交易所上市

2020-10-28

10月28日消息,外媒报道,全球短租平台爱彼迎Airbnb计划在纳斯达克交易所上市。今年8月Airbnb向美国证券交易委员会(SEC)提交IP

AIRLOOK 发布超算平台,用 AI 实现建模语义化和

2020-09-18

以 “还原世界的样子” 为发展愿景,国内空间高精度数据运营商AIRLOOK 正式发布面向实景三维数据生产和云端数据服务的超算平台 D

AirPods Max带来三大技术创新 行业又要变天了

2020-12-09

我已经记不清这是苹果今年第几次突然发布新品了,继10月发布HomePod mini后,这一次终于轮到耳机了,而且还是苹果的第一款头戴式

 
热点图文
库克表示iPhone 售价过高  iPhone 在中国是否会降价呢?

库克表示iPhone 售价过高 iPhone 在中国是否会降价呢?

华为进入以色列市场:成立Toga Networks公司开发技术

华为进入以色列市场:成立Toga Networks公司开发技术

知乎果壳狭路相逢  付费问答市场遭抢滩

知乎果壳狭路相逢 付费问答市场遭抢滩

三星Galaxy S7 edge上市 三星s7 edge配置详解  三星s7 edge会是大家心中的安卓机皇吗?

三星Galaxy S7 edge上市 三星s7 edge配置详解 三星s7 edge会是大家心中的安卓机皇吗?

解析2016智能手机行业三大流行趋势

解析2016智能手机行业三大流行趋势

Infinitus Prime tVR体验 未来增加追踪功能

Infinitus Prime tVR体验 未来增加追踪功能

绝美视野全能体验 最新市场优质大屏手机推荐 绝对震撼!

绝美视野全能体验 最新市场优质大屏手机推荐 绝对震撼!

继《鬼吹灯3D》之后 光线传媒董事长王长田打算出VR版!

继《鬼吹灯3D》之后 光线传媒董事长王长田打算出VR版!

 
经商宝 — 经商创业营销推广电子商务门户 网站地图 | 关于我们 | 特惠服务 | 人才招聘 | 联系我们 | 法律声明