人机交互科研项目:元宇宙入口——虚拟信息与真实场景的实时叠加与融合、AI驱动的沉浸式技术应用【大三及以上组】
2022-12-08 14:13:54 来源:中国教育在线
导师学校介绍
卡内基梅隆大学(CMU)始建于1900年,是世界范围内颇负盛名的私立研究型大学,拥有世界历史最悠久的计算机学院之一,位列CSRankings排名世界第一,U.S.News计算机本科及硕士项目与斯坦福大学,麻省理工学院,加州大学伯克利分校并列全美第一。截至2019年3月,学校的教员和校友中共有20人获得诺贝尔奖,13人获得图灵奖,22人获评美国艺术与科学院院士,19人进入美国科学促进会,72人入选美国国家学院。卡内基梅隆大学是美国四大计算机名校之一,连续多年问鼎全球计算机专业排名第一。
导师详细介绍
导师昵称
Kris
导师级别
终身正教授&计算机视觉研究生项目主任
导师学校
卡内基梅隆大学(CMU)
Kris导师现任卡内基梅隆大学终身教授及计算机视觉硕士项目主任。导师于南加州大学获得学士学位,在东京大学获得硕士和博士学位。Kris教授研究兴趣涉及计算机视觉、机器学习和人机交互等领域。他的研究兴趣主要集中在第一人称视觉、人类活动建模和反向强化学习的交叉领域。导师论文曾获得ICCV 2017的Marr奖荣誉奖,CHI 2017和CHI 2020的最佳论文荣誉奖,W4A 2017和2019的最佳论文,ACCV 2014的最佳应用论文和ECCV 2012的最佳论文荣誉奖。
Kris is an associate research professor and director of the MS in Computer Vision program of the Robotics Institute at Carnegie Mellon University.He received his BS at the University of Southern California and his MS and PhD at the University of Tokyo.His research projects span the areas of computer vision,machine learning and human computer interaction.In particular,his research interests lie at the intersection of first-person vision,human activity modeling and inverse reinforcement learning.His work has been awarded the Marr Prize honorable mention at ICCV 2017,best paper honorable mention at CHI 2017 and CHI 2020,best paper at W4A 2017 and 2019,best application paper ACCV 2014 and best paper honorable mention ECCV 2012.
适合人群
方向:理工
专业:人工智能
适合专业:计算机科学,电子与计算机科学,信号与信息处理,深度学习,计算机视觉,人机交互
项目价格:33800
项目周期:7周在线小组科研+5周论文指导
是否建议高中生学习:是
是否建议大学生学习:是
语言:英文
难度:中级/高级难度
建议具备的基础:对人工智能、机器学习、深度学习、计算机科学、计算机工程、数据科学、通信以及交叉学科和方向感兴趣的学生;学生需要具备微积分及线性代数基础,至少有一门编程语言的计算机视觉算法实现经历
科研项目产出
7周在线小组科研学习+5周论文指导学习共125课时+不限时论文指导
学术报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
结业证书
成绩单
项目介绍
项目涵盖计算机视觉领域的常用深度学习方法和前沿技术,比如生成模型、计算机视觉API、AutoML Vision。项目结束后,学生将完成两页Jupyter Notebook形式的报告,创建计算机视觉应用程序部署在边缘推理平台,进行成果展示。学生将能够从头开始建立计算机视觉模型,完成指定场景应用。
个性化研究课题参考:
基于计算机视觉的动态手势识别
应用计算机视觉对果蔬表面缺陷的判别研究
深度测量及物体三维模拟重构
项目背景
1956年达特茅斯会议以来,人工智能已走过60年的风风雨雨,期间历经两次繁荣与低谷,喧嚣与沉寂。千禧年后,大数据的蓬勃发展和算力的指数级增长赋予了深度学习新的生机。深度学习如破竹之势将机器辅助功能变为可能,让人工智能在各个应用领域实现落地。其中,人工智能一个重要的研究方面就是计算机视觉。“计算机视觉是一门研究如何使机器‘看’的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量,其本质是模拟人类的感知与观察的一个过程。”据国金证券发布的调研报告称,计算机视觉是AI领域应用场景最丰富、商业化价值最大的领域,占中国AI市场的34.9%,排名第一。目前,相关技术已经在金融、自动驾驶、医疗、安防、互动娱乐等多个应用场景落地。计算机视觉背后的深度学习知识有哪些?如何将这些知识与实践相结合?
项目大纲介绍
纬度转换2D Transformations
边缘检测与图像拼接 Homography Estimation
单视图几何 Single View Geometry
姿态估计和极线几何 Pose Estimation and Epipolar Geometry
内核矩阵估计 Fundamental Matrix Estimation
学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路 Research Workshop I
学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出 Research Workshop II
项目成果展示 Final Presentation
>>没有教授推荐信,缺少科研经验?点击这里提升背景<<