密集科研项目:人工智能与数据科学专题:机器学习与神经网络及其在推荐系统中的应用【大学组】
2022-12-19 14:47:01 来源:中国教育在线
导师学校介绍
布朗大学(Brown University)创立于1764年,是全美第七古老的大学,坐落在美国罗得岛州首府普罗维登斯市,是一所享誉世界的顶级私立研究型大学,闻名世界的八所常春藤联盟成员,北美顶尖大学学术联盟美国大学协会成员。布朗大学在2020年U.S.News美国大学综排Top14。
导师详细介绍
导师昵称
Sorin
导师级别
讲席终身正教授
导师学校
布朗大学Brown University
Sorin导师是布朗大学计算和数学科学和计算机科学终身正教授,曾任布朗大学计算分子生物学中心主任。在加入布朗之前,他是Celera Genomics的高级主管和信息学研究负责人,他们共同撰写了2001年的科学论文“人类基因组的序列”,该论文迄今为止被引用超过12,000次,是最重要的论文之一。引用的科学论文。2003年,他加入了应用系统科学研究员的行列,这是一家拥有800名科学家的公司中仅有的六名科学研究员之一。2000年,他获得了统计力学中一个50年前未解决的问题,三维Ising模型问题的否定解(计算难点)。该工作被列入美国能源部前25年最重要的100项发现,并作为美国能源部在高级科学计算方面的第7项顶级成就。Sorin教授的研究重点是算法和计算复杂性以及统计物理学。他是计算生物学杂志的主编,他是RECOMB会议系列的联合创始人,麻省理工学院出版社计算分子生物学系列的联合编辑和Springer-Verlag讲座笔记的联合编辑在生物信息学系列。
Prof.Sorin is the Julie Nguyen Brown Professor of Computational and Mathematical Sciences and Professor of Computer Science,and former Director of the Center for Computational Molecular Biology at Brown University.Before joining Brown,he was the Senior Director and then Head of Informatics Research at Celera Genomics,they co-authored the 2001 Science paper“The Sequence of the Human Genome,”which,with over 12,000 citations to date,is one of the most cited scientific paper.In 2003 he joined the ranks of Applied Biosystems Science Fellows,one of just six Science Fellows in a company of 800 scientists.In 2000,he obtained the negative solution(computational intractability)of a 50 years old unresolved problem in statistical mechanics,the Three-Dimensional Ising Model Problem.This work was included in the Top 100 Most Important Discoveries of the U.S.Department of Energy’s first 25 years,and as the 7th top achievement of DOE in Advanced Scientific Computing.Professor Istrail's research focuses on computational molecular biology,human genetics and genome-wide associations studies,medical bioinformatics of autism,multiple sclerosis,HIV,preterm labor and viral immunology,algorithms and computational complexity,and statistical physics.He is Editor-in-Chief of the Journal of Computational Biology and he is co-founder with of the RECOMB Conference series,and co-Editor of the MIT Press Computational Molecular Biology series and of co-Editor of the Springer-Verlag Lecture Notes in Bioinformatics series.
适合人群
方向:理工
专业:人工智能
适合专业:计算机科学,机器学习,通信工程,数据工程,编程语言,推荐系统
项目价格:33800/19800
项目周期:4周在线小组科研学习+2周论文指导
是否建议高中生学习:否
是否建议大学生学习:是
语言:英文
难度:高级难度
建议具备的基础:数据科学、人工智能、统计学、机器学习、深度学习等专业的学生;学生需要具备线性代数及概率论与数理统计基础,修读过算法与数据结构并能熟练使用如随机森林等经典机器学习算法
科研项目产出
4周在线小组科研学习+2周论文指导学习共125课时+不限时论文指导
学术报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
结业证书
成绩单
项目介绍
项目中,导师将介绍用于知识发现的大数据挖掘的基础编程模型和算法。学生对其代码实现后,将使用真实生活中的数据集(如Yelp评论、亚马逊交易和MovieLens数据等)进行模型训练,并检测出有意义的用户偏好及习惯。在项目中后期,学生将结合所学知识及导师建议对基础推荐算法及模型进一步优化研究,构建一个新颖、准确且高效的个性化推荐系统,并在项目结束时提交项目报告、进行成果展示。This program will introduce the fundamental programming models and algorithms used in mining Big Data for knowledge discovery.Specifically,the lecture will cover MapReduce,Frequent Itemset Mining,Clustering&Dimension Reduction,and Recommendation Systems.The assignments will include implementing algorithms introduced in the lecture to detect meaningful patterns from real datasets(e.g.,Yelp reviews,Amazon transactions,and MovieLens data).At the end of the course,the students are expected to conduct a research project by combining the knowledge learned in class to build a novel recommendation system.
个性化研究课题参考Suggested Research Fields
构建基于内容的电影推荐系统Content-based movie recommender
构建基于协同过滤的推荐系统Building recommendation system based on collaborative filtering
构建一个混合位置的餐厅推荐系统Building a hybrid recommendation system for location
数据挖掘其他应用如:使用公开数据进行空气质量预测和预报Other applications of data mining,such as air quality prediction and forecasting using open data
项目背景
当你发现刷抖音停不下来,当你在朋友圈里看到精准的广告投放,当你让Siri规划回家路线,这背后的强大驱动力便是数据挖掘与机器学习。数据挖掘又称知识发现,即从数据中挖掘知识。在当下信息爆炸时代,面对庞大的数据库,最主要的困难就是有效信息难以提炼,John Nalsbert称之为“信息丰富而知识贫乏”窘境。因此,对海量数据进行深入分析,发现并提取隐藏在其中的信息,以更好地利用这些数据的需求愈发强烈。但仅以数据库系统的录入、查询、统计等功能,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,更缺乏挖掘数据背后隐藏知识的手段。正是在这样的条件下,数据挖掘技术应运而生。项目将围绕数据挖掘原理及其在推荐系统中的应用展开。
项目大纲介绍
面向大规模数据处理的并行计算模型和方法Introduction and MapReduce
频繁项级挖掘算法及关联规则Mining Frequent Itemsets
聚类分类与数据降维Clustering&Dimension Reduction
推荐系统Recommendation Systems
学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路Final Project Preparation Session I
学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出Final Project Preparation Session II
项目成果展示 Final Presentation
>>没有教授推荐信,缺少科研经验?点击这里提升背景<<