机器学习基础:大数据算法模型与应用
项目时间:2021年05月23日-07月19日
在线咨询本课程会介绍一些本科等级的典型算法设计和分析。我们将介绍经典算法技术,如动态程序设计、散列和数据结构, 分治算法,网络流和线性规划。我们还将涵盖范围广泛的分析工具,如recurrences、概率分析,平摊分析和势函数。除了学习算法,我们还会涉及一些复杂性理论的研究——双重的算法设计(下界方法在这些模型中的显示和最优算法)。最后,我们将讨论新模型在现代大型数据集下的应用,比如在线算法、机器学习和数据流。
David Woodruff
卡耐基梅隆大学计算机系终身教授
(1)CMU 数据科学项目创建者及主席
(2)曾供职于 IBM Almaden 研究中心10年,IBM 技术学院首席科学家
(3)STOC 2013 以及 PODS 2010 最佳学术研究论文奖得主
(4)EATCS Presbuger(表彰计算机科学领域年度最卓越的年轻科学家) 奖得主
卡内基梅隆大学(Carnegie Mellon University)是一所位于美国宾夕法尼亚州匹兹堡的研究型私立大学。 在2018年泰晤士高等教育世界大学排行榜中,卡内基梅隆大学排名世界第20位,在同一机构的学科排名中,学校的计算机科学排名世界第六位,工程和技术排名第十二位,商学和经济学排名第十五位。在USNews发布的排行榜中,学校排名全美第25位,其中计算机科学排名全美第一位。截止2018年10月,学校的教员和校友中共有20人获得诺贝尔奖,12人获得图灵奖,22人获评美国艺术与科学院院士,19人进入美国科学促进会,72人入选美国国家学院。
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。 算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。一个状态到另一个状态的转移不一定是确定的。随机化算法在内的一些算法,包含了一些随机输入。 而大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
线上科研的作用及成果与线下的区别?
上课模式、收获、教授级别上其实线上和线下都差不多。但是线下由于60课时和教授1v5近距离绑定一个月授课,所以推荐信要好拿的多。
(60课时,甚至高于美国高校每学期对专业课课时最低55小时的要求)
CIS科研项目适合人群,如何选择专业方向?
CIS主要针对在读高中生和在读本科生。
CIS专业选择不仅仅局限于syllabus,可以参考CV,因为是小组教学,只要在教授的研究履历范围内教授都可以给予指导。
与中科研,美国夏校,及其他科研项目的区别
对申请的作用:推荐信、科研履历、论文、成绩、学习和知识。这五个方面都是由教授决定的。在宣传上可能哈佛讲师和哈佛终身教授,大家都说是哈佛教授。但是实际上不论推荐信效力还是科研履历,论文得到的指导,成绩单署名。两个级别教授开具出来的效力在招生办完全是天壤之别。所以我们从不用低级别教授做推荐信PBL项目,低级别教授在我们这里只教基础课程,和美国高校一样。
是否应该等语言成绩达标之后再考虑背景提升(面试需要考察学生哪些方面)
分课题。理工、艺术等课题对英文要求不高,就像这些专业美国本身的研究生录取也对英文要求不高。但是社科类课题,还是需要语言成绩达标后参加,我们会考核英语能力
是否可以自主选择课题教授?
不可以,必须由我们按照学生情况匹配课题。但是实际上基本我们根据学生填写的申请来匹配的肯定是学生想选择的那几个课题。但匹配之后最后会由教授确认录取,如果学生最想要的课题没有被录。再只能看能不能填表申请复议了。
论文保发表吗?
保发表不保证级别。CIS的数据是大约20%教授推荐的优秀论文是可以发到SCI国际核心期刊的。然后剩下的好一点的也会有国际EI会议,或者科学美国人这种顶尖的科普类期刊。实在论文质量一般的,我们会协助发表国内的国家级英文期刊保底。