北邮大数据专业大三上课程总结
首先指路BUPT 计科大三上生存指北 by xqmmcqs,感谢这篇文章给我大三上的课程复习带来了很大的帮助。
碎碎念:为什么会有这篇博客呢?因为我在网上找遍了资料,找到的博客或者复习指南基本都是北邮计科的,这对于小专业的学生来说太不友好了,因此萌生了写一篇和上面提到的文章一样的总结并且希望把这个作为一个习惯传下去(要是懒了就算了罢)。今天是2023年1月8日,正值最后一门成绩出完,因此在这里分享数据科学与大数据技术专业大三上的一些课程的主观感受。
操作系统
难度中上,需要背很多东西,基本是把操作系统的架构底朝天讲了个遍,遗憾或者说庆幸的是每一个内容的深度都不足。xz老师人还不错,今年期中由于封控政策延期了导致最后变成了全是大题,还想得起来的题型有线程调度、信号量之类的;期末则是常规的填空选择大题,复习的话推荐看一遍王道然后刷PPT(注意一些小的知识点,比如今年考了一个文件的访问方式我就写错了orz),大题题型最后都是很常规的PPT例题(今年PV题也不难),把PPT搞懂然后刷往年题就行。
课程附赠一个实验,不过不是单独算的,今年要求2-6人组队,由于已经给出了实验指导书并且书上有源码,本质cv。
数据库系统原理
难度中等,由于疫情提前放假削减了内容(其实不削减内容,课程容量也不大),并且期末改成了全部大题的形式,属于是一步错步步错。平时教授的内容对于实际数据库设计来说太过简单,并且也不太实用(3NF谁真用啊),不过确实是很基础的内容,不知道还是不行的。df老师课讲得不错,并且ppt也写的很详细,因此期末同样是刷ppt做例题就好,重点是ER图、范式、关系的设计几个内容。需要注意的是今年SQL题偏应用,竟然考到了多表的删除操作……因此自己适量课外拓展一些SQL的学习还是很有必要的。
虽然同样是用GaussDB,好在今年的实验不像往年一样坑人出现各种奇怪的问题,不过依然推荐等ddl之前,其他人把坑踩差不多了再上。
大数据技术基础
难度简单,ozh唯一指定课程,从开学一直到结束上课就没听过(逃),最后复习的时候读了下课程内容,主要是教你一些2010-2020年左右流行的框架和特点,作为一门新兴课程教授的内容却不是非常前沿。好在虽然ozh老师比较唠叨并且成吨的ppt看着也很唬人,但是最后期末会给划重点(平时扫码答题仅作签到用)导致难度直线下降。值得注意的是虽然数据分析层和数据可视化层最后划重点没划进去,但是期末还是作为综合设计题的一部分考到了(大概是给你一个场景,让你选择大数据6层架构中每一层合适的开源组件进行处理)。因此如果确定前面的重点复习完了,这不在重点内的两层还是有必要复习一下的。
课程设计没什么好说的,按照实验指导书cv就行,需要注意的是每一次上课都必须去(因为当堂验收)。以及课设单独算1.5(好像)个学分。
Linux开发环境及应用(选修但是很推荐)
难度中等偏下,jyj老师教授,上课貌似没有考勤,并且会叫同学们去mooc上学习他的课、完成作业和测试来作为平时成绩。非常有用的好课,上课会教授Linux各种命令的组合使用、Unix下的程序设计之类的实用内容,类似于计算机教育中缺失的一课,并且给分也十分大气(90+)。期末作业从平时作业的题库中抽题,不过还是会有很多新题,需要好好复习课件。
基于大数据的机器学习
非常呃呃的课程,难度因为没怎么上课,期末也没考明白所以不评价,zwa老师教授。平时上课主要讲一些机器学习算法的推导和原理(数据科学导论:???),老师可能比较科研型,不是很听得懂在讲什么,了解相关内容不如自己看西瓜书。成绩主要是平时成绩+期中(我因为疫情没有参加)+期末考试(全选择)+期末大作业构成,其中期末成绩由期末考试和期末大作业对半分。这个课程的诡异之处在于平时作业/上课内容和期末考试完全没有任何关系,并且往年也没有任何期末题漏出,导致期末考试的风格极其神秘:虽然平时会花80%+的时间讲各种学习器的推导,期末大部分的考点却是集中在各种机器学习的概念上。不过可能是去年被喷了,今年评分规则也收敛了些,把大作业的占比提高到了50%。大作业的话是CNN的图片分类,今年我用的resnet50然后加一些超参就能达到不错的准确率(90%+)。
总结
本学期课程同样是不压分,平均分可以给到很高,除了机器学习这门课以外别的课基本都是上课好好听+认真复习就能拿高分的。不过单论价值性的话除了Linux以外都不是很高,因此建议在压力不是很大的时候可以课外多学点东西(但是课内的东西一定要掌握好,这俩不是可以覆盖的关系)。
关于复习资料的话可能之后会发个网盘……吧?
北邮大数据专业大三上课程总结