简介

希冀在线平台是“新工科联盟大数据技术能力项目”官方指定的训练平台,为参加能力评测的同学提供完善的训练体系。

当前的实验大纲覆盖《新工科联盟大数据技术能力1级评测大纲(2019版)》,欢迎高校学生在此训练,并取得优异的成绩。

注册方式

目前不支持公开注册,请按照如下方式加入QQ群,在群内联系群主,创建平台账号。

希冀教学平台学生QQ群:328666683 (学生用户,注明:学校 + 姓名) 扫码

本实验体系仅对参加大数据能力评测的高校学生开放,教师开课点击申请开课

实验体系
一级分类 二级分类 内容

计算机基础

C/C++程序设计 覆盖C/C++知识点的100道编程题
Java程序设计 覆盖Java程序设计知识点的100道编程题
Python程序设计 覆盖Python程序设计知识点的100道编程题
Python在线实训
(基于Jupyter,从入门到高阶)

涵盖评测大纲内的“数据操作和处理”部分知识点,为保持知识的连贯性,不单独分类。

  1. Python基础-Python入门演示
  2. Python基础-Python数据类型
  3. Python基础-数字
  4. Python基础-字符串
  5. Python基础-索引和分片
  6. Python基础-列表
  7. Python基础-可变和不可变类型
  8. Python基础-元组
  9. Python基础-列表与元组的速度比较
  10. Python基础-字典
  11. Python基础-集合
  12. Python基础-不可变集合
  13. Python基础-Python赋值机制
  14. Python基础-判断语句
  15. Python基础-循环
  16. Python基础-列表推导式
  17. Python基础-函数
  18. Python基础-模块和包
  19. Python基础-异常
  20. Python基础-警告
  21. Python基础-文件读写
  22. Python进阶-sys模块简介
  23. Python进阶-与操作系统进行交互:os模块
  24. Python进阶-CSV文件和csv模块
  25. Python进阶-正则表达式和re模块
  26. Python进阶-datetime模块
  27. Python进阶-SQL数据库
  28. Python进阶-对象关系映射
  29. Python进阶-函数进阶:参数传递,高阶函数,lambda匿名函数,global变量,递归
  30. Python进阶-迭代器
  31. Python进阶-生成器
  32. Python进阶-with语句和上下文管理器
  33. Python进阶-修饰符
  34. Python进阶-operator,functools,itertools,toolz,fn,funcy模块
  35. Python进阶-作用域
  36. Python进阶-动态编译
  37. 跨语言-简介
  38. 跨语言-Python扩展模块
  39. 跨语言-Cython:Cython基础,将源代码转换成扩展模块
  40. 跨语言-Cython:Cython语法,调用其他C库
  41. 跨语言-Cython:class和cdefclass,使用C++
  42. 跨语言-Cython:Typedmemoryviews
  43. 跨语言-生成编译注释
  44. 跨语言-ctypes
  45. 面向对象-简介
  46. 面向对象-使用OOP对森林火灾建模
  47. 面向对象-定义class
  48. 面向对象-特殊方法
  49. 面向对象-属性
  50. 面向对象-森林火灾模拟
  51. 面向对象-继承
  52. 面向对象-super()函数
  53. 面向对象-重定义森林火灾模拟
  54. 面向对象-接口
  55. 面向对象-共有,私有和特殊方法和属性
  56. 面向对象-多重继承
  57. 实用工具-pprint模块:打印Python对象
  58. 实用工具-pickle,cPickle模块:序列化Python对象
  59. 实用工具-json模块:处理JSON数据
  60. 实用工具-glob模块:文件模式匹配
  61. 实用工具-shutil模块:高级文件操作
  62. 实用工具-gzip,zipfile,tarfile模块:处理压缩文件
  63. 实用工具-logging模块:记录日志
  64. 实用工具-string模块:字符串处理
  65. 实用工具-collections模块:更多数据结构
  66. 实用工具-requests模块:HTTPforHuman
SQL语句基础
  1. 组合两个表1
  2. 分数排名
  3. 连续出现的数字
  4. 查找重复的电子邮箱
  5. 从不订购的客户
  6. 部门工资最高的员工
  7. 部门工资前三高的员工
  8. 删除重复的电子邮箱
  9. 上升的温度
  10. 行程和用户
  11. 大的国家
  12. 超过5名学生的课
  13. 体育馆的人流量
  14. 有趣的电影
  15. 换座位
  16. 交换工资
  17. 计算平均工资
  18. 截取名字
  19. 数逗号
  20. 连接名字
  21. 为员工涨薪
  22. 获取相同数据
  23. 重命名表
  24. 更新日期
  25. 删除重复记录
  26. 在表中添加列
  27. 查询强制索引
  28. 创建视图
  29. 创建演员名表
  30. 批量插入数据
  31. 创建一个演员表
  32. 拼接员工全名
  33. 查询动作片信息
  34. 找出未分类的电影
  35. 查找包含robot的电影
  36. 获取薪水涨幅超5000的员工编号
  37. 汇总各部门职务分配数目
  38. 统计平均工资
  39. 按照员工薪水排名
  40. 查询奖金信息
Linux基本命令和操作
  1. 文件和目录基本操作
  2. 文件和目录权限管理
  3. 文件打包与压缩
  4. 文本文件
  5. 文本编辑神器vi
  6. 文本处理神器sed
  7. 文本搜索神器grep
  8. 文本分析神器awk
  9. 用户与群组管理
  10. 文件搜索
  11. 系统信息
  12. Shell数学计算

大数据基础知识

数据定义、大数据基本特征、大数据分析流程等知识点。 大数据基础知识评测100道,题型包括填空、判断、选择等。

大数据分析

数据采集
  1. Urllib库的基本使用
  2. Urllib库的高级用法
  3. URLError异常处理
  4. Cookie的使用
  5. 正则表达式
  6. 实战:爬取糗事百科段子
  7. 实战:爬取复仇者联盟4豆瓣电影评论
数据预处理
  1. Numpy-简介
  2. Numpy-Numpy数组及其索引
  3. Numpy-数组类型
  4. Numpy-数组方法
  5. Numpy-数组排序
  6. Numpy-数组形状
  7. Numpy-对角线
  8. Numpy-数组与字符串的转换
  9. Numpy-数组属性方法总结
  10. Numpy-生成数组的函数
  11. Numpy-矩阵
  12. Numpy-一般函数
  13. Numpy-向量化函数
  14. Numpy-二元运算
  15. Numpy-ufunc对象
  16. Numpy-choose函数实现条件筛选
  17. Numpy-数组广播机制
  18. Numpy-数组读写
  19. Numpy-结构化数组
  20. Numpy-记录数组
  21. Numpy-内存映射
  22. Numpy-从Matlab到Numpy
  23. Scipy-简介
  24. Scipy-插值
  25. Scipy-概率统计方法
  26. Scipy-曲线拟合
  27. Scipy-最小化函数
  28. Scipy-积分
  29. Scipy-解微分方程
  30. Scipy-稀疏矩阵
  31. Scipy-线性代数
  32. Scipy-稀疏矩阵的线性代数
  33. Pandas-十分钟上手Pandas
  34. Pandas-一维数据结构:Series
  35. Pandas-二维数据结构:DataFrame
  36. Pandas-Series和DataFrame对象的创建
  37. Pandas-Series和DataFrame对象的查、改、增、删
  38. Pandas-merge详解
  39. Pandas-Index对象的创建,查、改、增、删和使用
  40. Pandas-普通列和行index的相互转化
  41. Pandas-数据结构总览
  42. Pandas-显示控制
  43. Pandas-快速查看整体信息
  44. Pandas-数值运算
  45. Pandas-数值统计运算
  46. Pandas-Category型与离散化
  47. CSV、JSON、XML格式转换
  48. 缺失值填充
  49. 重复值删除
  50. 数据替换
  51. 异常值检测与过滤
机器学习方法
  1. kNN算法
  2. 基于kNN的手写字识别
  3. 基于kNN的约会网站配对效果改进
  4. 基于kNN的乳腺癌诊断
  5. 基于kNN的IRIS分类
  6. 决策树算法
  7. 基于决策树的隐形眼镜选择
  8. 朴素贝叶斯算法
  9. 基于朴素贝叶斯的言论过滤器
  10. 基于朴素贝叶斯的垃圾邮件过滤
  11. 基于朴素贝叶斯算法的新闻分类
  12. 逻辑回归
  13. 基于逻辑回归的病马死亡率预测
  14. SVM支持向量机原理
  15. SVM支持向量机实现手写识别
  16. AdaBoost算法原理
  17. 一元线性回归
  18. 多元线性回归算法
  19. 基于线性回归预测鲍鱼年龄
  20. 基于线性回归预测乐高玩具套装价格
  21. K均值聚类算法
  22. 使用K均值聚类算法对地图上的点进行聚类
  23. Apriori算法
  24. 基于Apriori算法的投票模式挖掘
  25. 基于Apriori算法发现毒蘑菇相似特征
  26. FP-Growth算法
  27. 基于FP-Growth算法小说《三体》数据挖掘
  28. 基于FP-Growth算法新闻网站点击流挖掘
  29. PCA算法
  30. 基于PCA算法的半导体制造数据降维
数据可视化
  1. Matplotlib-基础
  2. Matplotlib-Pyplot教程
  3. Matplotlib-使用style来配置pyplot风格
  4. Matplotlib-处理文本(基础)
  5. Matplotlib-处理文本(数学表达式)
  6. Matplotlib-图像基础
  7. Matplotlib-注释
  8. Matplotlib-标签
  9. Matplotlib-figures,subplots,axes和ticks对象
  10. Matplotlib-不要迷信默认设置
  11. Matplotlib-各种绘图实例
  12. 词标签云实验(使用wordcloud)
  13. 时空数据可视化实验
  14. 高维数据可视化实验
  15. 网络和层次化数据可视化实验维