HCIE-Big Data-Data Mining V2.0 考试大纲

考试概述

认证名称	考试代码	考试名称	考试语言	考试费用	考试时长	通过分数/ 总分
HCIE-Big Data-Data Mining	H13-731	HCIE-Big Data-Data Mining V2.0 (Written)	CHS	300 USD	90min	600/1000
	H13-732	HCIE-Big Data-Data Mining V2.0 (Lab)			480min	80/100
	H13-733	HCIE-Big Data-Data Mining V2.0 (Interview)			60min	通过/不通过

考试范围

华为认证HCIE-Big Data-Data Mining V2.0 考试覆盖：数据挖掘介绍、预备知识（数学基础知识、Python 基础知识）、数据预处理、特征选择与降维、有监督学习、无监督学习、模型评估与优化、数据挖掘综合应用、Spark MLlib 数据挖掘、华为云机器学习服务MLS、FusionInsight Miner、大数据架构和大数据治理、大数据挖掘。

知识点	笔试占比	实验占比	面试占比
1.数据挖掘介绍	4%	5%	5%
2.预备知识	12%	5%	10%
3.数据预处理	12%	15%	15%
4.特征选择与降维	7%	15%	10%
5.有监督学习	11%	15%	20%
6.无监督学习	5%	15%	15%
7.模型评估与优化	12%	25%	5%
8.数据挖掘综合应用	8%	5%	5%
9.Spark MLlib 数据挖掘	11%	0%	10%
10.华为云机器学习服务MLS	6%	0%	0%

11.大数据架构和大数据治理	9%	0%	5%
12大数据挖掘	3%	0%	0%

第一章数据挖掘介绍

1.数据挖掘概述 2.数据挖掘流程

3.数据、属性和度量

4.数据挖掘开发工具

5.数据挖掘学习路径

第二章预备知识

1.矩阵和线性代数

1.1 行列式

1.2 矩阵及其变换

1.3 矩阵分解

1.3.1 奇异值分解

1.3.2 特征值分解

1.4 线性变换

1.5 向量空间

2 概率论和数理统计

2.1 随机事件及其概率

2.2 随机变量及其分布

2.3 随机向量及其分布

2.4 随机变量的函数

2.5 随机变量的数字特征

2.6 大数定律与中心极限定理

2.7 参数估计

2.8 假设检验

2.9 方差分析和回归分析

3 信息熵与基尼系数

4 最优化

4.1 无约束最优化问题

4.2 梯度下降法

4.3 约束最优化问题

4.4 拉格朗日乘子法

5 Python语言基础

5.1 什么是Python

5.2 Python基础知识

5.3 Python中的数据类型

5.4 判断与循环语句

5.5 函数和面向对象

5.6 常用标准库

5.7 常用第三方库

5.8 正则表达式

5.9 文件操作

6 数据采集与爬虫

6.1 什么是爬虫

6.2 爬虫的作用及工作流程

6.3 爬虫常用的工具

6.4 数据提取与存储

6.5 常见的反爬机制和应对措施

6.6 爬虫程序的实现

7 数据可视化

7.1 什么是数据可视化

7.2 数据可视化的作用及使用场景

7.3 数据可视化的常用工具

7.4 数据可视化的实现流程

第三章数据预处理

1 数据抽取、转换和加载

1.1 数据抽取、转换和加载概述

1.2 数据抽取

1.3 数据转换

1.4 数据加载

1.5 ETL和ELT介绍

2 数据清洗

2.1 不均衡数据处理

2.2 缺失值处理

2.3 异常值处理

3 特征处理

3.1 特征缩放

3.2 数值离散化

3.3 特征编码

3.4 时间数值转换

第四章特征选择与降维

1 特征选择

1.1 特征选择概述

1.2 Filter

1.3 Wrapper

1.4 Embedded

1.5 其他方法和特征扩增

2 降维

2.1 降维导入

2.2 SVD

2.3 PCA

2.4 LDA

2.5 LLE

第五章有监督学习

1 有监督学习的预备知识

1.1 机器学习

1.2 机器学习分类

1.3 基本术语与概念

2 线性回归

2.1 基本概念

2.2 误差

2.3 正规方程

2.4 梯度下降

2.5 正则化

3 逻辑回归

3.1 基本概念

3.2 目标函数

3.3 损失函数

3.4 优化方法

4 KNN

4.1 基本概念

4.2 KNN算法三要素

5 朴素贝叶斯

5.1 贝叶斯算法

5.2 朴素贝叶斯分类算法

5.3 朴素贝叶斯分类算法的优缺点

6 SVM

6.1 基本概念

6.2 线性分类

6.3 线性SVM

6.4 非线性分类

6.5 非线性SVM

7 决策树

7.1 基本概念

7.2 ID3

7.3 C4.5

7.4 CART

8 集成算法

8.1 基本概念

8.2 结合策略

8.3 Bagging

8.4 随机森林

8.5 Boosting

8.6 Adaboost

8.7 GBDT

8.8 XGboost

第六章无监督学习

1 无监督学习

1.1 无监督学习概念与导入

2 聚类算法

2.1 聚类分析概念

2.2 基于原型聚类

2.2.1 K-Means算法

2.2.2 K-Mediods算法

2.3 基于层次聚类

2.3.1 Hierarchical Clustering算法

2.3.2 BIRCH算法

2.4 基于密度聚类

2.4.1 DBSCAN算法

3 关联算法

3.1 Apriori算法

3.2 FP-growth算法

第七章模型评估与优化

1 模型评估与优化预备知识

1.1 基本术语及概念

2 最优化模型

2.1 最优化模型的概述

2.2 凸优化

2.3 损失函数

2.4 最优化模型的分类

3 模型评估与选择

3.1 模型评估概述

3.2 数据集拆分

3.3 回归模型评估

3.4 分类模型评估

3.5 聚类模型评估

4 正则化

第八章数据挖掘综合应用

1 数据挖掘的流程

1.1 数据挖掘流程概述

1.2 分析需求

1.3 数据读取

1.4 数据预处理

1.5 特征工程

1.6 特征选择

1.7 模型选择

1.8 模型评估

2 综合应用的案例分析

第九章 Spark MLlib数据挖掘

1 Spark MLlib基础入门

1.1 Spark MLlib简介

1.2 Spark MLlib矩阵向量

2 Spark MLlib基础统计分析

2.1 Basic Statistics 简介

2.2 Summery statistic (汇总统计)

2.3 Correlations (相关系数)

2.4 Stratified sampling (分层抽样)

2.5 Hypothesis Testing (假设检验)

2.6 Random data generation (随机数生成)

2.7 Kernel density estimation (核密度估计)

3 Spark MLlib特征提取和转换

3.1 TF-IDF

3.2 Word2Vec

3.3 StandardScaler，MinMaxScaler，MaxAbsScaler

3.4 Normalizer

3.5 ChiSqSelector

3.6 ElementwiseProduct

4 Spark MLlib分类与回归

4.1 分类和回归简介

4.2 线性模型

4.3 决策树模型

4.4 集成模型

4.5 朴素贝叶斯模型

5 Spark MLlib聚类与降维

5.1 聚类算法回顾

5.2 KMeans算法

5.3 Spark MLlib降维算法简介

5.4 SVD算法 5.5 PCA算法

6 Spark MLlib关联规则与推荐算法

6.1 关联规则算法回顾

6.2 Spark MLlib中FP-Growth算法

6.3 Spark MLlib中PrefixSpan算法

6.4 协同过滤算法回顾

6.5 Spark MLlib中协同过滤算法

7 Spark MLlib评估矩阵

7.1 Spark MLlib模型评估

7.2 分类模型评估

7.3 回归模型评估

第十章华为云机器学习服务MLS

1 华为MLS服务介绍

2 申请华为MLS服务

3 创建华为MLS工作流

4 典型算法的应用

5 机器学习平台FusionInsight Miner

第十一章大数据架构和大数据治理

1 大数据架构

1.1 大数据架构概述

1.2 大数据架构在大数据中的重要性

1.3 大数据架构师所具备的能力

1.4 如何构建大数据架构平台

1.5 大数据业务层通用架构

2 大数据治理

2.1 大数据治理概述

2.2 大数据治理建设背景和目标

2.3 企业数据规划及治理模型

2.4 大数据治理案例

第十二章大数据挖掘

1 数据挖掘背景

2 银行客户精准画像案例

3 提升信用卡安全案例

4 城市环境质量分析挖掘案例

请注意：本文提到的考试内容仅为考生提供一个通用的考试指引，本文未提到的其他相关内容在考试中也有可能出现。

该考试大纲是对准备考试的考生在拥有多年实际工作经验的前提下进行备考时的补充。请注意这里列出的是HCIE-Big Data-Data Mining V2.0的考试大纲，但不代表HCIE-Big Data-Data Mining V2.0考试不能考查其他知识。该考试大纲代表了我们要求考生至少要掌握以上知识，但考生必须要能够熟练应用这些知识和相关知识点，才能通过HCIE-Big Data-Data Mining V2.0的考核。所以其他知识点也可能存在于实际的考试中。我们欢迎得到您的建议和意见。您可以发送邮件给我们，Email: HCIE@huawei.com。

参考书籍

华为企业大数据挖掘专家认证HCIE-Big Data-Data Mining V2.0 培训教材

华为企业大数据挖掘专家认证HCIE-Big Data-Data Mining V2.0 实验手册

华为企业大数据工程师认证HCIA-Big Data V2.0 培训教材

华为云EI（https://www.huaweicloud.com/ei）各服务的文档

华为云产品文档

HCIE-Big Data-Data Mining V2.0 考试认证介绍

HCIE-Big Data-Data Mining V2.0 考试大纲

考试概述

考试范围

参考书籍

推荐培训

59学习网

相关推荐

评论抢沙发

文章目录

点击进群免费领取官方教材、教学视频等资料

热门标签

随机推荐

名词解释

华为认证考试大纲

华为认证必备电子书下载

PMP考点查询

切换注册登录

切换登录注册

HCIE-Big Data-Data Mining V2.0 考试大纲

考试概述

考试范围

参考书籍

推荐培训

59学习网

相关推荐

评论 抢沙发

文章目录

点击进群免费领取官方教材、教学视频等资料

热门标签

随机推荐

名词解释

华为认证考试大纲

华为认证必备电子书下载

PMP考点查询

切换注册登录

切换登录注册

评论抢沙发