奈学课程顾问
课程简介/Course Introduction
适合人群/Suitable For People
初阶数据分析师
需构建完整的数据分析知识体系,提升业务
实战能力摆脱“人肉取数机器”,突破薪资瓶颈拥有
更开阔的业务视角,提升职场竞争力满足大厂数据分析
能力模型,斩获高薪Offer。
在校大学生和研究生
想从事数据分析行业,获得高薪offer专业不受限,
岗位薪资高,0基础就能学,学完就能用,
能写在校招和社招中体现简历上的真实项目经验。
产品/运营/市场
想要拿到大厂高薪Offer,成为业务操盘手,不拍脑门,
用数据驱动业务决策,搭建核心指标体系,
抓住业务核心本质,自动化办公,提升工作效率。
职业发展前景/Career Development Prospects
职业发展前景
师资团队/Faculty Team
李希沅毕业于河北工程大学
前转转公司大数据资深架构师,Hadoop平台负责人,带头研发了公司任务调度平台,即席查询平台等核心平台,曾任东方国信大数据架构师,大数据技术经理,负责《联通全流量查询平台》《联通IP溯源平台》等多个PB级数据知名项目,曾架构管理联通10000+台机器大数据集群,并为中国平安,中国移动等多家企业内训,有丰富的授课经验。
马中华毕业于湖北师范大学
前Oracle数据开发技术组负责人,动批网数据运营系统负责人,阿里云/腾讯云全球第一位认证金牌讲师,阿里云栖大会NLP专场特邀演讲嘉宾,混迹大数据开发和分析之江湖多年,精通各大大数据分析和处理技术,架构经验丰富,在数据挖掘,数据建模等方向也有丰富企业实战经验。有丰富的企业技术培训和技术讲座的实战经验,历史受训学员2000+。
李钊毕业于北京科技大学
数据分析专家、用户增长专家,10余年数据分析工作经验;原美国伯克利大学副研究员,深谙统计机器学习算法。前IT教育公司数据分析方向负责人,任学科总监,长期担任C端用户增长团队负责人。曾多次获得“最佳讲师”称号。有丰富的课程讲授的实战经验,历史受训学员3000+。
孙娟毕业于国防信息学院
8年数据分析及企业内训工作经验,曾就职于亚信移动事业部,参与CRM系统二期开发;数据库指标魔方统计,参于数据仓库的体系架构;某银行数据分析师,负责业务需求实现可视化开发。精通Oracle数据库,及Informatica,可视化Tableau实现企业驾驶舱,擅长将工作中所应用到的知识运用到教学实践,学以致用,熟悉商业智能体系架构。有丰富的企业技术培训和技术讲座的实战经验,历史受训学员2000+。
王端阳毕业于北京航空航天大学
前凤凰金融大数据部门负责人,主导公司智能风控系统和智能推荐系统的建设。多年大数据架构以及授课经验,擅长Hadoop、Spark、Storm、Flink等大数据生态技术,在数据密集型系统架构,大数据分布式计算等方面有着深入研究。授课特点:拟物化编程+强案例支撑,最终帮助学生建立完备的大数据生态知识体系
李希沅
马中华
李钊
孙娟
王端阳
课程大纲/Syllabus
学习时长(月)
单元(个)
知识点(个)
第一阶段:商业数据分析师用户分析&业务目标拆解
第一单元 | 数据分析技能在各行业业务应用 | 1.数据分析概述 2.数据分析师工作场景以及工作内容 3.数据收集 4.数据存储 5.数据处理 6.数据分析 7.数据可视化 8.数据分析报告 9.制定业务目标需考虑因素 10. 影响交易额客观因素 11.拆解业务目标方法 |
第二单元 | 商业智能分析方法&用户生命周期和用户增长模型 | 1.漏斗图分析法 2.SWOT/态势法 3.逻辑树分析法 4.用户结构分析 5.用户行为分析 6.用户价值分析 7.引入期、成长期、成熟期、休眠期和流失期 8.用户生命周期模型作用 9.用户生命周期运营策略 10.AARRR模型各环节说明 11.如何使用RFM模型进行用户价值分类 |
第三单元 | 数据分析Excel技能 | 1.数据分析必备技能Excel软件介绍 2.数据处理Excel各菜单使用 3.查看数据固定首行,首列 4.统计分析占总额比值 相对引用,绝对引用 5.提高数据分析高频使用快捷键 6.Excel统计分析函数介绍,分类 7.数据分析统计功能函数(字符,日期,数学函数) 8.业务需求对比分析法解决哪类产品销售好的问题 9.运用趋势分析方法分析水果各时间段的变化需求量 10.对各品类数据进行分组,--矩阵关联法(象限分析法) 11.销售团队消毒液销售情况分析---分组分析 |
第四单元 | 数据分析项目实战 | 1.分析用户购买行为各环节转化---产品用户行为分析(漏斗分析) 2.分析各产品结构,销量及销售额,占总额百分比 占比分析 3.不同类型产品层级关系分析--树状图使用 4.多维数据集雷达图使用 5.多层级数据之间的占比及对比关系旭日图的使用 6.业务需求交互式数据分析,动态图使用,数据透视表的用法 7.交互式业务数据分析,切片器,日程表用法 8.某咖啡北京分公司监测各商品销售情况,大屏可视化分析 9.用户画像属性分析,用户画像的目的 10.RFM模型实践应用,用户价值分析 11.某电子购物业务需求,对产品,地区,时间等多维度进行统计分析并可视化展示 |
第二阶段:行业数据分析师MySQL业务查询实战
第五单元 | 构建结构化业务数据库/表 | 1.互联网数据分析数据存储MySQL,及数据库介绍 2.数据分析认识SQL,SQL分类 3.数据存储数据库的创建 4.业务数据库表定义 5.数据类型介绍 6.约束的分类与使用 7.业务数据库数据添加,导入,备份 8.数据更新操作 9.数据删除操作 10.业务指标,字段,查询操作 |
第六单元 | 查询业务指标 | 1.业务指标查询分析 2.业务指标条件查询用法 3.业务指标查询交集,并集用法 4.查询去重Distinct 5.不同维度进行分组查询group by 6.各业务指标统计分析count,sum,max,min 7.数学函数用法round,abs,mod 8.字符函数Length,Lower,Upper,Concat 9.日期函数current_timestamp,current_date,day,month,year 10.对业务指标进行排序Order by |
第七单元 | SQL高效查询优化 | 1.多数据源查询业务指标,多表查询 2.连接查询,笛卡尔积介绍 3.连接查询,内连接,左连接,右连接用法 4.使用子查询处理复杂业务逻辑 5.where子查询,from子查询 6.子查询In,Any,All用法 7.事务操作,业务逻辑处理 8.IF语句、CASE语句等流程控制 9.索引的用法,提高查询速度 10.SQL交叉表统计分析行转列 |
第八单元 | 业务指标统计分析 | 1.统计分析函数 Over()窗口函数的用法 2.活动销售数据统计分析 3.用户价值划分模型 4.业务场景:统计平台销售情况 5.灯塔指标:下单用户数,订单量,GMV,客单价等 6.分析方法:汇总统计 7.分析方法:对比分析 8.分析方法:分析分析 9.确定指标计算口径 10.SQL总结 |
第三阶段:构建数据仓库大数据分析Hive查询
第九单元 | HQL大数据业务数据需求查询 | 1.大数据集群Hadoop分布式架构原理 2.HDFS、MR、YARN 3.Hive数据仓库 4.HQL数据查询基础语法 5.HQL与SQL的区别 6.数据库基本操作-库、表 7.分区表概念 8.分区意义和本质 9.动态分区属性设置及示例 10.分桶意义和价值 |
第十单元 | HQL业务大数据指标统计分析 | 1.分区表与分桶表 2.关联表数据查询 3.常用内置函数 4.累计计算窗口函数(count,sum,min,max) 5.排序窗口函数row_number() over()、rank()、over() 6.偏移分析函数lag() over()、lead() over() 7.复杂数据类型array示例、map例、struct示例 8.嵌套数据类型 9.排名函数/窗口函数详解 10.自定义函数 |
第十一单元 | HQL大数据查询优化 | 1.Group by替换Distinct去重 2.Grouping sets、cube、rollup 聚合技巧 3.使用Lateral view进行行转列 4.数据倾斜的原因及解决办法 5.文件读取/解析的方式指定ROW FORMAT 6.序列化和反序列化 7.Hive文件存储及属性设置 8.Hive视图、日志和运行方式 9.Hive企业级调优 |
第四阶段:Python数据分析实战&Python自动化办公
第十二单元 | Python数据分析编程 | 1.创建jupyter虚拟环境 2.Tab补全、jupyter快捷键 3.if、for循环、whlie循环 4.列表、字符串、元组、集合、字典 5.函数、文件、对象 6.继承中单继承与多继承 7.捕获异常、模块 8.文件操作、读文件 9.文件打开方式、写文件 |
第十三单元 | Numpy科学计算库 | 1.Ndarray数据类型 2.Ndarray与Python原生list运算率对比 3.创建一维数组、二维数组 4.调整数据组形状和常用属性 5.将数组转为List 6.Numpy数据类型 7.数组索引、切片和数组数值修改 8.数组添加、删除和去重 9.Numpy计算 10.数组拼接、分割 11.数组中nan和inf 12.二维数组转置 |
第十四单元 | Pandas数据分析库 | 1.Series与DateFrame数据结构 2.Pandas数据结构介绍 3.Series与DataFrame对象 4.DataFrame对象常用属性 5.Fataframe修改index、columns 6.本地数据的读取 7.缺失值、重复值、异常值处理 8.多层索引、时间序列、分组聚合 9.数据处理、合并和多层索引 10.时间序列、分组聚合和分组 |
第十五单元 | Matplotlib数据绘图 | 1.Matplotlib数据可视化 2.高频图像种类场景 3.实现Matplotlib画图 4.折线图绘制、颜色、形状和样式 5.设置图片大小及保存 6.绘制X轴和Y轴刻度 7.一图多个坐标系子图 8.设置坐标轴范围 9.改变坐标轴默认显示方式 10.绘制散点图、设置图像大小及图例 11.绘制条形图及横向条形图 12.并列及罗列条形图 13.绘制饼状图 |
第五阶段:BI商务智能数据分析可视化
第十六单元 | Tableau数据可视化 | 1.什么是报表,什么是可视化 2.Tableau产品介绍,简介 3.Tableau设计形式 4.设计流程,入门实例演示 5.Tableau数据源与数据处理 6.Tableau工作表仪表板、故事创建及区别与联系 7.Tableau筛选器,字段类型,集合,分组,分层,文件夹 8.图形报表的使用,对比分析各类型柱形图使用 9.业务需求分析,图表的使用 10.折线图,圆环图,词云图,气泡图等图形用法 11.Tableau参数设置 12.组合图,动态图,桑吉图用法 |
第十七单元 | Tableau 数据分析项目实战 | 1.Tableau 填充地图可视化 2.Tableau 标记地图可视化 3.Tableau 自定义地图应用 4.仪表板介绍,使用 5.故事介绍与使用 6.项目需求分析,数据获取 7.业务场景指标统计图表开发 8.业务指标同比,与环比,新建计算字段 9.Tableau综合大屏可视化开发,多维数据分析 10.Tableau数据分析其它设置 |
第十八单元 | Power BI 数据报表可视化 | 1.PowerBI系列组件介绍 2.PowerBI Desktop软件介绍 3.数据源获取,导入PowerBI 4.查询编辑器的使用Power Query 5.建立数据模型,关系 6.新建度量值,列 7.可视化图形的用法,对比分析 8.趋势分析,占比分析,分组分析 9.各业务需求分析,图形选择 10.PowerBI仪表板应用,综合分析 |
第十九单元 | Power BI 数据分析项目实战 | 1.PowerBI 地图可视化 2.PowerBI 漏斗可视化 3.仪表板的设计,要求 4.PowerBI参数设置 5.PowerBI指标同环比计算 6.PowerBI项目需求理解 7.业务数据源导入,建模,处理 8.业务需求指标统计可视化开发 9.大屏可视化分析呈现 10.数据分析报告设置 |
第二十单元 | Python自动化办公 | 1.Python控制Excel实现自动化办公 2.Python控制WORD实现自动化办公 3.Python控制PDF实现自动化办公 4.Python控制邮件实现自动化办公 5.Python控制报表实现自动化办公 |
第六阶段:数据分析综合项目实战
第二十一单元 | 大促用户消费购买力分析 | 1.项目背景:
为更好进行用户的消费力拉动,针对性策划精准营销。对用户进行消费购买力分析。 2.核心技术: 数据预处理、业务经验逻辑、数据可视化 3.业务场景: 大促奢侈品精准用户营销等 |
第二十二单元 | 全民消费品趋势分析 | 1.项目背景:
对未来消费品趋势的挖掘与预测,提前布局。 2.核心技术: 数据预处理、数据可视化 3.业务场景: 大促会场选品、铺货、招商规划等。 |
第二十三单元 | 用户全链路体系构建 | 1.项目背景:
深度、全面、精细的分析电商用户,针对不同阶段、不同周期用户的特点制定个性化策略。 2.核心技术: 数据预处理、数据分析模型、可视化 3.业务场景: 拉新、唤醒等用户营销 |
第二十四单元 | 大促地域销售预测分析 | 1.项目背景:
深度、全面、精细的分析电商用户,针对不同阶段、不同周期用户的特点制定个性化策略。 2.核心技术: 数据预处理、数据分析模型、可视化 3.业务场景: 大促库存调控 |
第二十五单元 | 服饰类超级活动流量来源分析 | 1.项目背景:
超级会场流量来源去向分析 2.核心技术: 数据预处理、可视化 3.业务场景: 活动复盘,辅助营销策略布局。 |
第二十六单元 | 品牌及竞品用户全链路分析 | 1.项目背景:
指定品牌用户深度分析,竞品分析 2.核心技术: 数据预处理、4A模型、数据可视化 3.业务场景: 品牌各阶段用户营销 |
第二十七单元 | 电商生态人群聚类 | 1.项目背景:
超级会场流量来源去向分析 2.核心技术: 数据预处理、聚类模型、可视化 3.业务场景: 用户营销 |
第二十八单元 | 大促下单时段偏好分析 | 1.项目背景:
大促活动时间甄选 2.核心技术: 数据预处理、数据可视化 3.业务场景: 活动时间、货品选择 |
第二十九单元 | 服饰全年销售趋势分析 | 1.项目背景:
销售分析 2.核心技术: 数据预处理、数据可视化 3.业务场景: 复盘、铺货、招商、活动营销等。 |
第三十单元 | 毛衣偏好趋势分析 | 1.项目背景:
通过用户购买情况,详细分析趋势,引领未来潮流 2.核心技术: 数据预处理、数据可视化 3.业务场景: 秋上新活动选品 |
第三十一单元 | 销售监控分析 | 1.项目背景:
日常经分销售监控分析 2.核心技术: 数据预处理、数据可视化 3.业务场景: 经营分析 |
第七阶段:数据分析师&统计学分析
第三十二单元 | 描述统计&总体推断 | 1.统计学数据类型划分 2.Mean/均值、Mode/众数、Quantile/四分位数、Variance/方差 3.Standard/标准差、Z-score/标准分数、Skwness/偏度、Kurtosis/峰度 4.从集中趋势,离散程度,分布形态三方面描述数据 5.不同抽样方法优劣比较与使用场景 6.总体 、样本、 抽样三大不同性质分布 |
第三十三单元 | 抽样调查后推断总体情况(参数估计、假设检验) | 1.参数估计与假设检验 2.通过样本推断总体的方法与理论依据 3.估计量与估计值 4.点估计与区间估计 5.总体区间估计 |
第三十四单元 | 筛选影响结果的关键性因素(方差分析,列联分析,相关分析) | 1.分类型数据与分类型数据关系度量(列联分析,独立性检验) 2.连续型数据与分类型数据关系度量(T检验,方差分析) 3.连续型数据与连续型数据关系度量 (相关分析) 4.数据类型 5.方差分析类型 6.正态性检验 |
第八阶段:建模数据分析师&数据挖掘项目实战
第三十五单元 | 算法建模进行数据分析 | 1.解析各算法基本函数、目标函数和最优函数 2.从数据清洗到探索性数据分析(EDA) 3.如何建立多种基础模型,如何选择最优算法 4.通过提升模型精度来展示结果 |
第三十六单元 | 高级课题—数据挖掘算法 | 1.KNN/K-近邻算法 2.朴素贝叶斯算法 3.最小二乘法 4.MLE/极大似然估计算法 5.特征工程 6.探索性数据分析 7.线性回归算法 8.逻辑回归算法 9.梯度下降算法 10.决策树算法 11.随机森林算法 12.聚类算法/K-Means |
第三十七单元 | 实战项目 | 1.逾期还款业务分析 - 逻辑回归算法 2.用户流失预警 - KNN算法、SVM算法 3.随机森林算法填充缺失值 一、业务场景:增大用户池的方法除用户引流外,就是控制用户流失,针对同状态的用户采取不同的运营方案,进行唤醒激活挽回等 二、灯塔指标: 1.刻画以往行为,访问平均间隔,最大间隔, 访问时长 2.最后一次访问距窗口期间隔长,消费金额,消费频次,消费优惠占比 三、分析方法:特征工程,逻辑回归,朴素贝叶斯等 四、使用工具:统计学、数据挖掘 五、可视化分析:饼图, 环形图 六、结论: 1.给出各用状态(活跃,睡眠,流失) 2.对不同用户采取不同方案 |
实战课程案例/Practical Course Cases
课程学习安排/Curriculum Arrangement
学习时长:4个月
周二、周四、周六 20:00-22:00(2小时)
名师大V倾囊授课;班主任全程解答,辅导
学业,5A级专业服务;线上社群互动;线
下沙龙交流;促学习、优人脉。
直播大课为主,实时在线互动,老师实时解答;录播课程为辅,协助时间不足或希望反复学习同学;分享预习资料、课程PPT、笔记、源码等资料。
教学服务体系/Teaching Service System
课程收获/Lessons Learned
具备自动化办公能力,大大提升工作效率
构建数据分析思维模型和能力体系
掌握数据分析可视化能力
掌握数据建模的能力,升职加薪