段鹏举,Power Platform中文社区讲师、商业智能架构师、DAMA数据治理工程师、微软办公软件国际认证大师级。擅长Power BI方向商业智能分析,定位于业务+技术综合体,10年数据分析从业经历。
刘钰,网名:天昕。微软最有价值专家(MVP);Power Platform中文社区联合创始人:ExcelHome论坛Power Bl版块版主;拥有超过15年的数据分析从业经历。
本书主要介绍数据理论基础、对数据的思考、商业智能及其背后的设计、Power BI及其使用方法、Power Query的使用、数据模型、数据可视化及Power BI Service管理、Power BI优化最佳实践,以及如何在Excel中使用Cube等内容。本书在保证技术专业性的前提下,使用幽默诙谐的语言剖析问题,深入浅出,让读者感同身受。本书适合有一定的Excel基础,并且对Power BI有一定了解的用户阅读。本书对初级用户友好,需要进阶的用户也可以从书中获得宝贵的知识。
段鹏举,Power Platform中文社区讲师、商业智能架构师、DAMA数据治理工程师、微软办公软件国际认证大师级。擅长Power BI方向商业智能分析,定位于业务+技术综合体,10年数据分析从业经历。
刘钰,网名:天昕。微软最有价值专家(MVP);Power Platform中文社区联合创始人:ExcelHome论坛Power Bl版块版主;拥有超过15年的数据分析从业经历。
微软中国CTO韦青领衔力荐
陈希章、高飞、佐罗、采悟等大咖一致好评
从“养猪达人”到“数据达人”的成长秘籍
内容丰富涉及面广,广度深度全面兼顾
实战案例的经验总结,为您的学习保驾护航
随书附赠全部源文件,帮你轻松上手Power BI
行文风格大胆诙谐,“花式吐槽”+“猎奇视角”,带你接触Power BI更多“面目”
专程设计Cube相关实战应用章节,带你走向个人商业智能领域,果壳之内您为王。
曾经有人问我,学习是快乐的还是痛苦的。我回答:学习是快乐的。对方告诉我:学习是痛苦的。如果学习是快乐的,那么所有人都去学习了,而不是还有人去打游戏、刷视频啊!
但是,我仍然希望读者是在快乐中阅读和学习的。在确定本书的编写风格时,我希望本书不是枯燥的技术文。基于我自己的学习经历,即便是技术文,我也希望不要那么枯燥,甚至刻意保持一些口语化。本书在保证技术专业性的前提下,使用幽默诙谐的语言剖析问题,深入浅出,让读者感受到学习的乐趣。
为什么要写这本书
分享本身就是一种快乐,不是吗?
我看到太多数据人走的弯路,看到各位表哥表姐挑灯夜战。我曾经也是其中的一员,所以我希望分享更多实用的知识和技能,帮助更多的人。还有一个更重要的原因,就是市面上现有的Power BI图书多数以介绍工具功能为主,少有分享与商业智能应用领域相关的个人理解的。Power BI只是一个工具,我们真正需要的是商业智能分析。此外,还要了解其背后的故事。
当然,以上只是客套一下啦!而实际情况是,在2022年8月22日,我向刘钰老师表达了我想做点儿什么的想法,于是刘钰老师建议我写书,真是果断又干脆,这很符合刘钰老师的风格。刘钰老师还说可以给予我写作上的支持,并成为第二作者。话都说到这份儿上了,于是我抓紧时间拟定大纲并交由出版社审定。接下来,我就开始了这本书的编写。
在正式编写前,我已经压制不住内心的想法,思如泉涌,甚至不敢晚上写,因为担心失眠。我带着满腔热情在写,像是在雕琢一件艺术品。我希望和各位读者一起成长、一起进步。
在准备本书的过程中,我不仅整理了自己的专业知识,还通过各种渠道对众多Power BI用户进行了深入调研,收集了他们的需求和反馈。因此,本书的内容不仅仅包含我个人的理解和观点,更融入了广大用户的实际需求和期望。
我深知当前新入门的Power BI用户面临着学习成本较高和指导不足的问题。虽然本书无法解决所有初学者可能遇到的问题,但我相信它能为读者提供有效的学习策略和路径指导。对于那些希望进一步提升技能的读者,本书也将提供宝贵的参考信息。
尽管我已尽力确保本书内容的客观性和专业性,但由于其包含许多个人理解,所以可能会引发一些争议。在某种程度上,我只是“大道”的众多探索者之一,我所分享的只是其中的一部分,而非全部。如果你对我在书中提出的观点有不同的理解或看法,非常欢迎并期待与你进行更深入的交流和探讨。同时,希望我的观点能为读者提供新的思考角度。如果能做到这一点,对我来说将是最大的荣幸。
本书内容
全书共分10章,具体内容如下:
第1章主要介绍我的转行经历及心路历程。
第2章主要介绍数据理论基础,包括关系映射反演原则及应用、DIKW模型、数据遗传学定律等。
第3章主要介绍对数据的一些思考,让读者可以从更多的维度了解数据是什么。
第4章主要介绍商业智能的设计,以及与商业智能相关的技术问题和业务问题。
第5章主要介绍Power BI的学习方法,掌握这些方法可以更好地提高学习效率。
第6章主要介绍Power Query的基础操作,用以满足日常数据处理的需要。
第7章主要介绍数据模型相关内容,让读者学会如何创建和管理数据模型。
第8章主要介绍数据可视化及Power BI Service管理相关内容,了解数据可视化的基本操作。
第9章主要介绍Power BI优化的最佳实践,包括Power Query优化、数据模型优化、可视化优化、硬件优化等。
第10章主要介绍如何在Excel中使用Cube,对什么是Cube及如何使用、Cube函数及其优化技巧等进行了讲解。
读者对象
本书适合有一定的Excel基础,并且对Power BI有一定了解的用户阅读。本书对初级用户友好,需要进阶的用户也可以从书中获得宝贵的知识。在个人技能方面,本书侧重于更多的内容。这不是一本完全讲技术的图书,而是希望可以引导读者进行更多的思考,帮助读者解决在工作中遇到的数据问题,甚至是非数据问题。
第1章 转行经历及心路历程 1
1.1 转行经历 2
1.2 学习Power BI的心路历程 4
1.3 数据时代的背景 5
1.4 总结 7
1.5 作业 7
第2章 数据理论基础 8
2.1 关系映射反演原则及应用 9
2.2 DIKW模型 11
2.3 数据遗传学定律 12
2.4 总结 14
2.5 作业 14
第3章 对数据的思考 15
3.1 什么数据能分析 16
3.2 什么是“表” 16
3.3 什么是标准表 19
3.4 数据是“变”出来的 23
3.5 业务用户心目中的IT人员 24
3.6 数据访问权限 26
3.7 数据的成本 29
3.8 数据是一个任人打扮的小姑娘 30
3.9 “养”数据 31
3.10 数据管理 32
3.11 总结 33
3.12 作业 33
第4章 商业智能及其背后的设计 34
4.1 什么是商业智能 35
4.2 商业智能工具应具备的能力 35
4.3 如何在企业内部推广Power BI 38
4.4 数据分析师的新定位 39
4.5 关于商业智能架构的思考 41
4.5.1 病因(问题) 41
4.5.2 药方(方案) 44
4.5.3 药性(执行) 46
4.6 以商业智能为中心设计数据仓库 53
4.7 以IT为主导的商业智能项目必将失败 56
4.8 商业智能的价值导向 57
4.9 不要“神话”Power BI 62
4.10 不在于技术,而在于管理和认知 63
4.11 商业分析中的算法 64
4.12 如何处理需求 65
4.12.1 如何提需求 65
4.12.2 如何接需求 66
4.12.3 如何安排会议 67
4.13 如何汇报工作 71
4.14 从会吵架开始 71
4.15 总结 73
4.16 作业 73
第5章 了解Power BI并掌握使用方法 74
5.1 什么是Power BI 75
5.2 下载Power BI Desktop 78
5.3 了解Power BI的结构 80
5.4 Excel商业智能或Power BI Desktop 80
5.5 Power BI的常见部署方式 80
5.5.1 个人使用 80
5.5.2 Power BI Service部署 81
5.5.3 本地部署 82
5.6 解决Power BI问题的10个方法 82
5.6.1 使用搜索引擎或AI 83
5.6.2 查阅官方文档 83
5.6.3 了解行业最新资讯 84
5.6.4 参加培训 84
5.6.5 使用Power BI官方论坛 84
5.6.6 加入学习小组或群 84
5.6.7 付费咨询 85
5.6.8 阅读专业书籍 85
5.6.9 掌握学习方法 86
5.6.10 不断地思考、实践和总结 88
5.7 Power BI的学习路线 88
5.7.1 是学习一点点,而不是精通 88
5.7.2 第一阶段 89
5.7.3 第二阶段 89
5.7.4 第三阶段 90
5.8 是否需要学习SQL或Python 90
5.9 Power BI的通用化设计理念 92
5.10 总结 92
5.11 作业 92
第6章 Power Query的使用 93
6.1 什么是Power Query 94
6.2 Power Query和Excel操作数据的不同 98
6.3 使用Power Query获取数据 100
6.3.1 从Excel文件中获取数据 100
6.3.2 从CSV/TXT文件中获取数据 110
6.3.3 从PDF文件中获取数据 112
6.3.4 从文件夹中获取数据 114
6.3.5 从SQL Server数据库中获取数据 125
6.3.6 从MySQL数据库中获取数据 130
6.3.7 输入数据 133
6.4 Power Query常用基础操作 134
6.4.1 数据类型 134
6.4.2 将第一行用作标题 140
6.4.3 自定义列 141
6.4.4 追加查询 142
6.4.5 合并查询 145
6.4.6 逆透视列 153
6.4.7 删除重复项 155
6.4.8 填充 156
6.4.9 合并列 157
6.4.10 格式 158
6.4.11 拆分列 159
6.4.12 提取 160
6.4.13 分组依据 160
6.4.14 转置 162
6.4.15 其他功能 162
6.5 Power Query实战 162
6.6 Power Query的其他功能 168
6.6.1 查询依赖项 168
6.6.2 管理参数 169
6.6.3 查询管理 169
6.6.4 数据源设置 170
6.7 Power Query中的M函数 170
6.7.1 什么是M函数 170
6.7.2 高级编辑器 173
6.8 总结 173
6.9 作业 174
第7章 数据模型 175
7.1 什么是数据模型 176
7.2 单表模型 178
7.3 多表模型 180
7.4 维度表和事实表 181
7.5 维度建模的必要规则 184
7.6 维度建模的三种模型 186
7.7 数据模型的关系 190
7.7.1 表关系 192
7.7.2 交叉筛选器方向 196
7.7.3 管理关系 197
7.8 DAX是什么 200
7.8.1 新建列 200
7.8.2 度量值 205
7.8.3 计算表 208
7.8.4 如何选择新建列、度量值、计算表 210
7.8.5 如何学习DAX 212
7.8.6 DAX常用函数 213
7.8.7 在DAX编辑器中使用快捷键 215
7.9 表和度量值的命名规则及度量值管理 217
7.9.1 表命名规则 217
7.9.2 度量值命名规则 218
7.9.3 度量值管理 220
7.10 数据模型管理规范 225
7.10.1 调整字段汇总方式 225
7.10.2 隐藏非必要字段 227
7.10.3 关闭“自动日期/时间”功能 228
7.11 在DAX表达式中使用变量 228
7.11.1 变量的语法 229
7.11.2 变量的特性 230
7.12 DAX表达式的格式化 232
7.13 日期表 236
7.13.1 如何正确使用日期表 236
7.13.2 如何构建日期表 239
7.14 按列排序 241
7.15 循环依赖 243
7.16 新建参数 245
7.17 总结 251
7.18 作业 251
第8章 数据可视化及Power BI Service管理 252
8.1 可视化基本功能 254
8.1.1 使用可视化视觉对象 254
8.1.2 主题 258
8.1.3 页面视图 259
8.1.4 筛选器 261
8.1.5 选择 262
8.1.6 书签 263
8.1.7 性能分析器 263
8.1.8 页面导航器 264
8.2 报告、仪表板和数据大屏的区别 265
8.3 Power BI Service管理 266
8.4 总结 268
8.5 作业 268
第9章 Power BI优化最佳实践 269
9.1 Power Query优化 270
9.1.1 使用合适的数据源 270
9.1.2 只加载所需的数据 271
9.1.3 优先使用SQL查询语句加载数据 271
9.1.4 使用参数 272
9.1.5 使用部分数据做预转换 272
9.1.6 尽量不在Power Query中进行复杂处理 272
9.1.7 尝试将数据源规范为标准表 273
9.1.8 使用Table.Buffer函数提高计算效率 273
9.1.9 使用合适的数据类型 273
9.1.10 设置并行加载表 273
9.2 数据模型优化 273
9.2.1 使用一对多关系 274
9.2.2 反结构化设计 274
9.2.3 减少维度表的行数 274
9.2.4 关闭部分设置选项 275
9.2.5 减少列基数 276
9.2.6 使用增量刷新功能 277
9.2.7 引用已有的度量值 277
9.2.8 DAX优化 278
9.2.9 表和度量值的命名规则 280
9.2.10 度量值分层设计 280
9.2.11 使用合适的数据粒度 280
9.2.12 减少使用或不使用“新建列”功能 280
9.2.13 尽量不使用大宽表 281
9.2.14 数据模型中字母的大写和小写 281
9.2.15 为字段添加特殊前缀 281
9.3 可视化优化 281
9.3.1 减少视觉对象的数量 282
9.3.2 使用背景来管理布局 283
9.3.3 尽量使用默认的视觉对象 283
9.3.4 特殊的可视化呈现 283
9.3.5 使用SVG辅助画图 283
9.3.6 打开所有的预览功能 284
9.3.7 报告细节优化 284
9.4 硬件优化 287
9.4.1 CPU 287
9.4.2 内存 290
9.4.3 硬盘 291
9.4.4 显卡 291
9.4.5 网卡/带宽 291
9.4.6 屏幕 292
9.4.7 小结 292
9.5 其他优化 292
9.5.1 使用较新版本的Power BI Desktop 292
9.5.2 Power BI Desktop提示内存不足 293
9.5.3 异常排查及排错技巧 294
9.5.4 使用性能分析器巧妙排查异常 295
9.6 总结 295
9.7 作业 295
第10章 在Excel中使用Cube 296
10.1 什么是Cube 297
10.2 为什么要使用Cube 300
10.3 如何在Excel中连接Cube 305
10.4 数据透视表 311
10.5 Cube函数 312
10.5.1 CUBEVALUE 312
10.5.2 CUBEMEMBER 317
10.5.3 CUBESET 317
10.5.4 CUBESETCOUNT 322
10.5.5 CUBERANKEDMEMBER 322
10.5.6 CUBEKPIMEMBER 324
10.5.7 CUBEMEMBERPROPERTY 325
10.5.8 Cube函数与切片器搭配使用 327
10.6 表查询 329
10.7 Cube函数优化 337
10.7.1 缩短公式的长度 337
10.7.2 提高函数计算效率 341
10.7.3 获取所有成员作为维度 342
10.7.4 实战应用建议 347
10.8 个人商业智能 348
10.9 总结 349
10.10 作业 349