分享

从零开始入门数据分析-PowerBi入门篇

 东西二王 2023-11-07 发布于重庆

什锦

目录

收起

一、表的概念

三、数据获取

四、数据清洗

五、数据可视化

本文章有助于大家了解BI工具-PowerBi的使用。通过本文章,零基础也可以轻松搭建自己的可视化看板!后续也会发布一些其它主流的BI工具,但是BI工具总体逻辑上和使用上大同小异。


一、表的概念

在正式介绍powerbi之前,对'表’这个概念的深入理解是十分有必要的。

1. 表的类别:维度表及事实表

(1)事实表:它的主要特点是往往每一行数据代表一个事件、事实或记录,能够提取出度量值信息,数据量较大,也被称为数据表(例如:销售数据表、订单数据表、用户行为数据表等)。

(2)维度表:它的主要特点是包含类别属性信息,数据量较小,包括例如日期、门店名称、产品ID、顾客ID这些不重复的唯一字段。它也被称为Lookup表,是因为在Excel中我们经常把它们当作Vlookup函数中的目标查询表来使用(例:日历表、门店信息表、产品表、顾客信息表等)。


维度表事实表
介绍也称为Lookup表,一般行数少于数据表也成为数据表,数据量较大
举例日期、地域、客户信息、产品信息销售数据、网页访问数据、订单数据
用途一般用于行、列、筛选器和切片器用于搭建度量值
数据建模(关系视图)“1”的一端口“*”的一端,箭头指向的一端

2.维度表和事实表举例

举个例子,更便于大家理解:

该表为事实表,可以看到每条都是记录一个事实:

姓名行为时间
赵什锦下单iphone2023-08-15 23:45:52
赵什锦退货iphone2023-08-16 09:45:30
熊大下单薯片2023-08-16 12:23:30
熊二鼠标加入购物车2023-08-17 13:23:30
赵什锦下单华为2023-08-19 23:45:52
猪自强收藏XXX店铺2023-08-19 23:49:50

相对于上面这个事实表,下表为维度表:

姓名某宝ID性别
赵什锦U000608
熊二U000911
猪自强U002790
熊大U003790

二、PowerBi基础

1. PowerBi 简介:PowerBi 是软件服务、应用、和连接器的结合,它们协同工作以将相关数据来源转换为连贯的视觉逼真的交互见解。

2. 数据可视化的定义:通过数据与图像的结合,更直观的获取信息。

3. Power Bi主要由三部分组成:Power Query(Data Analysis Expression)、数据建模以及可视化看板。

(1) Power query: 编辑查询器帮助我们完成数据源整理工作,在你关闭并应用操作后,结果就被存储在了编辑查询中。

(2) 数据建模: 将维度表与事实表通过某字段建立对应关系(1对1或1对多),将数据连通。也可称为关系视图。

(3) 可视化看板:通过各类可视化组件、切片器等完成可视化看板的搭建。

4. 度量值与DAX

(1)度量值:用于展示关键指标。度量值大家可以理解为它是以一个公式的形式存在于Power Bi中,它不会使得你的数据表中产生新列或者新的行。因此和EXCEL中直接插入列导致产生大量新数据相比,度量值几乎不会占用内存。构建度量值的语言成为DAX(Data Analysis Expression)。

(2)DAX: 与EXCEL中的公式很相似,只不过EXCEL中的公式引用的是单元格(如'A1’,'B3’)。而DAX引用的是某张表中的某列的名称。

例如:[销售量] = sum ('销售数据'[数量])

注:在DAX中,单引号''中的为表名。方括号[]中的为列名。


想要搭建一个可视化看板,大致的流程可以分为:数据获取→数据清洗→数据建模→可视化看板搭建。下面会逐个步骤详细介绍。

三、数据获取

PowerBi支持多种数据源,如图1所示,如各种本地文件:Excel、CSV、文件夹等。支持各类数据库:Oracel、Mysql等。支持由表格构成前端的Web等。

以Excel为例,如图2所示。由于一个Excel文件可能包括很多个sheet,因此可以在左侧进行勾选,之后点击加载。其中“转换数据”指在将数据加载至PowerBi之前可以先对数据进行预处理,当然加载之后也可进行处理。但是如果数据量过大,或数据源中有很多列或者行是无用的,那么建议在加载数据前先将数据进行预处理(预处理和数据清洗方法一样,会在数据清洗章节详细说明)。

图1

图2

四、数据清洗

什么是数据清洗,一句话概括就是:将数据变成你想要且可用的。

(1)数据清洗的方式和方法

其中方式指实现清洗的工具或途径,例如可以在Powerbi中通过Power Query清洗,也可以在加载至Powerbi之前,通过SQL程序实现数据清洗。

其中方法指,例如将去除空值,去除重复值,合并列,拆分列,修改数据类型,数据逆透视等等。

(2)以Power Query为例,我们可以在Power Query的工具栏中通过各种方法实现数据清洗:

下图为Power Query界面,通过在Powerbi中点击“转换数据”即可进入,图中1部分展示了你可以进行的数据清洗方式,图中2展示了已经加载到Powerbi中的数据,图中3记录了你每次进行操作的记录(例如你删除一列,则在右侧就会记录下你删除一列的操作)。

清洗完成后,点击左上角的关闭并应用,所有的后台数据都会被保存并跳转回画布界面。

五、数据可视化

获取并清洗了数据后,就可以用清洗后的数据搭建看板。

1.画布功能界面介绍

下图中,图1部分是功能区,常用的包括:获取数据,转换数据,刷新等等。

图2部分从上到下依次为:画布展示,数据总览,数据建模。其中数据建模指将不同数据源的数据连接起来。

图3部分为可以使用的可视化组件(点击后即可拖拉拽),可视化组件下方为该可视化组件都展示了哪些字段(可以简单理解为横纵坐标都展示哪些数据)。

图4部分展示了数据的各个表的信息,各个表的每个列信息以及插入的度量值信息。

2.可视化组件介绍

(1)以柱状图折线图为例:

首先点击图1进入到画布界面,点击图2选中可视化组件类型,之后在图3处将数据中的字段拖拽到X轴或Y轴,即可实现简单的可视化图表的创建。

(2)图表的格式编辑

下图中红圈内部为图标格式编辑,例如图标颜色,标题,数据标签等等,如果在“视觉对象”选项中中找不到要更改的属性,则可以在“常规”选项中进行编辑。

编辑于 2023-08-15 15:24・IP 属地辽宁

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多