PowerBI开发第四篇：DAX表达式

郑学甫360 2019-07-20

展开全文

DAX 表达式主要用于创建度量列（Measure），度量值是根据用户选择的Filter和公式，计算聚合值，DAX表达式基本上都是引用对应的函数，函数的执行有表级（Table-Level）上下文和行级（Row-Level）上下文之别；其交互行为都是通过表之间的关系实现的，用户选择的Filter，会通过关系对数据进行过滤，是PowerBI报表呈现的数据具有动态交互的特性。在我开发的PowerBI报表项目中，经常使用的DAX表达式函数，其实并不是很多，本文分享一些入门级的常用函数，附上简单的注释，希望对新手设计PowerBI报表有所帮助。

我的PowerBI开发系列的文章目录：PowerBI开发

一，常用的操作符

在DAX表达式中，常用的操作符是：

文本使用双引号作为界定符，
等号是“=”号，不等号是：<>
赋值使用“=”号，
布尔值使用 TRUE()和FALSE()函数，
空值使用BLANK()函数表示，
集合使用大括号{}表示，例如，包含三个item的集合： {1,2,3}
字符的连接符号是：&
逻辑运算符号是：逻辑与是 &&，逻辑或是： ||

二，过滤函数

过滤函数能够操作数据的上下文，以实现数据的动态计算，功能非常强大。

1，关联函数

Related函数返回跟当前的数据行有关系的表的单个值，

RELATED(related_table[column])

Related函数要求当前表和关联表之间存在关系（Relationship），当前表和关联表之间存在many-to-one的关系，从关联表中返回单个值。

Related函数运行在行上下文（row context），因此，只能用于计算列的表达式。

示例：表InternetSales_USD和SalesTerritory之间存在关系，从表SalesTerritory获取SalesTerritoryCountry的值，并通过FILTER函数进行过滤，统计表InternetSales_USD中字段[SalesAmount_USD]的加和：

= SUMX(FILTER( 'InternetSales_USD', RELATED('SalesTerritory'[SalesTerritoryCountry]) <>"United States" )  ,'InternetSales_USD'[SalesAmount_USD])

RELATEDTABLE 用于one-to-many的关系，用于返回被过滤的所有数据行组成的表。

2，过滤函数

Filter函数，返回被过滤之后的表，是表数据的子集：

FILTER(<table>,<filter>)

通过过滤条件，获取表的子集，过滤函数返回的表只能用于计算。过滤函数不是独立的，必须嵌入（embedded）到其他函数中作为一个表值参数。

3，计算函数

Calculate函数，在过滤器的上下文中计算表达式，返回单个值：

CALCULATE(<expression>,<filter1>,<filter2>…)

参数expression是计算的表达式，受到filter参数的上下文的影响，如果filter参数改变数据的上下文，那么在新的上下文中计算表达式。计算函数的最大特点是能够移除过滤器，在过滤器参数列表中，如果一个数据列上存在多个过滤器，那么Calculate函数会移除前面的过滤器，而只应用当前的过滤器。

对于Calculate函数的Filter，有两种表达式，一种是布尔表达式，计算的结果是布尔值；一种是只包含一列的表格表达式，是指计算该表格相关联的数据，相当于做“相等”过滤。

示例：在计算比例关系时，使用计算函数的移除过滤器的功能：

=( SUM('ResellerSales_USD'[SalesAmount_USD]))  
 /CALCULATE( SUM('ResellerSales_USD'[SalesAmount_USD])  
           ,ALL('ResellerSales_USD'))

表达式中的分母，使用计算函数，其中，第一个过滤器参数使用ALL过滤函数，使得sum表达式统计所有的数据行，这种行为重写对数据表的隐式过滤器。

4,移除过滤器

ALL函数返回表中的所有数据行，清理任意过滤器，用于对全表执行聚合运算。ALL函数主要用于计算比例关系，常用于分母中。

ALL( {<table> | <column>)

5，去重函数

Distinct 返回单列的表，包含无重复的值，也就是说，从表中移除重复值，只返回列的唯一值。

DISTINCT(<column>)

6，过滤器的值

函数Values返回被过滤的唯一值，在同一个表中的其他Column被过滤，那么返回被过滤的当前Column的唯一值。Values函数和Distinct函数很相似，唯一的不同是Values函数会返回Unknown，这是因为关联的Table中包含部匹配的数据行，和Left Join的右表中包含NULL值很相似。

VALUES(<TableNameOrColumnName>)

When you use the VALUES function in a context that has been filtered, the unique values returned by VALUES are affected by the filter.

结合CONCATENATEX函数，能够把所有过滤器的值连接成字符串。注意，DAX表达式使用 & 进行字符串的连接。

7，探测直接过滤（filtered directly）

如果指定的Column被直接过滤（filtered directly），函数返回True；当同一个Table中的其他Column被过滤，切片器（Slicer）中被关联的Column，默认设置是全部直接过滤，函数返回True；如果Column上没有直接的过滤，或者同一个Table中的其他Column被过滤，或者被有关系的Table过滤，函数返回False。

ISFILTERED(<columnName>)

直接过滤器的数值通过函数Filters返回：

FILTERS(<columnName>)

8，探测关联过滤

如果同一个Table中的其他Column被过滤，或者被有关系的Table过滤，函数返回True

ISCROSSFILTERED(<columnName>)

9，保持过滤器

函数 KeepFilters 的作用是保持过滤器，用于计算函数（CALCULATE 和 CALCULATETABLE）中。默认情况下，计算函数的过滤器参数（filter argument）会对过滤表数据，当在相同的字段上设置过滤器参数（filter argument）时，该参数会替换已经存在的过滤器；当相同的字段上没有过滤器参数（filter argument）时，已经存在的过滤器不受影响。函数KeepFilters会改变计算函数的行为，当在计算函数使用函数KeepFilters时，表的上下文是过滤器参数（filter argument）和已经存在的过滤器的交集，也就是说，表的上下文同时受到已经存在的过滤器和计算函数的过滤器参数（filter argument）的影响。计算函数替换已经存在的过滤器，而函数 KeepFilters会添加已经存在的过滤，求交集。

KEEPFILTERS(<expression>)

三，统计函数

统计函数是最强力的函数，同时也是最复杂的函数，为数据的分析，提供非常强力的工具，同时，在使用统计函数时，必须考虑到数据模型，表之间关系，数据重复等因素，一般都会搭配过滤函数实现数据的提取和分析。

1，求和函数

从表中计算每一个行的加和，只有数值会被加和，忽略空值，date，逻辑值或文本值：

SUMX(<table>, <expression>)

示例，第一个参数是过滤器返回的表值，计算[Freight]的加和：

=SUMX(FILTER(InternetSales, InternetSales[SalesTerritoryID]=5),[Freight])

可以把SUMX函数，转换为CALCULATE函数：

=CALCULATE( SUM(InternetSales[Freight]), FILTER(InternetSales, InternetSales[SalesTerritoryID]=5))

2，计数函数

计算函数分为：COUNTX和COUNTAX，COUNTX只统计数值，忽略空值（blank），date，逻辑值或文本值；COUNTAX函数统计非空值（blank），包含数值，date，逻辑值或文本值。

COUNTX(<table>,<expression>)  
COUNTAX(<table>,<expression>)

例外：如果列中包含表达式，而表达式的结果是空值，但是，COUNTAX/COUNTX函数把包含公式的列值作为非空（nonblank）看待，在这种情况下，计数函数会增加计数值。

如果COUNTAX函数没有数据列做计数，返回blank；如果COUNTAX函数聚合的数据列都是blank，返回0。

3，唯一值计数

统计列的唯一值计数，参数是表列，允许是任意数据类型，当找不到任何数据行时，返回BLANK，否则，统计唯一值的数量。

DISTINCTCOUNT(<column>)

4，分组聚合函数

DAX 中功能最强大的函数，对相互关联的Table按照特定的字段，分组聚合，由于分组列是唯一的，通过SUMMARIZE函数，可以获得多列的唯一值。

SUMMARIZE(<table>, <groupBy_columnName>[, <groupBy_columnName>]…[, <name>, <expression>]…)

示例：对数据表 ResellerSales_USD ，按照字段 DateTime[CalendarYear] 和 ProductCategory[ProductCategoryName]分组，计算 SUM(ResellerSales_USD[SalesAmount_USD])和 SUM(ResellerSales_USD[DiscountAmount]) 。

SUMMARIZE(ResellerSales_USD  
      , DateTime[CalendarYear]  
      , ProductCategory[ProductCategoryName]  
      , "Sales Amount (USD)", SUM(ResellerSales_USD[SalesAmount_USD])  
      , "Discount Amount (USD)", SUM(ResellerSales_USD[DiscountAmount])  
      )

分组聚合函数，能够利用关系，引用相关表的字段，也就是说，SUMMARIZE函数能够对有关系的表执行连接（join）运算，计算笛卡尔乘积，对Join的结果集执行分组聚合，例如：

summarize
 (
     'Internet Sales',
     'Product'[Product Name],
     'Date'[Calendar Year],
     "Total Sales Amount", sum('Internet Sales'[Sales Amount])
 )

从数据表Date中获取字段Calendar Year的前提是，数据表Date和Internet Sales之间存在关系，从数据表Product中获取字段Product Name的前提是：数据表Product和Internet Sales之间存在关系。

分组聚合函数用于创建新表，在Modeling菜单中，通过“New Table”从DAX表达式中创建新的Table：

参考文档：SUMMARIZE – groupping in data models (DAX – Power Pivot, Power BI)

四，文本函数

在DAX表达式中，字符串使用双引号界定。

1，格式函数

按照指定的格式把值转换成文本

FORMAT(<value>, <format_string>)

2，空值

在DAX中，空值（Blank）和数据库的NULL值是相同的，通过函数ISBLANK(value)判断当前的字段值是否是空值。

BLANK()
ISBLANK(<value>)

3，查找函数

在一段文本中查找字符串时，从左向右读取文本，查找函数返回第一次匹配的字符的序号，序号从1开始，依次递增。search函数不区分大小写，而find函数区分大小写。

FIND(<find_text>, <within_text>[, [<start_num>][, <NotFoundValue>]]) 
SEARCH(<find_text>, <within_text>[, [<start_num>][, <NotFoundValue>]])

参数 NotFoundValue 是可选的，当查找不到匹配的子串时，返回该参数的值，一般设置为0，-1或BLANK()。

如果不设置该参数，而查找函数查找不到匹配的子串时，函数返回错误。可以通过IFERROR函数处理错误，例如：

= IFERROR(SEARCH("-",[PostalCode]),-1)

5，拼接函数

把表中的数据按照指定的分隔符拼接成字符串

CONCATENATEX(<table>, <expression>, [delimiter])

示例，Employees表中包含[FirstName] 和 [LastName]两列，把这两列拼接成一个字符串：

CONCATENATEX(Employees, [FirstName] & “ “ & [LastName], “,”)

五，逻辑函数

1，逻辑判断函数

检查逻辑条件是否满足，如果满足，返回value_if_true，如果不满足，返回value_if_false。

IF(logical_test>,<value_if_true>, <value_if_false>)

等于使用“=”表示，逻辑与使用“&&”表示，逻辑或使用“||”表示，而逻辑非，通常使用NOT()函数来实现：

NOT(<logical>)

2，布尔值函数

TRUE()  
FALSE()

通常用于表示数据库的bit类型的值

3，错误函数

如果表达式返回错误，返回value_if_error；如果表达式不返回错误，返回表达式的值。

IFERROR(expression, value_if_error)

错误函数等价于：

IFERROR(A,B) := IF(ISERROR(A), B, A)

4，包含逻辑

表（Table）表达式是由大括号构成的集合：{value1,value2,,vlaueN}

IN操作符的用法是：

<scalarExpr> IN <tableExpr>

包含行函数的用法是：

CONTAINSROW(<tableExpr>, <scalarExpr>[, <scalarExpr>, …])

示例，以下两个表达式是等价的：

[Color] IN { "Red", "Yellow", "Blue" }
CONTAINSROW({ "Red", "Yellow", "Blue" }, [Color])

六，关系

使用DAX表达式创建两个查询之间的关系。

1，为指定的关系指定查询时（query-time）的方向（cross-filtering direction）

函数CrossFilter使用已经存在的关系，重写的关系设置只在查询时有效。

CROSSFILTER(<columnName1>, <columnName2>, <direction>)

2，使用关系

函数UseRelationship只能使用已经存在的关系，通过关系两个端点（endpoint）来指定关系，关系的状态是不重要的，通常，使用该函数的目的是在Calculate函数中使用不活跃（Inactive）的关系。

USERELATIONSHIP(<columnName1>,<columnName2>)

七，自然连接（NaturalJoin）

DAX表达式支持自然连接操作，分为：自然内连接和自然左外连接，函数的两个参数分别是表表达式。自然连接要求两个表中必须有同名列，并且公共列的数据类型必须相同，按照公共列做连接操作。

NATURALLEFTOUTERJOIN(<leftJoinTable>, <rightJoinTable>) 
NATURALINNERJOIN(<leftJoinTable>, <rightJoinTable>)

自然连接函数的两个参数是表表达式，可以是使用函数SUMMARIZE()函数派生的表，例如：

AttendeeCohortShare = NATURALINNERJOIN(
SUMMARIZE(AttendeeCohort,AttendeeCohort[Cohort_Last],"#LastObjectIDs",DISTINCTCOUNT(AttendeeCohort[ObjectId]),"Cohort",MAX(AttendeeCohort[Cohort_Last])) 
,SUMMARIZE(AttendeeCohort,AttendeeCohort[Cohort_Current],"#CurrentObjectIDs",DISTINCTCOUNT(AttendeeCohort[ObjectId]),"Cohort",MAX(AttendeeCohort[Cohort_Current])))

参考文档：

DAX basics in Power BI Desktop

Data Analysis Expressions (DAX) Reference