数据可视化,Tableau中如何制作基础的Sankey Diagram?

作者:信息科学    来源:未知    发布时间:2019-12-18 20:30    浏览量:

在桑基图的制作中,涉及两部分数据,一是原始基本数据,增加一列LINK ;二是辅助列表,1.t值的范围[-6,6],步长0.25,总计49行,用于与原始主数据关联。

关于(0,0.5)中心对称;

图片 1

当然,这是最基本的Sankey,复杂的Sankey同样可以在Tableau中实现,比如多级决策树等,但原理都是围绕这个展开。在本例中Sankey的S型走向只有两种,如果需要多重走向的Sankey,可以在字段[位置2]中,断裂正常的数据填充,比如25——79,81——100,0——24,最后一列才是80。这样的话效果会有所不同,形状如下:

图片 2

这个函数的作用在于为构造S型流线做准备,EXP是Tableau中写幂指数的表达式;

3.

值域为(0,1)。

图片 3

通常,我们所见的桑基图如上,左侧代表电影类型,右侧代表电影名称,而流线的粗细象征着票房收入的多少,今天介绍的入门只求形似,不追求一个源头下散发出的细节分布。

图片 4

另一个是【曲线】,函数式为:[位置1]+(([位置2]-[位置1])*[Sigmoid函数]),这个函数作用一目了然,我们的Sankey Diagram的左右端点正因为处于不用的水平线上,才能画出S型流线,([位置2]-[位置1])计算了源数据中两点在位置上的偏移,而[Sigmoid函数]的值域处于(0,1)之间,本例中,([位置2]-[位置1])的差值为常量24,因此不消细说,在脑海的图景中已经可以构想出Sankey Diagram的大致模样。

4.将标记更改为线,以唯一标识ID将缠绕的线分隔开;将类别拖入颜色区分,金额拖入大小区分线条粗细情况

假设有如下两个数据,在Data1中,连接是完全相同的字符串,目的是与Data2进行关联;ID是编号;种类分为两种大类:电力与燃气;详细用途细分“电力-XXX”与“燃气-XXX”;总共有100行数据。

Sigmoid函数是一个在生物学中常见的S型的函数,也称为S型生长曲线。 在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间。如图

因此,Tableau结合基本的数学知识往往可以衍生出多形态的创意图形,值得深入探索。

图片 5

操作步骤:

如图将t与曲线拖拽至列及行,且更改为维度,雏形呈现

数据可视化

  1.    连接数据源(乱填的- -)

之后无论是龚珀斯曲线还是桑基图,都由此演化而来。Sankey Diagram目前可以轻松利用D3.js 加以实现,但是利用tableau 呈现尚属新颖。

准备阶段:

数据可视化

桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。

(4)将t拖入列字段(维度),曲线拖入行字段(维度);将“标记”更改为“线”,再利用ID这独一无二的变量作为“详细信息”将纠缠在一起的线分开,最后,将“详细用途”拖拽至“颜色”中为线段赋予颜色。最终效果如下:

因sigmoid函数的值域为[0,1],[位置2]-[位置1]计算了数据位置的偏移

之后,可以根据个人需要去除标题,修改样式,颠倒X、Y字段等。

桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的"蒸汽机的能源效率图"而闻名,此后便以其名字命名为"桑基图"。

数据可视化

绘制阶段:

(1)首先准备好数据。

以上便是是桑基图的最基础内容,进阶版正在研究中~~~QAQ那个位置1与2计算字段怎么玩的?

(3)创建计算字段。

图片 6

数据可视化

最后就是这张很玄幻的图,这就是乱画数出的图- -,无限缩小

数据可视化

此为构造S型曲线做准备

数据可视化

  1.     创建计算字段,

在今天的数据可视化领域,桑基图有利于展现分类维度间的相关性,以流的形式呈现共享同一类别的元素数量。特别适合表达集群的发展,比如展示特定群体的人数分布等。

该函数图像的特点有:

对于该图的称呼莫衷一是:有直接根据象形定名它为“决策树 ”(Decision Tree);或者根据线段的层级流动称之为“流程图/作业图”(Flow Diagram);还有一些图形网站称其为“冲击图”(Alluvial Diagram)……但对其最准确的定义应当是:桑基图(Sankey Diagram)。桑基图的名称来源于爱尔兰船长Matthew Henry Phineas Riall Sankey,1898年,桑基利用这种图表形式反映发动机的能源效率,具体请搜索Wikipedia。

首先,需要明白这种S型曲线的来源,也就是通常所说的S型函数Sigmoid Function,函数类型为:

Sankey Diagram,是指以下这种数据图:

连续,光滑,严格单调;

一个是【Sigmoid函数】,直接仿写函数式即可, 1/(1+EXP(1)^(-[t])),

(2)将数据导入Tableau ,利用“连接”作为联接子句在数据源间建立联系,显然数据的列数就会变为49 * 100 = 4900列。

在Data2中,有49行数据,两个属性名:“连接”与“t”,连接与Data1中保持一致,t也即函数式中的t,本例中t区间为[-6,6],步长为0.25,恰好可以填充完49列。

位置1是从1——100的序列,而位置2可以从任意数值开始,往下填充序列,到了100后从1开始直到填充满100行。

数据可视化

当前页面网址 http://www.dashujukong.com/zixun/8505 ,转载请保留

相关新闻推荐

友情链接: 网站地图
Copyright © 2015-2019 http://www.kai-wang.com. AG亚游国际有限公司 版权所有