关联分析是什么意思
关联分析就是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现.一个典型的例子就是购物篮分析,其目的是发现交易数据中不同商品之间的联系规则,让营销商制定更好的营销策略.例如,经典的啤酒和尿布案例,数据挖掘发现在大型超市中购买啤酒的男士经常同时购买小孩的纸尿裤,基于这一发现,超市把啤酒和纸尿裤摆放在一起,结果两种商品的销售量都有明显提升.消费者行为海量数据的关联分析在电商精准销售中得到广泛应用,对其货品种类、库存、仓储、物流和广告业务都有极大的效益回馈。
关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。
关联分析的作用是什么?
购买了Diaper的顾客会购买Beer.这个关系不是必然的,但是可能性很大,这就已经足够用来辅助商家调整Diaper和Beer的摆放位置了,例如摆放在相近的位置,进行捆绑促销来提高销售量。
1、事务:每一条交易称为一个事务,例如示例1中的数据集就包含四个事务。
2、项:交易的每一个物品称为一个项,例如Cola、Egg等。
3、项集:包含零个或多个项的集合叫做项集,例如{Cola, Egg, Ham}。
4、k?项集:包含k个项的项集叫做k-项集,例如{Cola}叫做1-项集,{Cola, Egg}叫做2-项集。
5、支持度计数:一个项集出现在几个事务当中,它的支持度计数就是几.例如{Diaper, Beer}出现在事务 002、003和004中,所以它的支持度计数是3。
6、支持度:支持度计数除于总的事务数.例如上例中总的事务数为4,{Diaper, Beer}的支持度计数为3,所以它的支持度是3÷4=75%,说明有75%的人同时买了Diaper和Beer。
7、频繁项集:支持度大于或等于某个阈值的项集就叫做频繁项集.例如阈值设为50%时,因为{Diaper, Beer}的支持度是75%,所以它是频繁项集。
8、前件和后件:对于规则{Diaper}→{Beer},{Diaper}叫做前件,{Beer}叫做后件。
9、置信度:对于规则{Diaper}→{Beer},{Diaper, Beer}的支持度计数除于{Diaper}的支持度计数,为这个规则的置信度.例如规则{Diaper}→{Beer}的置信度为3÷3=100%.说明买了Diaper的人100%也买了Beer。
10、强关联规则:大于或等于最小支持度阈值和最小置信度阈值的规则叫做强关联规则.关联分析的最终目标就是要找出强关联规则?。
以上详细介绍了关联分析是什么意思,也介绍了关联分析的作用是什么.通过本文的介绍,我们可以知道,关联分析是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现。
猜你喜欢内容
-
上交所是什么
上交所,全称为上海证券交易所,是一个为证券集中交易提供场所和设施,组织和监督证券交易,实行自律管...
-
什么是资产阶级
资产阶级,指的是部分西方经济思想学派通过科学性手段对资本主义社会所做的阶级划分的其中一个富有阶级...
-
中小板和创业板的区别
中小板和创业板的区别主要表现在以下方面:1、进入门槛不同:中小企业板块的进入门槛较高,上市条件较为...
-
北向资金是什么意思
北向资金,又称为“北上资金”,是指从香港股市中通过沪股通的方式流入大陆股市的资金。在中国股市中,...
-
沪股通是什么
沪股通是指投资者委托香港经纪商,经由香港联合交易所设立的证券交易服务公司,向上海证券交易所进行申...
-
建设银行的概述
建设银行是中国建设银行的简称,中国建设银行前身是中国人民建设银行,属于中央管理的大型国有银行。按...
-
什么是基金募集期
基金募集期指基金合同和基金招募说明书中所载明的,并经过中国证监会所核准的基金份额的募集期限,同时...
-
什么是基金销售牌照
基金销售牌照指由中国证监会所颁发的,用于证明从事基金产品销售的企业或机构具有基金销售资格的许可证...
-
600359股票是什么
600359股票代表新农开发,是新疆塔里木农业综合开发股份有限公司在上交所发行的股票,股票首发主承销商...
-
600019股票是什么
600019股票代表宝钢股份,是宝山钢铁股份有限公司在上交所发行的股票。公司主营业务是钢铁冶炼、加工,...






















