Recent Posts

Pages: [1] 2 3 ... 10
1
休闲聊天区 / Re: Long time no see!!!I have a dream.I need your support.
« Last post by David2020 on November 17, 2018, 10:06:12 pm »
飞吧。nothing is impossible 。顺便说一下,哪个肉身翻墙也可,哪个憨国便宜哦,香港也行
2
休闲聊天区 / Re: Long time no see!!!I have a dream.I need your support.
« Last post by clove on November 06, 2018, 09:22:05 am »
爬个墙还要说的这么艺术
3
休闲聊天区 / Long time no see!!!I have a dream.I need your support.
« Last post by lianglau on October 25, 2018, 02:34:24 pm »
B只能装这么多了。

正题:

我有个想法需要大家的技术支持。

就是想要自由自在的在网络上畅游,大家提供技术支持就行了。或者大家就讨论下技术。


4
R / R语言连接MYsql数据库
« Last post by David2020 on October 19, 2018, 01:33:32 pm »
1、首先安装R,然后安Rmysql包。
2、寻找能提供免费的在线数据空间,申请获得用户明和密码。
3、利用代码进行连接测试CRUD
[con <- dbConnect(MySQL(), host="www.db4free.net",port="3306", dbname="testrdb", user="username", password="password")]

[CREATE TABLE Persons
(
Id_P int(6) NOT NULL auto_increment,
LastName varchar(255),
FirstName varchar(255),
Address varchar(255),
City varchar(255),
PRIMARY KEY (`Id_P`)
)
]
4、利用DT包来现时界面和Filter等功能。
*感谢R开原社区提供R免费软件。感谢https://db4free.net提供免费网络数据库。*
5
R / Re: Cool,Thanks Bro!
« Last post by David2020 on October 19, 2018, 01:23:41 pm »
Thanks
6
R / Re: Cool,Thanks Bro!
« Last post by clove on October 18, 2018, 09:34:37 am »
r u crazy?
7
R / 缺点儿啥
« Last post by David2020 on October 12, 2018, 05:45:00 pm »
      9、九宫切
  8、微信
  7、lake:涂色
  6、keep
  5、哔哩哔哩动画
  4、网易云音乐
  3、绝地求生:刺激战场
  2、QQ阅读
  1、抖音/快手
  
8
R / 威胁安全与个人数据
« Last post by David2020 on October 12, 2018, 05:13:51 pm »
没有多少清醒的人真的认识到: 数据已经充分的进入我们的生活,你的数据就是你的个人的财富,是为了其他人创造更大更多财富的工具。
分享你的数据,能让其他人有更多的财富。这是一条正道。
你把产品放入各种的网上商城的购物车,网上商城能更好的利用你的数据多多的让你花比别人更多的钱,为杀熟提供有力的数据武器。
你分享的朋友圈:你的名字,你的住址,你的家人,这些对于别有用心的人都是透明的。
你的某度网盘:存储着 你的所有的手机的通信信息,短信,电话,和谁,何时 。
你的只浮报:你花的前,你到那里去,马爸爸都知道。
你的高的导航:真实的记录你的人生。
注意,大哥正在看你!
Big Brother is Watching U!
你开心吗?
Feel Good ,Feel Cool!
9
R / Cool,Thanks Bro!
« Last post by David2020 on October 12, 2018, 04:59:05 pm »
《R语言数据挖掘》——2.2 购物篮分析
本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 购物篮分析

购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法。这个概念适用于不同的应用,特别是商店运营。源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系。

2.2.1 购物篮模型

购物篮模型是说明购物篮和其关联的商品之间的关系的模型。来自其他研究领域的许多任务与该模型有共同点。总言之,购物篮模型可作为研究的一个最典型的例子。

购物篮也称为事务数据集,它包含属于同一个项集的项集合。

Apriori算法是逐层挖掘项集的算法。与Apriori算法不同,Eclat算法是基于事务标识项集合交集的TID集合交集项集的挖掘算法,而FP-Growth算法是基于频繁模式树的算法。TID集合表示交易记录标识号的集合。

2.2.2 Apriori算法

作为常见的算法设计策略,Apriori算法挖掘关联规则可以分解为以下两个子问题:

频繁项集生成

关联规则生成

该分解策略大大降低了关联规则挖掘算法的搜索空间。

2.2.2.1 输入数据特征和数据结构

作为Apriori算法的输入,首先需要将原始输入项集进行二值化,也就是说,1代表项集中包含有某项,0代表不包含某项。默认假设下,项集的平均大小是比较小的。流行的处理方法是将输入数据集中的每个唯一的可用项映射为唯一的整数ID。

项集通常存储在数据库或文件中并需要多次扫描。为控制算法的效率,需要控制扫描的次数。在此过程中,当项集扫描其他项集时,需要对感兴趣的每个项集的表示形式计数并存储,以便算法后面使用。

在研究中,发现项集中有一个单调性特征。这说明每个频繁项集的子集也是频繁的。利用该性质,可以对Apriori算法过程中的频繁项集的搜索空间进行剪枝。该性质也可以用于压缩与频繁项集相关的信息。这个性质使频繁项集内的小频繁项集一目了然。例如,从频繁3项集中可以轻松地找出包含的3个频繁2项集。

当我们谈论k项集时,我们指的是包含k个项的项集。

购物篮模型表采用水平格式,它包含一个事务ID和多个项,它是Apriori算法的基本输入格式。相反,还有另一种格式称为垂直格式,它使用项ID和一系列事务ID的集合。垂直格式数据的挖掘算法留作练习。

2.2.2.2 Apriori算法

在Apriori算法频繁项集产生过程中,主要包含以下两种操作:连接和剪枝。
一个主要的假定是:任何项集中的项是按字母序排列的。

连接:给定频繁k-1项集Lk-1,为发现频繁k项集Lk,需要首先产生候选k项集(记为Ck)。

https://yq.aliyun.com/articles/89742?spm=a2c4e.11153940.blogcont39840.15.6cfc162eJ9J1Yd
Pages: [1] 2 3 ... 10