Show Posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.


Topics - David2020

Pages: [1] 2 3 ... 16
1
R / R语言连接MYsql数据库
« on: October 19, 2018, 01:33:32 pm »
1、首先安装R,然后安Rmysql包。
2、寻找能提供免费的在线数据空间,申请获得用户明和密码。
3、利用代码进行连接测试CRUD
[con <- dbConnect(MySQL(), host="www.db4free.net",port="3306", dbname="testrdb", user="username", password="password")]

[CREATE TABLE Persons
(
Id_P int(6) NOT NULL auto_increment,
LastName varchar(255),
FirstName varchar(255),
Address varchar(255),
City varchar(255),
PRIMARY KEY (`Id_P`)
)
]
4、利用DT包来现时界面和Filter等功能。
*感谢R开原社区提供R免费软件。感谢https://db4free.net提供免费网络数据库。*

2
R / 缺点儿啥
« on: October 12, 2018, 05:45:00 pm »
      9、九宫切
  8、微信
  7、lake:涂色
  6、keep
  5、哔哩哔哩动画
  4、网易云音乐
  3、绝地求生:刺激战场
  2、QQ阅读
  1、抖音/快手
  

3
R / 威胁安全与个人数据
« on: October 12, 2018, 05:13:51 pm »
没有多少清醒的人真的认识到: 数据已经充分的进入我们的生活,你的数据就是你的个人的财富,是为了其他人创造更大更多财富的工具。
分享你的数据,能让其他人有更多的财富。这是一条正道。
你把产品放入各种的网上商城的购物车,网上商城能更好的利用你的数据多多的让你花比别人更多的钱,为杀熟提供有力的数据武器。
你分享的朋友圈:你的名字,你的住址,你的家人,这些对于别有用心的人都是透明的。
你的某度网盘:存储着 你的所有的手机的通信信息,短信,电话,和谁,何时 。
你的只浮报:你花的前,你到那里去,马爸爸都知道。
你的高的导航:真实的记录你的人生。
注意,大哥正在看你!
Big Brother is Watching U!
你开心吗?
Feel Good ,Feel Cool!

4
R / Cool,Thanks Bro!
« on: October 12, 2018, 04:59:05 pm »
《R语言数据挖掘》——2.2 购物篮分析
本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 购物篮分析

购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法。这个概念适用于不同的应用,特别是商店运营。源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系。

2.2.1 购物篮模型

购物篮模型是说明购物篮和其关联的商品之间的关系的模型。来自其他研究领域的许多任务与该模型有共同点。总言之,购物篮模型可作为研究的一个最典型的例子。

购物篮也称为事务数据集,它包含属于同一个项集的项集合。

Apriori算法是逐层挖掘项集的算法。与Apriori算法不同,Eclat算法是基于事务标识项集合交集的TID集合交集项集的挖掘算法,而FP-Growth算法是基于频繁模式树的算法。TID集合表示交易记录标识号的集合。

2.2.2 Apriori算法

作为常见的算法设计策略,Apriori算法挖掘关联规则可以分解为以下两个子问题:

频繁项集生成

关联规则生成

该分解策略大大降低了关联规则挖掘算法的搜索空间。

2.2.2.1 输入数据特征和数据结构

作为Apriori算法的输入,首先需要将原始输入项集进行二值化,也就是说,1代表项集中包含有某项,0代表不包含某项。默认假设下,项集的平均大小是比较小的。流行的处理方法是将输入数据集中的每个唯一的可用项映射为唯一的整数ID。

项集通常存储在数据库或文件中并需要多次扫描。为控制算法的效率,需要控制扫描的次数。在此过程中,当项集扫描其他项集时,需要对感兴趣的每个项集的表示形式计数并存储,以便算法后面使用。

在研究中,发现项集中有一个单调性特征。这说明每个频繁项集的子集也是频繁的。利用该性质,可以对Apriori算法过程中的频繁项集的搜索空间进行剪枝。该性质也可以用于压缩与频繁项集相关的信息。这个性质使频繁项集内的小频繁项集一目了然。例如,从频繁3项集中可以轻松地找出包含的3个频繁2项集。

当我们谈论k项集时,我们指的是包含k个项的项集。

购物篮模型表采用水平格式,它包含一个事务ID和多个项,它是Apriori算法的基本输入格式。相反,还有另一种格式称为垂直格式,它使用项ID和一系列事务ID的集合。垂直格式数据的挖掘算法留作练习。

2.2.2.2 Apriori算法

在Apriori算法频繁项集产生过程中,主要包含以下两种操作:连接和剪枝。
一个主要的假定是:任何项集中的项是按字母序排列的。

连接:给定频繁k-1项集Lk-1,为发现频繁k项集Lk,需要首先产生候选k项集(记为Ck)。

https://yq.aliyun.com/articles/89742?spm=a2c4e.11153940.blogcont39840.15.6cfc162eJ9J1Yd

5
休闲聊天区 / Do you mind to have a R subForum Here?
« on: August 14, 2018, 12:26:22 pm »
?R

6
休闲聊天区 / 好久没来了,也回来看看。
« on: January 31, 2018, 05:10:38 pm »
 :o
大家好!

7
休闲聊天区 / 冒个泡!
« on: September 24, 2017, 12:47:59 pm »
 :)呵呵

9
休闲聊天区 / 我会来了!
« on: February 29, 2016, 04:48:17 pm »
 ;D
我回来了,
哈哈哈
上菜了

10
休闲聊天区 / 好久没来了
« on: December 08, 2014, 04:37:27 pm »
工作性质变了,以后要远离IT,也没有多少时间来发帖了,很遗憾呀! ???

11
休闲聊天区 / 快讯:小米收集隐私被央视曝光
« on: August 30, 2014, 03:34:19 pm »
今天早上,中央电视台《朝闻天下》栏目曝光了小米窃取用户隐私。其主要内容有2点:

1,正规企业私自收集用户隐私。节目组给出了小米4的画面。并提到,小米窃取用户隐私首先是被中国台湾监管机构发现,自动将用户的手机号码等信息,回传到小米公司的服务器上,随后,小米公司进行道歉,并关闭回传系统的功能。

2,朝闻天下向小米公司发出了“大陆用户隐私回传”的相关质疑,但小米公司没有回应。

此外,朝闻天下还提到,苹果、谷歌等公司也曝出过收集用户隐私的丑闻。朝闻天下利用专家点评的方式指出:企业收集用户隐私主要是为了商业目的,比如,可以掌握自己手机的真实销量,从而方便生产的准备。很多企业在收集用户隐私时并没有告知用户。

12
休闲聊天区 / 过节喽!
« on: August 01, 2014, 09:52:27 am »
今天是你的节日!
“见军”

13
休闲聊天区 / 台风来了!
« on: July 25, 2014, 09:55:57 am »
*   ;'''''''                                         ''''''''''''
 '''' ''''                       ''''

14
休闲聊天区 / 马航客机被击落?
« on: July 18, 2014, 09:35:41 am »
伤不起呀 :o :o

15
Android(安卓) / php 调用 Andriod 硬件?
« on: July 15, 2014, 11:27:18 am »
php 调用 Andriod 硬件?
能?

Pages: [1] 2 3 ... 16