Show Posts

This section allows you to view all posts made by this member. Note that you can only see posts made in areas you currently have access to.


Messages - David2020

Pages: [1] 2 3 ... 110
1
飞吧。nothing is impossible 。顺便说一下,哪个肉身翻墙也可,哪个憨国便宜哦,香港也行

2
R / R语言连接MYsql数据库
« on: October 19, 2018, 01:33:32 pm »
1、首先安装R,然后安Rmysql包。
2、寻找能提供免费的在线数据空间,申请获得用户明和密码。
3、利用代码进行连接测试CRUD
[con <- dbConnect(MySQL(), host="www.db4free.net",port="3306", dbname="testrdb", user="username", password="password")]

[CREATE TABLE Persons
(
Id_P int(6) NOT NULL auto_increment,
LastName varchar(255),
FirstName varchar(255),
Address varchar(255),
City varchar(255),
PRIMARY KEY (`Id_P`)
)
]
4、利用DT包来现时界面和Filter等功能。
*感谢R开原社区提供R免费软件。感谢https://db4free.net提供免费网络数据库。*

3
R / Re: Cool,Thanks Bro!
« on: October 19, 2018, 01:23:41 pm »
Thanks

4
R / 缺点儿啥
« on: October 12, 2018, 05:45:00 pm »
      9、九宫切
  8、微信
  7、lake:涂色
  6、keep
  5、哔哩哔哩动画
  4、网易云音乐
  3、绝地求生:刺激战场
  2、QQ阅读
  1、抖音/快手
  

5
R / 威胁安全与个人数据
« on: October 12, 2018, 05:13:51 pm »
没有多少清醒的人真的认识到: 数据已经充分的进入我们的生活,你的数据就是你的个人的财富,是为了其他人创造更大更多财富的工具。
分享你的数据,能让其他人有更多的财富。这是一条正道。
你把产品放入各种的网上商城的购物车,网上商城能更好的利用你的数据多多的让你花比别人更多的钱,为杀熟提供有力的数据武器。
你分享的朋友圈:你的名字,你的住址,你的家人,这些对于别有用心的人都是透明的。
你的某度网盘:存储着 你的所有的手机的通信信息,短信,电话,和谁,何时 。
你的只浮报:你花的前,你到那里去,马爸爸都知道。
你的高的导航:真实的记录你的人生。
注意,大哥正在看你!
Big Brother is Watching U!
你开心吗?
Feel Good ,Feel Cool!

6
R / Cool,Thanks Bro!
« on: October 12, 2018, 04:59:05 pm »
《R语言数据挖掘》——2.2 购物篮分析
本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 购物篮分析

购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法。这个概念适用于不同的应用,特别是商店运营。源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系。

2.2.1 购物篮模型

购物篮模型是说明购物篮和其关联的商品之间的关系的模型。来自其他研究领域的许多任务与该模型有共同点。总言之,购物篮模型可作为研究的一个最典型的例子。

购物篮也称为事务数据集,它包含属于同一个项集的项集合。

Apriori算法是逐层挖掘项集的算法。与Apriori算法不同,Eclat算法是基于事务标识项集合交集的TID集合交集项集的挖掘算法,而FP-Growth算法是基于频繁模式树的算法。TID集合表示交易记录标识号的集合。

2.2.2 Apriori算法

作为常见的算法设计策略,Apriori算法挖掘关联规则可以分解为以下两个子问题:

频繁项集生成

关联规则生成

该分解策略大大降低了关联规则挖掘算法的搜索空间。

2.2.2.1 输入数据特征和数据结构

作为Apriori算法的输入,首先需要将原始输入项集进行二值化,也就是说,1代表项集中包含有某项,0代表不包含某项。默认假设下,项集的平均大小是比较小的。流行的处理方法是将输入数据集中的每个唯一的可用项映射为唯一的整数ID。

项集通常存储在数据库或文件中并需要多次扫描。为控制算法的效率,需要控制扫描的次数。在此过程中,当项集扫描其他项集时,需要对感兴趣的每个项集的表示形式计数并存储,以便算法后面使用。

在研究中,发现项集中有一个单调性特征。这说明每个频繁项集的子集也是频繁的。利用该性质,可以对Apriori算法过程中的频繁项集的搜索空间进行剪枝。该性质也可以用于压缩与频繁项集相关的信息。这个性质使频繁项集内的小频繁项集一目了然。例如,从频繁3项集中可以轻松地找出包含的3个频繁2项集。

当我们谈论k项集时,我们指的是包含k个项的项集。

购物篮模型表采用水平格式,它包含一个事务ID和多个项,它是Apriori算法的基本输入格式。相反,还有另一种格式称为垂直格式,它使用项ID和一系列事务ID的集合。垂直格式数据的挖掘算法留作练习。

2.2.2.2 Apriori算法

在Apriori算法频繁项集产生过程中,主要包含以下两种操作:连接和剪枝。
一个主要的假定是:任何项集中的项是按字母序排列的。

连接:给定频繁k-1项集Lk-1,为发现频繁k项集Lk,需要首先产生候选k项集(记为Ck)。

https://yq.aliyun.com/articles/89742?spm=a2c4e.11153940.blogcont39840.15.6cfc162eJ9J1Yd

7
休闲聊天区 / Re: Do you mind to have a R subForum Here?
« on: September 10, 2018, 08:44:24 am »
Introduction to R
R is a language and environment for statistical computing and graphics. It is a GNU project which is similar to the S language and environment which was developed at Bell Laboratories (formerly AT&T, now Lucent Technologies) by John Chambers and colleagues. R can be considered as a different implementation of S. There are some important differences, but much code written for S runs unaltered under R.

R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible. The S language is often the vehicle of choice for research in statistical methodology, and R provides an Open Source route to participation in that activity.

One of R’s strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed. Great care has been taken over the defaults for the minor design choices in graphics, but the user retains full control.

R is available as Free Software under the terms of the Free Software Foundation’s GNU General Public License in source code form. It compiles and runs on a wide variety of UNIX platforms and similar systems (including FreeBSD and Linux), Windows and MacOS.

The R environment
R is an integrated suite of software facilities for data manipulation, calculation and graphical display. It includes

an effective data handling and storage facility,
a suite of operators for calculations on arrays, in particular matrices,
a large, coherent, integrated collection of intermediate tools for data analysis,
graphical facilities for data analysis and display either on-screen or on hardcopy, and
a well-developed, simple and effective programming language which includes conditionals, loops, user-defined recursive functions and input and output facilities.
The term “environment” is intended to characterize it as a fully planned and coherent system, rather than an incremental accretion of very specific and inflexible tools, as is frequently the case with other data analysis software.

R, like S, is designed around a true computer language, and it allows users to add additional functionality by defining new functions. Much of the system is itself written in the R dialect of S, which makes it easy for users to follow the algorithmic choices made. For computationally-intensive tasks, C, C++ and Fortran code can be linked and called at run time. Advanced users can write C code to manipulate R objects directly.

Many users think of R as a statistics system. We prefer to think of it of an environment within which statistical techniques are implemented. R can be extended (easily) via packages. There are about eight packages supplied with the R distribution and many more are available through the CRAN family of Internet sites covering a very wide range of modern statistics.

R has its own LaTeX-like documentation format, which is used to supply comprehensive documentation, both on-line in a number of formats and in hardcopy.

8
休闲聊天区 / Do you mind to have a R subForum Here?
« on: August 14, 2018, 12:26:22 pm »
?R

9
休闲聊天区 / Re: 这里是不是快要关闭了?
« on: August 14, 2018, 12:25:14 pm »
haha,Here I am.

10
CMDed免费服务公告区 / Re: Moved to a new place
« on: June 04, 2018, 04:06:56 pm »
感谢,时代在改变,在进步。

11
道德的前进的速度要慢于科技发展的速度

12
编程开发 / Re: 小白提问:有做网站的老铁么
« on: June 04, 2018, 04:01:51 pm »
基本流量都在微信和其他的移动端了

13
休闲聊天区 / Re: 好久没来了,也回来看看。
« on: June 04, 2018, 04:00:39 pm »
又来了!

14
休闲聊天区 / 好久没来了,也回来看看。
« on: January 31, 2018, 05:10:38 pm »
 :o
大家好!

15
休闲聊天区 / Re: 好久没来了,回来看看。
« on: January 31, 2018, 05:01:51 pm »
看的是回忆,观的是人生! :o

Pages: [1] 2 3 ... 110