• 贡献

  • 关注

  • 访问

个人简介:

 
共 388 篇文章
显示摘要每页显示  条
数据探析期刊文章研究热点。不同主题下的期刊栏目数目变化本文对数据集进行概率潜在语义分析主体建模,识别出标题中出现的高频词汇,并研究其分布规律。同时可以看到13年之后”数据“关键词出现最多的栏目是数据技术和信息管理,13年之前是数据库技术统计研究和微计算机信息,可见数据库技术、信息管理和统计研究成为”数据”关键词相关文章的...
python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析原文链接:http://tecdat.cn/?p=7318产品可以根据销售者进行分类。我根据供应商同现关系在产品之间建立了一个图表,即每个节点对应于一种产品,其边权重由同时出售两种事件产品的供应商数量定义。它包含73个节点和2,219个边缘(我在数据中找到了3,785个供应商)。这表明销售毒品的供...
python算法对音频信号处理Sonification :Gauss-Seidel迭代算法原文链接:http://tecdat.cn/?p=7620.from TridiagonalMatrix import *from numpy import *from scipy.io import wavfileimport scipy.fftpackimport pylabimport sysimport osdef musical_gauss_seidel(A, b, x0, tol):"""do the gauss seidel iterationbut outpu...
虎扑论坛数据分析。论坛为用户提供了相同的业余爱好,互动和交流的广阔平台,以及由此产生的庞大数据和复杂的用户交互场景也包含有价值的信息,本文关于虎扑论坛的帖子,个人信息分析,探讨虎扑论坛的用户是什么是什么特点?除了交易部分,[Pedestrian]和[NBA]是虎扑最活跃的部分,[NBA论坛]主题一般围绕比赛开始,而[行人]社会属性相对较强,...
r语言绘制动态统计图:绘制世界各国的人均GDP,出生时的预期寿命和人口气泡图动画动态gif图原文链接:http://tecdat.cn/?p=7994 使用的数据。# load required packageslibrary(readr)library(ggplot2)library(gganimate)library(scales)library(dplyr)气泡图。我们制作了以下图表,显示了2016年世界各国的人均GDP,出生时的预期寿命和人口:另...
数据中的异常值可能会使预测失真并影响准确性,尤其是在回归模型中,如果您没有正确检测并处理它们,那么它们会影响精度为什么异常值检测很重要?为了更好地理解异常值的含义,我将比较具有和不具有异常值的汽车数据集的简单线性回归模型的拟合。检测异常值单变量方法。双变量方法。多变量模型方法。库克距离是一个关于给定回归模型计算的度量...
用R语言制作交互式图表和地图原文链接:http://tecdat.cn/?p=8032.使ggplot2图表成为交互式Plotly图表。# install and load plotly, load readr and dplyrinstall.packages("plotly")library(plotly)library(readr)library(dplyr)请注意,交互式ggplot版本未继承scale_color_brewer对静态ggplot图表中的图例中的项目进行排序的代码。...
R语言基于ARMA-GARCH过程的VaR拟合和预测。本文展示了如何基于基础ARMA-GARCH过程(当然这也涉及广义上的QRM)来拟合和预测风险价值(Value-at-Risk,VaR)。## Backtest VaR_0.99btest <- VaRTest(alpha,actual =X,VaR =VaR,conf.level =0.95)btest$expected.exceed# 0.99 * n## [1] 990btest$actual.exceed## [1] 988btest$uc.模拟路径,...
R语言用随机森林和文本挖掘提高航空公司客户满意度。鉴于我们在问题1中的结果,航空公司现在可能希望将其自身与其他航空公司以及整个行业进行比较,涵盖机舱服务,娱乐,食品和饮料,地面服务和座椅舒适度等变量。之前的问题旨在更好地了解航空公司客户对飞行体验(机舱服务,娱乐,食品和饮料,地面服务,座椅舒适度)五个具体方面的看法,但...
在这篇文章中,我将向你展示如何在R中进行层次聚类。什么是分层聚类?分层聚类是一种可供选择的方法,它可以自下而上地构建层次结构,并且不需要我们事先指定聚类的数量。让我们看看分层聚类算法可以做得多好。我们可以看到,这一次,该算法在聚类数据方面做得更好,只有6个数据点出错。内部颜色与外部颜色不匹配的所有点都是不正确聚类的点。
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright? 2005-2020 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部