GCLUTO_Data_Analysis_Tool

统计分析 14

2.71MB 2024-10-31

#data_analysis # software_tools # big_data

FILES ----- README.txt help file doc/ directory containing documentation for gCLUTO images/ directory containing all images for gCLUTO linux/gcluto Linux binary matrices/ directory containing example matrices windows/gcluto.exe Microsoft Windows executable windows/glut32.dll GLUT Graphics Lib - required DLL for gcluto.exe windows/msvcrt.dll MS C Run Time Lib - required DLL for gcluto.exe

Repo Data Mining Nose Tool for Java SVN Repository Analysis

Nose是一种工具，用于检测Java SVN存储库中多个版本的臭味演变。它是一个Clojure程序，自动执行任务并将结果存储在无服务器数据库中供研究。您可以通过查看这个存储库与leiningen一起安装应用程序，或从该存储库下载最新版本的独立jar。使用java -jar启动。该应用程序具有三个子命令：db用于管理数据库，目前只接受子命令create，它在工作目录中创建一个名为smell_history.sqlite的数据库；analyse为一个项目运行inFusion，接受三个参数，首个为inFusionC可执行文件的位置。

数据挖掘 6 2024-10-31

Statistical Analysis Tool HLM Overview

HLM is a statistical analysis tool commonly used in fields such as sociology and psychology. Similar to Mplus, it is particularly effective for analyzing hierarchical data, which is frequent in social science research. HLM allows for the examination of multilevel data structures, enabling researcher

统计分析 4 2024-10-25

Data Clustering Analysis Techniques

数据聚类是数据分析和数据挖掘领域的一个核心概念，它涉及将相似的数据项目分组在一起的过程，基于项目之间的相似度或差异度的度量。聚类分析对于探索性数据分析非常有用，可以帮助生成对数据的假设。数据聚类的过程可以被分为多个阶段，包括数据准备和属性选择、相似度度量选择、算法和参数选择、聚类分析以及结果验证。在数据准备和属性选择阶段，需要对数据进行清洗、转换，并从中选择对聚类分析有意义的属性。例如，通过标准化处理大型特征，可以减少偏见。特征选择是将选定的特征存储在向量中，以便用作相似度或差异度的度量。特征向量可以包含连续值或二进制值，例如在某些情况下，品牌、类型、尺寸范围、宽度、重量和价格可以构成特征向

算法与数据结构 6 2024-10-31

Sentiment Analysis in Data Mining

情感分析在数据挖掘中的应用概述随着互联网的快速发展和社交媒体平台的普及，人们越来越依赖于在线评论、博客和新闻来获取产品和服务的信息。因此，情感分析作为一项重要的数据挖掘技术，能够帮助企业和个人理解用户对特定产品、服务或事件的情感倾向，对于市场营销、品牌管理及客户服务等方面具有重要意义。情感计算的基本概念情感计算（Affective Computing）是一种利用计算机技术自动分析文本、图像或视音频等媒介中所蕴含的情感倾向及其强度的技术。其主要目标是识别和处理人类情绪信息。情感计算可以分为两个主要方面：- 主观性（Subjectivity）：指的是文本或信息的主观程度，通常分为三种类

数据挖掘 3 2024-10-31

Crowdsourcing Salary Data Analysis Dataset

本数据集目前包含约 35,000行和 10列，适用于行业薪酬分析。数据集介绍该工资数据源于 AskAManager，通过众包形式收集。用户可在Google表单上提交个人薪资数据，生成此Google电子表格数据。数据内容此数据集包含以下10列：- 时间戳记- 你几岁？- 从事的行业- 职称- 年薪- 货币类型- 所在地（城市/州/国家）- 大学后工作经验- 其他职位描述- 其他货币类型数据特点由于是众包数据，存在一定噪音，但对Kaggle用户的分析需求仍具备参考价值。若该数据集热度上升，将考虑自动提取最新提交的数据以保持更新。

统计分析 9 2024-10-28

dbsync2_oracle_data_sync_tool

数据同步工具是针对ORACLE数据表之间数据同步而开发的一款软件。该工具具有以下特性： 1) ORACLE表之间数据的同步或增量同步功能; 2) 数据同步以任务的方式定义（新增任务，删除任务，修改任务）； 3) 同步任务的调度（立即执行，定时，或以固定时间间隔方式执行）； 4) 每天执行结果的报告，也可以以实时的方式进行报表的查看； 5) 数据安全性（以事务的方式处理每一个同步任务）； 6) 同步任务的导入导出功能； 7) 以工作流的方式实现数据的同步（暂时未实现）； 8) 支持常用的数据库记录操作（添加记录，修改记录，删除记录，执行存储过程）。

Oracle 4 2024-11-03

Big Data Analysis of MR and Signaling Data in LTE Networks

在当前的大数据时代背景下，LTE网络的发展带来了大量的数据，为网络分析提供了全新的机遇和挑战。详细介绍了如何运用MR（测量报告）数据和信令数据进行联合分析，以解决网络用户投诉、优化网络性能等问题。 MR数据是TD-LTE系统输出的一部分，包含了三个主要部分：MRs、MRE（事件性测量统计）和MRo（原始测量统计）。MRo文件中包含了每个用户每个周期性测量事件的原始统计信息，是定位过程中使用的重点数据。信令数据通过s1接口进行分析，提供了用户事件等信息的参考，尤其是在用户级信令统计方面。联合分析中，MR数据用于定位计算，信令数据提供详细的用户事件信息，两者结合将数据视角从小区扩展到具体地理位置

算法与数据结构 6 2024-10-31

Data Mining Decision Tree Techniques for Performance Analysis

该论文具体阐述了数据挖掘中的决策树算法在成绩分析中的应用，帮助观察成绩的总体情况以及成绩的分类等。

数据挖掘 6 2024-10-31

IEEG_Data_Analysis_with_Matlab_Code.zip

使用分散的数据点来插入头部图像的像素值。此函数使用GRIDDATA从头部图像上的散点插入像素值。参考图像可用于从10/20国际系统（脑电图电极位置）中交互式选择点位置。插值选项包括线性、三次和最近。输入是对应于每个选定位置的值。包括示例。

Matlab 7 2024-11-03