标题“全国天气信息.zip”指出这是一个压缩文件,内含2020年1-3月的中国各地气象数据。数据量超过20万条,涵盖风向、空气质量等多维天气信息,并计划后续更新。压缩包包含“城市天气信息.sql”和“全国城市天气信息.xlsx”两个文件,分别提供SQL数据库格式和Excel表格格式,方便数据分析与处理。
2020年1-3月全国天气数据集下载
相关推荐
南京机场天气数据挖掘资源集
这是一份包含南京机场过去四年天气详细数据的数据挖掘数据集,适用于微软商业解决方案。
SQLServer
0
2024-08-18
爬虫获取近五年天气数据
获取近五年天气数据
数据挖掘
6
2024-05-13
信息增益计算示例:以天气数据集为例
信息增益计算示例:以天气数据集为例
本示例使用天气数据集 weather,目标是计算使用属性“wind”(风力)划分数据集 S 所获得的信息增益。
数据集 S:
| outlook | temperature | humidity | wind | play ball ||---|---|---|---|---|| sunny | hot | high | weak | no || sunny | hot | high | strong | no || overcast | hot | high | weak | yes || rain | mild | high | weak | yes || rain | cool | normal | strong | no || overcast | cool | normal | strong | yes || sunny | mild | high | weak | no || sunny | cool | normal | weak | yes || rain | mild | normal | weak | yes || sunny | mild | normal | strong | yes || overcast | mild | high | strong | yes || overcast | hot | normal | weak | yes || rain | mild | high | strong | no |
计算步骤:
计算数据集 S 的信息熵。
根据属性“wind”的取值将数据集 S 划分成子集。
分别计算每个子集的信息熵。
计算划分后子集信息熵的加权平均值。
信息增益 = 数据集 S 的信息熵 - 划分后子集信息熵的加权平均值。
具体计算过程:
(此处省略具体计算过程,建议参考信息熵和信息增益的计算公式进行计算。)
结果:
通过计算可以得到数据集 S 对属性“wind”的信息增益。
算法与数据结构
3
2024-05-23
2020年05月最新全国省市区整理
最新整理全国省市区数据,共4033条,编码对应微信省市code,例如:110000=>北京,110100=>北京市,110101=>东城区。数据更新内容包括:山东省增加莱芜区和钢城区。
MySQL
0
2024-09-26
2020年8月全国城市三级数据更新
最新发布的2020年8月全国城市数据库,包含GPS定位信息,中文拼音,以MySQL数据库导出的SQL文件,方便直接导入使用。
MySQL
2
2024-07-19
全国地铁站地理坐标数据分享(2020年5月)
数据来源:高德地图API
时间:2020年5月
范围:全国(除重庆保税港区)
数据格式:包含地铁站名称、经纬度等信息
数据质量:经过逐城市核对,确保准确性
备注:由于高德地图未提供重庆保税港区的编码,该区域数据暂时缺失。
算法与数据结构
4
2024-04-30
2020年1月7日的广义回归网络算法
这是一个在Matlab上编写的广义回归网络算法,可以直接运行。附带数据集,如有疑问请留言交流。
Matlab
0
2024-09-27
南昌市2017至2019年天气数据一览
此文件包含江西省南昌市2017-2019年各日的天气信息,数据包括日期、最高温、最低温、天气状况以及风向风速等基础信息。文件适合有需求的用户下载,便于进一步研究和使用。
spark
0
2024-10-30
数据分析与R语言教程1-3
从入门到精通,通过案例深入学习数据挖掘与R语言。
数据挖掘
0
2024-05-26