大家好久不见,我终于终于过完春节有空写写东西来刷一下存在感了。
今天这篇呢,严格来说并不是文章,而是一份数据共享的说明书,用于说明下文所共享数据的类别与用途。做这件事情的起因是我最近在整理电脑里的各类数据,最后发现自己手头上有的东西还不少,所以把其中可以公开分享的部分整理出来,共享出来给大家下载。当然,由于不少数据是保密数据,还有一些数据的知识产权是其他朋友的,不便于公开,因此这个数据包的数据都是公开数据和我自己制作的数据,是一些比较常用的数据。如果大家有其他需求可以私聊我,同时也欢迎有分享精神的同学一起完善数据包,把共享数据这件事情坚持下去。
本文将会从以下几部分来进行说明:
数据共享包概述
数据包内容介绍
未来更新的内容
———我是分割线————
那么接下来进入正文啦
1.数据共享包概述
数据包内容是我在这几年学习生活中所用到的一些数据、实用书籍、小工具。数据板块主要是以矢量数据为主,以及少数环境气象数据和统计年鉴数据。实用书籍包括arcgis系列的几个常用软件学习的书籍、matlab学习的书籍。小工具则包括自然语言处理的词频语义分析、坐标拾取工具。
数据获取方式为,登录百度网盘,账号zaqqq321,密码scnufenxiang。
(ps:本来我想着分享下载链接出来就算了,没想到现在百度网盘审核这么严格,什么都通过不了,只能整个网盘都公布出来了。大家自觉按需下载数据,也可以自己上传有用的数据到网盘,大家一起维护才能把这个共享计划推进下去哈哈)
2.数据包内容介绍
2.1数据
2.1.1中国基础地理数据
第一部分是中国的行政区划(国、省、县)、以及九段线、南海诸岛这些容易被遗忘的,但却非常重要的数据。
第二部分是国家基础地理信息系统数据,包括一级到五级的河流,主要公路、主要铁路。
2.1.2世界基础地理数据
世界基础地理数据包括国家界限、城市、主要河流、主要湖泊。值得注意的是,非常多国外所制作的地图将西藏部分地区划为印度所有,本地图已纠正,但网上很多数据并没有纠正,这点需要大家注意。
2.1.3 广州POI点数据集
这个数据集是本数据包最重要、也最有用的数据。本数据是广州市POI点数据,基本上平常我们用得上的数据都有,质量相当不错。数据来源为腾讯地图API,数据的坐标经过纠偏,全部数据均已转为shp矢量数据。需要强调的是,以下数据均不能用于商业用途,只能用于科研用途。该POI数据集包括以下数据:
①美食(中餐厅、日韩菜、西餐、烧烤、火锅、海鲜、素食、清真、自助餐、面包甜点、冷饮店、小吃快餐)
②购物(综合商场、便利店、超市、数码家电、花鸟鱼虫、家具家居建材、农贸市场、小商品市场、旧货市场、体育户外、服饰鞋包、图书音像、眼镜店、母婴儿童、珠宝饰品、化妆品、礼、摄影器材、拍卖典当行、古玩字画、自行车专卖、烟酒专卖、文化用品)
③生活服务(旅行社、票务代售、邮局速递、通讯服务、报刊亭、自来水营业厅、电力营业厅、摄影冲印、洗衣店、招聘求职、彩票、家政、中介机构、宠物服务、废品收购站、福利院养老院、美容美发)
④娱乐休闲(洗浴推拿足疗、KTV、酒吧、咖啡厅、夜总会、电影院、剧场音乐厅、度假疗养、户外活动、游戏棋牌、网吧)
⑤汽车(加油站、停车场、汽车销售、汽车维修、摩托车、汽车养护、洗车场、驾校、汽车俱乐部、、车辆管理机构、二手车交易市场、其它汽车)
⑥医疗保健(综合医院、诊所、急救中心、药房药店)
⑦酒店宾馆(酒店宾馆、星级酒店、经济型酒店、旅馆招待所、青年旅社)
⑧旅游景点
⑨文化场馆(博物馆、展览馆、科技馆、图书馆、美术馆、会展中心)
⑩教育学校(大学、中学、小学、幼儿园、培训、职业技术学校、成人教育)
⑪银行金融(银行、自动提款机、保险公司、证券公司)
⑫基础设施(交通设施(包括公交车站、地铁站、火车站、长途汽车站)、公共设施、道路附属、其它基础设施)
⑬房产小区(住宅区、商务楼宇、产业园区)
⑭运动健身(足球场、综合体育场馆、羽毛球馆、瑜伽、游泳馆、舞蹈、网球场、跆拳道、台球馆、其它运动健身、乒乓球馆、溜冰、篮球场、健身中心、壁球场、保龄球馆、高尔夫场)
⑮机构团体(政府机关、文艺团体、社会团体、科研机构、公检法机构、工商税务机构、传媒机构、其他机构团体)
⑯地名地址
⑰公司企业
部分数据截图如下,大部分数据已经从一级分类拆开,命名为 《一级分类:二级分类》,具体分类表可以参考文件夹中《分类标准.xls》这个表格。
举个例子,以房产小区为例,每种数据均包含经度、纬度、名称、精确地址、电话、类别六个字段集。
最后,大家下载的时候,记得每个矢量数据是由7个同名文件构成的,要下载完整的shp数据需要下载7个文件。
2.1.4 城市级统计年鉴
本类别主要是城市的统计年鉴百度拾取坐标系统,从1993年-2012年,但2012年之后的数据还没收集,接下来我会补上的。这份数据好处在于精确到每一个城市的多年数据,而且数据集很丰富。
2.1.5 广州市环境气象数据
这部分数据是广州市2014年7月-12月的气象环境数据,但这份数据好处在于,数据精确到每一个监测站的每小时数据,但可惜数据量较少。监测数据包括温度、风向、风力、降雨量、湿度、AQI、PM2.5、O3、PM10、SO2、NO2、CO。
2.2实用书籍
2.2.1ArcGIS各类应用书籍
① ArcGIS for desktop
这一部分的书籍是这本很经典的教程《ARCGIS地理信息系统空间分析实验教程》,想学习入门操作的同学,按着这本教程做一遍就能熟悉整个操作流程啦。
②ArcGIS Engine开发
这一部分的书籍是《ArcGIS Engine开发从入门到精通》以及源码,按照这本书学一遍,可以学到很多arcgis二次开发的知识。补一句,这本书使用的语言环境是C#,使用的版本是arcgis9.3。
③Arcgis for python(arcpy)
python在arcgis里面主要用于编写批量处理地理数据的脚本,学好Python,可以用短短几句语言代替人工几个小时重复的操作,大大提高了地理数据处理的效率。
这部分有两本书,一本书是《面向Arcgis的python脚本编程》,一本书是《面向设计师的编程设计知识系统PADKS ArcGIS下的Python编程》。第一本用于入门,第二本比较偏向于城市研究方面。
2.2.2 matlab各类书籍
matlab在数学建模、模型计算等等发挥着很重要的作用,在科研方面是必学的技能。本部分有三本书可供学习,分别是《MATLAB数学工具软件实例简明教程》《MATLAB在数学建模中的应用》《基于Matlab的地理数据分析》第一本用于语法入门,第二本用于深化学习,第三本用于地理数据的一些模型学习。
2.3 一些小工具
2.3.1 自然语言处理工具
自然语言处理可以对文本进行处理,如进行词频分析、情感情绪分析、词性分析等等,有在线与离线不同版本。
在线版本推荐(#box-1)离线版本推荐ROSTCM6(词频分析工具)。
2.3.2 文字地址与经纬度互相转换工具
我们进行研究的时候,时常需要文字的地址转换为经纬度地址,或有经纬度地址想找到文字地址,那么这两个工具就可以派上用场了。
在线版本推荐百度地图坐标拾取系统(api.map.baidu.com/lbsapi/getpoint/index.html)离线版本推荐XGeocoding_v2这个软件包百度拾取坐标系统,这个软件可以批量转换坐标,但是有些地址查出来有一些误差。
3.未来更新的内容
本数据包的共享还处于初步建设阶段,未来将会继续更新,但一个人的力量毕竟是有限的,配置再牛的笔记本也只是一台笔记本电脑而已,希望未来能有更多的同学加入共享计划,共享,才能共赢。同样的,由于能力有限,因此未来会更新的内容也将主要集中于矢量数据方面,希望自己未来可以延续以下工作:
①添加更多城市的POI数据
②增加土地利用数据
③增加建筑物数据以及楼层信息
④增加更多城市房价数据以及更新
最后!
数据只可用于科研教学用途
数据只可用于科研教学用途
数据只可用于科研教学用途
不然
欢迎转发与指出错误,使用数据时建议注明数据来源^_^
THE END
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: muyang-0410