在Excel催化剂的努力探索下高德地图poi采集爬虫,现已实现标准的中国地图省市区县的地图数据包制作高德地图poi采集爬虫,并同时也找到了世界地图的国家地图数据包(可到类似中国地图的省级别)和世界地图的三级地图数据包(可到类似中国地图市级别)。

接着在贝壳网上高德地图poi采集爬虫,找到了近百个中国房地产热门城市的街镇级别颗粒度的地图数据并采集加工成地图数据包供使用。

现还未到尽头,再次发力,找到了高德地图上的POI兴趣点(如医院、学校、小区、公园等)的轮廓线,可制作POI级别的地图数据包。

POI兴趣点地图来源

只要是标准的POI搜索,就可以在高德地图上清晰地出现其轮廓线,此轮廓线就是我们接下来制作地图数据包的源材料。

经过不懈努力,找到了更精准的数据网址,从https://www.amap.com/place/B00140TVEV打开,网页加载过程中会在后台加载真正的json数据包网址https://www.amap.com/detail/get/detail?id=B00140TVEV。最终轮廓线信息就保存在这个json文件里。

在以下这个shape属性下,终于可以拿到这个轮廓线

但B00140TVEV代表华南农业大学,是从哪而知的高德地图poi采集爬虫?此处用到Excel催化剂过往的地图数据掘宝之POI搜索功能,例如搜索广州大学信息,就可得到以下结果表。

万事俱备,原理全型懂了,就该发力自动力采集啦,当然此处使用Excel催化剂网页采集功能,新修复了可越过反爬虫检测到是机器采集,速度调慢点,应该可以到手的。

具体可参考本文高德地图poi采集爬虫

采集到手的json文件,并非最终可用的geojson的地图数据包格式,需转换,先转Excel表格,直观配置所需信息。

再转成geojson格式的地图数据包,可以完美用于地图可视化

通过EasyShu,已经完美在Excel上开始地图可视化了。

上图中,因各POI太分散,以至于整个画布范围内,很难看清各轮廓线的大小及颜色。

后续功能探索

从上述所提到的效果,已经顺利将POI的轮廓线采集到手,并转换为geojson地图数据包,在EasyShu里用可视化的方式呈现了。

还有其他工作,可让其效果更完美和实用。

各POI间空白距离拉近,让可视化效果更佳

此时规划使用local space viewer(简称LSV)实现,在Excel上初步缩减各轮廓线经纬度距离,再结合LSV可视化呈现轮廓线在地球上,再自行微调至合适的位置。

自定义轮廓线,用于非标准地图元素

当前所有完成的地图轮廓线信息,都是基于标准地图或接口完成,但大量的未标准化的数据如局部乡镇的地图轮廓。大量工作在基层的人员非常大的刚需。此时仍然使用LSV可视化交互式完成。

各地图数据文件格式转换

LSV是采用谷歌地球的kml文件格式,而我们ECharts可视化时使用geojson格式,同时最佳的数据处理、整理是在Excel环境中,所以需要将此几类格式进行互转,最终实现的效果是中LSV上交互方式绘制好轮廓线,转换回Excel环境 ,再处理一些属性信息,再转换为geojson供ECharts使用。或从高德采集到的POI轮廓线,转换为Excel,再调整下轮廓线经纬度(会失真于真实的地理位置,但用于可视化还是可行的各轮廓线间空白间隔变小,可呈现更大的有内容的区域可视化),在LSV可视化微调完成,再最终转换为geojson格式供供ECharts使用。

各地图坐标系转换

由于高德地图采用火星系坐标,LSV采用GPS国际坐标,或许后续还有些百度地图的坐标系也参与进来,这几大的坐标系的转换,也是需要解决,不依赖于接口服务,离线处理,精确度虽然可能有些许问题,但对于可视化来说,足够胜任。

其他地图使用

除了分级填色地图的应用,还有散点地图、气泡地图、热力地图,也是可以从上述的地图数据包中受益,后续也会进行集成。

开发进行时

好消息的是,以上的系列功能,均已经在紧锣密鼓地开发中,过几天就可以和大家见面,做如此多的事情,只为让大家有一个共识,地图类数据可视化,在Excel催化剂和EasyShu上,可以找到最完美答案,无需再苦苦寻找了,我们做的比你想要的更多、更全。

为了Excel催化剂和EasyShu更好地发展下去,请多多参与,一起传播出去,让更多人能够得到这些好资讯,少被收割各样的地图智商税。


高德地图poi采集爬虫_高德地图怎么爬  第1张

微信号:565859400
添加上方技术, 在线咨询
复制微信号