首页 > 范文大全 > 正文

大陆城市“数字沙漠”调查

开篇:润墨网以专业的文秘视角,为您筛选了一篇大陆城市“数字沙漠”调查范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

“今天的天蓝得好舒服!我在王府井”。这是一条带有地理位置的普通微博,人们对此早已司空见惯,根据新浪微博公布的数据,共有4.3万人在“王府井”签到过,相伴这些签到的,是6.8万条“热议”、4.4万张“热图”。对于这类热门地点,微博把一切相关内容都称为“热”真是一点问题也没有,但同样在北京市区,也有一些地点,方圆一公里也只有一两个人签到,甚至干脆一个也没有,它们是被互联网遗忘的角落――中国城市的“数字沙漠”。

北京市城市规划设计研究院高级工程师龙瀛和香港中文大学的周钰伦等学者在构建他们的城市数据共享平台“徐霞客计划”(SinoGrid)时,注意到这些散布在大数据城市地图边缘的数字沙漠,于是将它们纳入了研究。经他们计算后发现,数字沙漠在中国城市的分布并不均匀,它在大城市和经济发达的城市出现几率较低,而在中小城市和经济落后的城市出现几率较高。然而,经济发展程度并不是数字沙漠的唯一解释,部分扩张策略冒进的城市,同样也是数字沙漠的高发地。

什么是数字沙漠

数字沙漠研究以新浪微博、Flickr这两个社交/共享网站的数据为基准,如果一个面积为1平方公里(仅指城镇建设用地)的地理格子内曾经发出的信息总和少于6个,则把它视为一块“数字沙漠”。研究所用的格子,由“徐霞客计划”的电子地图划定;而将海量信息定位到这些格子里的根据,则是千千万万用户自行生成上传的“地理大数据”。

“大数据”的概念听上去玄乎,然而事实上每个网民都是它的贡献者。享用美食之前,要先拍照上传社交网络;路遇美丽的风景,立即拍摄并传到自己的相册……当人们做这些稀松平常的事情时,他们就为互联网大数据贡献了一份内容。原始的大数据其实就是这一大堆杂乱无章的信息,经科学家用特别的规则和算法过滤后,某种广泛存在的现象或规律可能从中浮出水面。意外发现的惊喜和发现背后的巨大商业价值,始终吸引着为数众多的学者投入大数据研究。

城市规划学者感兴趣的,是那些带有地理位置的大数据:微博签到、Flickr上标示地理位置的项目、foursquare记录的用户足迹……一位已经做了几年大数据的规划学者总结它的价值说:“大数据意味着不用一点一地的走访调查,千千万万‘志愿者’就已经把不可胜数的信息放置在了一张大的电子地图上。而且它是全样本的数据,不会因采样调查操作者的意愿而被扭曲。”

目前,该领域的研究已经取得了不少成果。例如,考察一个地点发出微博的时间,能清晰地分辨出“睡城”和就业中心的边界,前者的微博多发在晚上,而后者多发在白天。考察旅游景点上传照片的手机型号,研究者们发现安卓用户的旅游目的地比较传统,他们在北京多选择故宫、天坛等去处;而苹果用户则更为青睐798、杜莎夫人蜡像馆等新兴景点。

“徐霞客计划”也是关注地理大数据中的一分子,但这个平台的宗旨并不完全为大数据挖掘服务,它是一个希望囊括尽量多种数据到同一个地理视角框架的城市数据共享平台。其设计思路是把中国各个城市的地图划分为1平方公里大小的网格,方便数据提供者把数据填入它们所属的格子。计划所涉的,既包括植被面积这样的环境数据,也包括GDP、人口这样的社会数据;既包括交通路口数、公共设施数这类传统数据,也包括flickr上传照片数、微博签到数这类大数据。也就是说,计划想要给每一个格子都填上尽可能丰富的侧面信息。正是在这个填格子的过程中,数字沙漠显露了出来――几乎没有社交网络数据在格子中出现。

北方省份数字沙漠比例高

数字沙漠的分布是不均匀的,它在中国一些城市占据了一半的市区面积,在另一些城市,它所占比例(数字沙漠总面积/城镇建设用地总面积)微乎其微。按照数字沙漠的占地比例给中国城市排名,占地比最高的城市集中在东北和西北,而占地比最低的城市全部是大城市或一个地区最重要的城市(注:中国还有几十个城市没有发现数字沙漠,其中包括长沙、合肥等省会城市,但本文的城市比较只针对存在数字沙漠的城市)。

无论作为城市与全国地级以上城市(包括地级市)比较(仅考虑市辖区范围内的城镇建设用地),还是作为直辖市与全国省级行政区比较(考虑整个省级单位的城镇建设用地范围),上海都是中国数字沙漠比例最小的城市。数字沙漠在上海所占的比例,甚至比以人多地少闻名的香港还要低(这可能部分由于新浪微博在香港普及率较内地低有关)。

紧随上海之后,数字沙漠比例最低的另外8个城市要么是一省省会,要么是副省级城市。比例第10低的温州是top10中的唯一例外,自然,这座以商业闻名、市区常住人口超过300万的城市应该被视为大城市。然而,若是反过来,要说省会、大城市必然数字沙漠比例低却并不正确。乌鲁木齐的数字沙漠比例就高达29%,算得上数字沙漠问题比较严重的城市了。

在省级行政区方面,数字沙漠比例低的有浙江、广东这些富裕省份,也有四川、贵州这些经济并不发达的西部省份,规律不算明显。但数字沙漠比例高的,则几乎清一色的都是中国北方省份。

这个分布规律看城市的排名更加明显。全国数字沙漠比例最高的15个城市,东北有8个,西北有4个,前五名全部是东北城市。而数字沙漠比例超过40%的城市,只有一个山东临沂不属于东北和西北。

数字沙漠推算出“鬼城”

数字沙漠是大数据无法揭示其面目的阴霾地带,是被互联网遗忘的城市角落。不过,没有大数据本身就是一个重要信息,它的背后隐藏着值得去关注的原因。

“我们研究数字沙漠的初衷是要看大数据在空间维度的偏差,这段时间我也开始思考它的成因。”“徐霞客计划”的发起人龙瀛如是说,他也是计划所依托的城市量化研究组织北京城市实验室的负责人。

对于数字沙漠的成因,龙瀛认为有两种比较合理的解释:一种是当地经济发展程度低,信息通讯技术渗透率低,包括手机在某些区域无法上网,也包括当地市民的互联网意识有限,很少使用定位功能。另一种是城市扩张造成的乏人问津地带,如果城市扩张得异常冒进,形成了大片鬼城,那它一定会显示为大片的数字沙漠。

经济发展程度的差别能解释上海、浙江、广东等省市的数字沙漠低比例,但它不能解释数字沙漠比例在南北城市的巨大差异。打开单个城市数字沙漠的分布图,往往会发现数字沙漠都出现在城市的地区。这些地区多是新扩张、规划的,暂时显示为数字沙漠,未来,这些沙漠有可能“绿化”,但要是等待“绿化”的沙漠比例过高,那个城市的鲜有人居住的“鬼城”问题恐怕就已经很严重了。

今年3月,经济研究人员陈勤根据一个城市未来的房屋供需比例,以及它现有的住宅数目两个指标,推算了全国最容易演变出“鬼城”的城市。他的推算结果跟数字沙漠比例的排名不谋而合:东北是“鬼城”重灾区。

黑龙江东部的七台河市被陈勤的演算纳入了“鬼城”行列。一时间,这条新闻引发了百度七台河贴吧热议。当地人都觉得这个结果完全符合他们的意料,还有人回复道出原因:“大街上除了学生,你还能看到几个年轻人?”在数字沙漠比例的排名中,七台河是全国最高的一个城市,它是唯一一个数字沙漠比例高于60%的城市,达到了74.5%,即每4平方公里只有1平方公里为大数据?覆盖。