首页 > 范文大全 > 正文

移动数据:电话公司的金矿

开篇:润墨网以专业的文秘视角,为您筛选了一篇移动数据:电话公司的金矿范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

我们日常生活使用手机的活动数据吸引了该行业研究人员和学术界研究人员的兴趣。移动电话公司发现,他们正坐在一个金矿之上,这座金矿就是用户的通话记录。在移动行业日益增多的学术界研究人员,正在处理显示电话和短信时间、地点的大型数据库,这些信息透露出人们的生活习惯,为公众活动出行的频率,甚至还能反映出重大的社会趋势。

随着从城市规划到市场营销方面的应用软件的普及,这种研究也可以为移动电话公司提供一个新的收入来源。新泽西州AT&T公司的研究实验室首席研究员拉蒙・卡塞雷斯(RamenCtceres)说“由于手机已经非常普及,挖掘它们的数据能为人类行为研究带来真正革命性的意义。”

如果你是AT&T的用户,并且去年3月15日和5月15日出现在洛杉矶和纽约之间,你的数据有百分之五的机会被卡塞雷斯和他的同事们用于本公司的用户出行习惯的研究。研究人员在891邮政编码区从数十万用户中积累了数以百万计的通话记录,覆盖纽约的每一个市镇,新泽西州10个县,以及洛杉矶,奥兰治,和加利福尼亚州的文图拉县。

这些数据集有详细的呼叫记录或CDR(采集手机数据源标准)。每一个通话语音或短信通讯都生能生成CDR。在手机通话的时候,它能够显示出呼叫方和被叫方的号码,类型和通话持续的时间,最重要的是,它能显示手机所连接的发射塔的独立的ID。

每一个CDR生成的时候,AT&T公司的工作人员就会知道呼叫电话所在的半径一英里的位置,从而能够确定每个手机每天的出行离家的距离。该小组发现,平均来说曼哈顿的人们大部分时间生活在2.5英里的范围内,而洛杉矶的人则生活在5英里的范围内。“但我们也发现,看看那些出门最远的人,纽约人范围更远,69英里,而洛杉矶人只有29英里。”卡塞雷斯说。

卡塞雷斯希望与城市规划师合作,他们不得不采取昂贵和有限的统计调查来搜集有关资料。“如果他们想知道在哪里可以建一个新的火车站或地铁站,这种类型的数据可以帮助他们决定如何投入资源。”卡塞雷斯说。

现在,卡塞雷斯的小组正在寻求合作而不是商业化。但是,手机网络正在思考把他们的数据转化成收益,网络运营商Sprint的研究员让・伯罗特(JeanBolot)这样说。这意味着一个“双面”的经营模式,他们不仅为终端用户提供服务,而且也通过与其他企业的关系赚取利润。“在电信领域,这是一个新的现象。但在其他领域已有先例,比如Googlc。”他说。

因为几乎每个人都有手机,数据的规模巨大,是其他来源所无法比拟的。移动模式,“几乎所有在这个星球上的商人现在已经在考虑这个了。”让・伯罗特说。

另一项研究由麻省理工学院的研究科学家弗朗西斯科・卡拉布雷斯(FrancescoCalabrese)和同事提出,从大波士顿约一百万部手机相关位置的追踪得出了一些公共活动(如棒球赛)的列表,显示人们是怎样前往参加这些活动的。“我们可以部分的预测准备参加未来活动的人们都来自什么地方。”该小组的一份工作报告有这样的话,这说明将来有可能为特别活动提供准确的交通预报。

由于有了有效处理大型网络的新算法,这一领域的研究有了长足的发展。布鲁塞尔鲁汶天主教大学应用数学教授文森特・布隆德尔(VincentBlondel)这样说。

布隆德尔的研究包括了对两百万比利时手机用户之间的连接进行分析。这项分析研究反映出,该国说法语和说荷兰语的人口几乎没有电话和短信联系。“这很有趣,因为已经有人讨论比利时分裂为两个国家的问题。”布隆德尔说。

在这方面的研究通常关注的是群体信息,而不是个人信息。但是如何保护用户隐私的问题仍然存在。在进行研究的时候,从CDR中去掉用户姓名和号码是一个标准做法,但是,地点和通话时间,再加上其他数据库还是可以帮助识别出用户的个人信息。而在麻省理工学院的研究团队可以通过确定晚上10点到上午7点通话出现最多的位置而推断出该用户最可能的家庭住址。

“我认为,如何在收集有用的数据和保护隐私之间取得平衡,这是科学界应该负起的责任。”布隆德尔说。他正在研究使用模糊数据技术的效果,而不是来自数据库的精确的位置信息或者通话的具体时间信息。