首页 > 范文大全 > 正文

数据科学家技术和业务要兼通

开篇:润墨网以专业的文秘视角,为您筛选了一篇数据科学家技术和业务要兼通范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

企业需要的是可以立足现状,既具前瞻性又具实干能力的数据科学家,而不是言必称云、言必称大数据的概念炒作者。大数据是个笼统的概念,而熟知其涉及到的各类专业技能,如文本分析、语音识别等的人才,恐怕才是企业真正所需。

数据科学家主要从事数据分析工作,从海量数据中挖掘有价值的信息。如果一个项目只是侧重数据的获取与存储,那么可能需要的是熟悉平台架构的数据库工程师或架构师;如果项目侧重数据分析,那么数据科学家就是必需的。

技术与业务相结合

文思海辉金融事业群商业智能事业部解决方案高级经理马宁认为,数据科学家对数据的分析可划分为两大类:探索型和预测型。探索型旨在寻求复杂数据的内部结构,典型应用如著名的沃尔玛超市“啤酒与尿布”的案例。预测型旨在利用历史数据预测未来,典型应用如银行定量判断一个信用卡客户潜在的违约可能性。

马宁将一个数据科学家需要具备的基本的素质和能力归纳为以下四点:第一,数据科学家应具有数据加工处理的能力,熟悉关系型数据库的SQL语言;第二,数据科学家应具有统计建模的能力,熟悉SAS、SPSS、R这样的统计软件;数据科学家至少应该熟悉某一领域的业务知识,如银行、证券、电商、医疗等;第四,数据科学家应具备将统计模型的结果用业务熟知的语言来表述,或利用可视化技术将复杂结果做清晰展现的能力。

马宁本科学的是数学专业,硕博连读期间从事的是医疗数据分析,工作后则主要从事金融行业的数据分析。“在公司中,我的工作是为金融领域的客户提供数据分析与挖掘解决方案,主要涵盖客户智能与风险管理两大领域:前者旨在帮助金融机构更好地了解其客户,提供基于客户生命周期的有针对性的服务策略,后者旨在帮助金融机构防范信用、流动性和市场风险,提供反洗钱、反欺诈的侦测。”马宁介绍说。

在不同类型的企业中,数据科学家的具体工作内容也会有差异。比如,文思海辉作为全球领先的服务提供商,承接了不同行业的开发项目,其数据科学家团队必须熟悉多个领域的业务。“我们面对的主要是金融业的客户,因此我们的数据科学家团队必须熟知银行、证券、保险领域的业务需求,但在一般的商业企业中,其数据科学家只需要熟悉该企业自身的业务即可。”马宁表示。

大数据的概念近两年非常火,但软硬件厂商以及服务提供商目前在这个领域还处于摸索阶段,在国内甚至国际上真正能落地的大数据项目并不多。需要说明的是,大数据并不是产生数据科学家的必要前提,尽管两者存在着千丝万缕的联系。数据科学家在传统的结构化数据领域一样可以大展拳脚,国内外的无数案例证明了这一点。不过,马宁指出,相对于传统数据,大数据对数据科学家提出了更高的要求,例如将非结构化数据转换为结构化数据的能力,以及利用Hadoop这样的分布式架构实现快速海量数据分析的能力等。

任何一个新兴领域的概念基本都会经历提出、发展、泡沫、泡沫破灭、价值回归、成熟的周期。马宁认为,数据科学家正处在发展阶段,并不是噱头,但已经显露出一些泡沫的端倪。未来泡沫的破灭并不意味着数据科学家的消亡,反而是它走向成熟的必由之路。

一个人难以精通数据业务的方方面面。因此,马宁更建议企业成立一个数据科学团队,团队内的每个人都专注于自身擅长的领域。文思海辉正在这条路上探索前进。中国的数据科学家阶层已经初步形成,并伴随着大数据等新技术的发展不断成长壮大。马宁认为,数据科学家更侧重数据分析与挖掘,其来源主要是数据分析师(在某些语境下二者就是同一概念),而不太可能是数据库工程师。某些企业将来会为数据科学团队设立单独的CDO(Chief Data Officer)职位。