当前位置:首页 » 网络资讯 » 怎样做大数据人才
扩展阅读
视频可以转自己的原创吗 2025-09-19 22:48:22

怎样做大数据人才

发布时间: 2022-02-25 21:21:34

A. 怎样成为大数据人才

优秀的人才是成事的根本。当开始真正做事的时候,人们会发现:优秀的人才是短缺的。于是,竞争的高端变成了人才的竞争。对于大数据这样新兴的发展方向来说,更是如此。大数据的热头,今年虽然有被人工智能和虚拟现实掩盖的趋势,但其势头依然火热。而且更是超越了初始的噱头,走向广泛的工业实施。在今年的中国大数据产业峰会上,清华大学计算机系教授武永卫透露:未来3~5年,中国需要180万数据人才,但目前只有约30万人。IDC估计,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。广义来说,在数据采集、数据存储、数据挖掘、数据分析等方向,所需要的人才数量将更为巨大。
大数据的人才哪里来呢?
大数据是个应用性很强的行业。某些传统企业,他有大数据,却让数据睡大觉而不产生价值。而政府部门有数据,却把数据紧紧攥在自己手里,条块分割,无法被人利用。真正实践大数据的是一批用户量巨大的互联网企业。它们有能力收集到足够多的数据,分析所收集到的数据,从数据中挖掘出价值并且产生收益。实践出真知。这些企业拥有大数据的人才,也具有培养大数据人才的基本条件。他们应该成为培养大数据人才的黄埔军校。
企业的核心目标是要实现其商业价值,他们的主要精力是要贡献给核心目标。不过,作为行业的龙头企业,为这个行业的健康发展贡献力量是其社会责任。为社会培养人才,为企业储备力量,也是其应有的考虑。近年来很多互联网企业都不约而同地举办大数据分析竞赛。
从某些发达国家的经验来看,先进的企业与优秀的高校合作会带来意想不到的效果。高校拥有大量有潜力的学生,企业拥有行业发展前沿的课题和处理这些课题的物质条件,两相结合则推动了人才的培养和技术的发展。互联网企业拿出自己业务上的数据,提出分析的目标。而在高校中广泛征集分析方案,把自己的数据拿出来举行大数据分析竞赛。这不仅为在校的学生提供接触行业前沿问题的机会,也可以让学生通过实战来在战斗中成长。这不啻为一种培养高级人才的方式。
现在有一种风气,社会对某方面的人才有大量的需求,政府的关注、社会的舆论、培训机构的宣传、教育机构的躁动都蜂拥而至。大家都嗅到了发财的机会,市场看不见的手在这里发挥了显着的作用。从应急的角度,我们可以批量产生所需要的从业人员。不过,对于能够看清行业发展方向、推动行业技术进步、识别行业商业机遇的帅才,大规模集训是不起作用的。对于这些人才,我们更多的需要为他们创造宽松的机会,让他们能够脱颖而出,在他们成长路上做一个伯乐,而不是拿着鞭子在后面抽打。
大数据这个行当,当前虽然对其有很多期许,真正发挥了价值的方向还不多。按道理,我们这个社会进入了数字化时代,每天所产生的数据比这个时代来临之前所产生数据之和还多。处理这些数据理应有更大的价值,能够创造现在意想不到的机会。如果应用现有的技术和方法去处理现有的问题,我们需要的是按照一定方法和规程进行操作的人才。这样的人员需求,培训就可以解决。如果是要去发现大数据行当的新的应用需求,突破现有方法的限制寻找新的方法去解决问题,发掘这个社会数字化,甚至我们生活的物理世界数字化后更多的机会,所需要的人才就可遇不可求了。

B. 如何转型成为大数据工程师 需要具备哪些条件

大数据是眼下非常时髦的技术名词,与此同时自然也催生出了一些与大数据处理相关的职业,通过对数据的挖掘分析来影响企业的商业决策。
这群人在国外被叫做数据科学家(Data Scientist),这个头衔最早由D.J.Pati和Jeff Hammerbacher于2008年提出,他们后来分别成为了领英(LinkedIn)和Facebook数据科学团队的负责人。而数据科学家这个职位目前也已经在美国传统的电信、零售、金融、制造、物流、医疗、教育等行业里开始创造价值。
不过在国内,作为大数据人才培养基地,能更加清楚地了解现今的大数据行业情况,认为大数据的应用才刚刚萌芽,人才市场还不那么成熟,“你很难期望有一个全才来完成整个链条上的所有环节。更多公司会根据自己已有的资源和短板,招聘能和现有团队互补的人才。”领英(LinkedIn)中国商务分析及战略总监王昱尧对《第一财经周刊》说。
数据工程师是做什么的?
于是每家公司对大数据工作的要求不尽相同:有的强调数据库编程、有的突出应用数学和统计学知识、有的则要求有咨询公司或投行相关的经验、有些是希望能找到懂得产品和市场的应用型人才。正因为如此,很多公司会针对自己的业务类型和团队分工,给这群与大数据打交道的人一些新的头衔和定义:数据挖掘工程师、大数据专家、数据研究员、用户分析专家等都是经常在国内公司里出现的Title,我们将其统称为“大数据工程师”。
由于国内的大数据工作还处在一个有待开发的阶段,因此能从其中挖掘出多少价值完全取决于工程师的个人能力。已经身处这个行业的专家给出了一些人才需求的大体框架,包括要有计算机编码能力、数学及统计学相关背景,当然如果能对一些特定领域或行业有比较深入的了解,对于其快速判断并抓准关键因素则更有帮助。
虽然对于一些大公司来说,拥有硕博学历的公司人是比较好的选择,不过阿里巴巴集团研究员薛贵荣强调,学历并不是最主要的因素,能有大规模处理数据的经验并且有喜欢在数据海洋中寻宝的好奇心会更适合这个工作。
除此之外,一个优秀的大数据工程师要具备一定的逻辑分析能力,并能迅速定位某个商业问题的关键属性和决定因素。“他得知道什么是相关的,哪个是重要的,使用什么样的数据是最有价值的,如何快速找到每个业务最核心的需求。”联合国网络大数据联合实验室数据科学家沈志勇说。学习能力能帮助大数据工程师快速适应不同的项目,并在短时间内成为这个领域的数据专家;沟通能力则能让他们的工作开展地更顺利,因为大数据工程师的工作主要分为两种方式:由市场部驱动和由数据分析部门驱动,前者需要常常向产品经理了解开发需求,后者则需要找运营部了解数据模型实际转化的情况。
你可以将以上这些要求看做是成为大数据工程师的努力方向,这是一个很大的人才缺口。目前国内的大数据应用多集中在互联网领域,有超过56%的企业在筹备发展大数据研究,
因此分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。
1.找出过去事件的特征
大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。比如,腾讯的数据团队正在搭建一个数据仓库,把公司所有网络平台上数量庞大、不规整的数据信息进行梳理,总结出可供查询的特征,来支持公司各类业务对数据的需求,包括广告投放、游戏开发、社交网络等。
找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。“你可以知道他是什么样的人、他的年纪、兴趣爱好,是不是互联网付费用户、喜欢玩什么类型的游戏,平常喜欢在网上做什么事情。”腾讯云计算有限公司北京研发中心总经理郑立峰对《第一财经周刊》说。下一步到了业务层面,就可以针对各类人群推荐相关服务,比如手游,或是基于不同特征和需求衍生出新的业务模式,比如微信的电影票业务。
2.预测未来可能发生的事情
通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象数据来帮助淘宝卖家做生意。“比如今年夏天不热,很可能某些产品就没有去年畅销,除了空调、电扇,背心、游泳衣等都可能会受其影响。那么我们就会建立气象数据和销售数据之间的关系,找到与之相关的品类,提前警示卖家周转库存。”薛贵荣说。
以网络景点预测为例,大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测,并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里,它究竟是畅通、拥挤,还是一般拥挤?
3.找出最优化的结果
根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。
在过去,决策者只能依据经验进行判断,但如今大数据工程师可以通过大范围地实时测试—比如,在社交网络产品的例子中,让一半用户看到A界面,另一半使用B界面,观察统计一段时间内的点击率和转化率,以此帮助市场部做出最终选择。
作为电商的阿里巴巴,则希望通过大数据锁定精准的人群,帮助卖家做更好的营销。一个淘宝的实例是,某人参卖家原来推广的目标人群是产妇,但工程师通过挖掘数据之间的关联性后发现,针对孕妇群体投放的营销转化率更高。
需要具备的能力
1.数学及统计学相关的背景
就我们采访过的BAT三家互联网大公司来说,对于大数据工程师的要求都是希望是统计学和数学背景的硕士或博士学历。缺乏理论背景的数据工作者,更容易进入一个技能上的危险区域(Danger Zone)—一堆数字,按照不同的数据模型和算法总能捯饬出一些结果来,但如果你不知道那代表什么,就并不是真正有意义的结果,并且那样的结果还容易误导你。“只有具备一定的理论知识,才能理解模型、复用模型甚至创新模型,来解决实际问题。”沈志勇说。
2.计算机编码能力
实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素。
举例来说,现在人们在社交网络上所产生的许多记录都是非结构化的数据,如何从这些毫无头绪的文字、语音、图像甚至视频中攫取有意义的信息就需要大数据工程师亲自挖掘。即使在某些团队中,大数据工程师的职责以商业分析为主,但也要熟悉计算机处理大数据的方式。
3.对特定应用领域或行业的知识
大数据工程师这个角色很重要的一点是,不能脱离市场,因为大数据只有和特定领域的应用结合起来才能产生价值。所以,在某个或多个垂直行业的经历能为应聘者积累对行业的认知,对于之后成为大数据工程师有很大帮助,因此这也是应聘这个岗位时较有说服力的加分项。
职业发展
1.如何成为
由于目前大数据人才匮乏,对于公司来说,很难招聘到合适的人才—既要有高学历,同时最好还有大规模数据处理经验。因此很多企业会通过内部挖掘。
2014年8月,阿里巴巴举办了一个大数据竞赛,把天猫平台上的数据拿出来,去除敏感问题后,放到云计算平台上交予7000多支队伍进行比赛,比赛分为内部赛和外部赛。“通过这个方式来激励内部员工,同时也发现外部人才,让各行业的大数据工程师涌现出来。”
目前长期从事数据库管理、挖掘、编程工作的人,包括传统的量化分析师、Hadoop方面的工程师,以及任何在工作中需要通过数据来进行判断决策的管理者,比如某些领域的运营经理等,都可以尝试该职位,而各个领域的达人只要学会运用数据,也可以成为大数据工程师。
2.薪酬待遇
作为IT类职业中的“大熊猫”,大数据工程师的收入待遇可以说达到了同类的顶级,国内IT、通讯、行业招聘中,有10%都是和大数据相关的,且比例还在上升。颜莉萍(Nicole Yan)表示,“大数据时代的到来很突然,在国内发展势头激进,而人才却非常有限,现在完全是供不应求的状况。”在美国,大数据工程师平均每年薪酬高达17.5万美元,而据了解,在国内顶尖互联网类公司,同一个级别大数据工程师的薪酬可能要比其他职位高20%至30%,且颇受企业重视。
3.职业发展路径
由于大数据人才数量较少,因此大多数公司的数据部门一般都是扁平化的层级模式,大致分为数据分析师、资深研究员、部门总监3个级别。大公司可能按照应用领域的维度来划分不同团队,而在小公司则需要身兼数职。有些特别强调大数据战略的互联网公司则会另设最高职位—如阿里巴巴的首席数据官。另一方面,大数据工程师对商业和产品的理解,并不亚于业务部门员工,因此也可转向产品部或市场部,乃至上升为公司的高级管理层。

C. 大数据需要什么人才

说到大数据,肯定少不了分析软件,这应该是大数据工作的根基,但市面上很多各种分析软件,如果不是过来人,真的很难找到适合自己或符合企业要求的。
小编通过各大企业对大数据相关行业的岗位要求,总结了以下几点:
(1)SQL数据库的基本操作,会基本的数据管理
(2)会用Excel/SQL做基本的数据分析和展示
(3)会用脚本语言进行数据分析,Python or R
(4)有获取外部数据的能力,如爬虫
(5)会基本的数据可视化技能,能撰写数据报告
(6)熟悉常用的数据挖掘算法:回归分析、决策树、随机森林、支持向量机等
对于学习大数据,总体来说,先学基础,再学理论,最后是工具。基本上,每一门语言的学习都是要按照这个顺序来的。
1、学习数据分析基础知识,包括概率论、数理统计。基础这种东西还是要掌握好的啊,基础都还没扎实,知识大厦是很容易倒的哈。
2、你的目标行业的相关理论知识。比如金融类的,要学习证券、银行、财务等各种知识,不然到了公司就一脸懵逼啦。
3、学习数据分析工具,软件结合案列的实际应用,关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,stata,R,Python,SAS等。
4、学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
当然,学习数学与应用数学、统计学、计算机科学与技术等理工科专业的人确实比文科生有着客观的优势,但能力大于专业,兴趣才会决定你走得有多远。毕竟数据分析不像编程那样,需要你天天敲代码,要学习好多的编程语言,数据分析更注重的是你的实操和业务能力。如今的软件学习都是非常简单便捷的,我们真正需要提升的是自己的逻辑思维能力,以及敏锐的洞察能力,还得有良好的沟通表述能力。这些都是和自身的努力有关,而不是单纯凭借理工科背景就可以啃得下来的。相反这些能力更加倾向于文科生,毕竟好奇心、创造力也是一个人不可或缺的。一、计算机编码能力实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素。举例来说,现在人们在社交网络上所产生的许多记录都是非结构化的数据,如何从这些毫无头绪的文字、语音、图像甚至视频中拾取有意义的信息就需要大数据工程师亲自挖掘。二、数学及统计学相关的背景国内BAT为代表的大公司,对于大数据工程师的要求都是希望是统计学和数学背景的硕士或博士学历。缺乏理论背景的数据工作者,按照不同的数据模型和算法总能捯饬出一些结果来,但如果你不知道那代表什么,就并不是真正有意义的结果,并且那样的结果还容易误导你。只有具备一定的理论知识,才能理解模型、复用模型甚至创新模型,来解决实际问题。三、特定应用领域或行业的知识大数据工程师这个角色很重要的一点是,不能脱离市场,因为大数据只有和特定领域的应用结合起来才能产生价值。所以,在某个或多个垂直行业的经历能为应聘者积累对行业的认知,对于之后成为大数据工程师有很大帮助。

D. 大数据人才发展前景如何

1. 人才缺口
全球最顶尖管理咨询公司麦肯锡(McKinsey)出具的一份详细分析报告显示,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在14万到19万之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到150万。
2. 就业薪水
根据调查,目前北京地区大数据人才的平均工资为13680,月薪在15K以上的占41.4%。月薪6k-10k的占52.1%。

E. 如何成为一名大数据工程师

大数据是眼下非常时髦的技术名词,与此同时自然也催生出了一些与大数据处理相关的职业,通过对数据的挖掘分析来影响企业的商业决策。

这群人在国外被叫做数据科学家(Data Scientist),这个头衔最早由D.J.Pati和Jeff Hammerbacher于2008年提出,他们后来分别成为了领英(LinkedIn)和Facebook数据科学团队的负责人。而数据科学家这个职位目前也已经在美国传统的电信、零售、金融、制造、物流、医疗、教育等行业里开始创造价值。

不过在国内,大数据的应用才刚刚萌芽,人才市场还不那么成熟,“你很难期望有一个全才来完成整个链条上的所有环节。更多公司会根据自己已有的资源和短板,招聘能和现有团队互补的人才。”领英(LinkedIn)中国商务分析及战略总监王昱尧对《第一财经周刊》说。

数据工程师是做什么的?于是每家公司对大数据工作的要求不尽相同:有的强调数据库编程、有的突出应用数学和统计学知识、有的则要求有咨询公司或投行相关的经验、有些是希望能找到懂得产品和市场的应用型人才。正因为如此,很多公司会针对自己的业务类型和团队分工,给这群与大数据打交道的人一些新的头衔和定义:数据挖掘工程师、大数据专家、数据研究员、用户分析专家等都是经常在国内公司里出现的Title,我们将其统称为“大数据工程师”。

由于国内的大数据工作还处在一个有待开发的阶段,因此能从其中挖掘出多少价值完全取决于工程师的个人能力。已经身处这个行业的专家给出了一些人才需求的大体框架,包括要有计算机编码能力、数学及统计学相关背景,当然如果能对一些特定领域或行业有比较深入的了解,对于其快速判断并抓准关键因素则更有帮助。

虽然对于一些大公司来说,拥有硕博学历的公司人是比较好的选择,不过阿里巴巴集团研究员薛贵荣强调,学历并不是最主要的因素,能有大规模处理数据的经验并且有喜欢在数据海洋中寻宝的好奇心会更适合这个工作。

除此之外,一个优秀的大数据工程师要具备一定的逻辑分析能力,并能迅速定位某个商业问题的关键属性和决定因素。“他得知道什么是相关的,哪个是重要的,使用什么样的数据是最有价值的,如何快速找到每个业务最核心的需求。”联合国网络大数据联合实验室数据科学家沈志勇说。学习能力能帮助大数据工程师快速适应不同的项目,并在短时间内成为这个领域的数据专家;沟通能力则能让他们的工作开展地更顺利,因为大数据工程师的工作主要分为两种方式:由市场部驱动和由数据分析部门驱动,前者需要常常向产品经理了解开发需求,后者则需要找运营部了解数据模型实际转化的情况。

你可以将以上这些要求看做是成为大数据工程师的努力方向,因为根据万宝瑞华管理合伙人颜莉萍(Nicole Yan)的观察,这是一个很大的人才缺口。目前国内的大数据应用多集中在互联网领域,有超过56%的企业在筹备发展大数据研究,“未来5年,94%的公司都会需要数据科学家。”颜莉萍(Nicole Yan)说。因此她也建议一些原本从事与数据工作相关的公司人可以考虑转型。

用阿里巴巴集团研究员薛贵荣的话来说,大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要。

沈志勇认为如果把大数据想象成一座不停累积的矿山,那么大数据工程师的工作就是,“第一步,定位并抽取信息所在的数据集,相当于探矿和采矿。第二步,把它变成直接可以做判断的信息,相当于冶炼。最后是应用,把数据可视化等。”

因此分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。

1.找出过去事件的特征

大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。比如,腾讯的数据团队正在搭建一个数据仓库,把公司所有网络平台上数量庞大、不规整的数据信息进行梳理,总结出可供查询的特征,来支持公司各类业务对数据的需求,包括广告投放、游戏开发、社交网络等。

找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。“你可以知道他是什么样的人、他的年纪、兴趣爱好,是不是互联网付费用户、喜欢玩什么类型的游戏,平常喜欢在网上做什么事情。”腾讯云计算有限公司北京研发中心总经理郑立峰对《第一财经周刊》说。下一步到了业务层面,就可以针对各类人群推荐相关服务,比如手游,或是基于不同特征和需求衍生出新的业务模式,比如微信的电影票业务。

2.预测未来可能发生的事情

通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象数据来帮助淘宝卖家做生意。“比如今年夏天不热,很可能某些产品就没有去年畅销,除了空调、电扇,背心、游泳衣等都可能会受其影响。那么我们就会建立气象数据和销售数据之间的关系,找到与之相关的品类,提前警示卖家周转库存。”薛贵荣说。

在网络,沈志勇支持“网络预测”部分产品的模型研发,试图用大数据为更广泛的人群服务。已经上线的包括世界杯预测、高考预测、景点预测等。以网络景点预测为例,大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测,并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里,它究竟是畅通、拥挤,还是一般拥挤?

3.找出最优化的结果

根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。

以腾讯来说,郑立峰认为能反映大数据工程师工作的最简单直接的例子就是选项测试(AB Test),即帮助产品经理在A、B两个备选方案中做出选择。在过去,决策者只能依据经验进行判断,但如今大数据工程师可以通过大范围地实时测试—比如,在社交网络产品的例子中,让一半用户看到A界面,另一半使用B界面,观察统计一段时间内的点击率和转化率,以此帮助市场部做出最终选择。

作为电商的阿里巴巴,则希望通过大数据锁定精准的人群,帮助卖家做更好的营销。“我们更期待的是你能找到这样一批人,比起现有的用户,这些人对产品更感兴趣。”薛贵荣说。一个淘宝的实例是,某人参卖家原来推广的目标人群是产妇,但工程师通过挖掘数据之间的关联性后发现,针对孕妇群体投放的营销转化率更高。

需要具备的能力

1.数学及统计学相关的背景

就我们采访过的BAT三家互联网大公司来说,对于大数据工程师的要求都是希望是统计学和数学背景的硕士或博士学历。沈志勇认为,缺乏理论背景的数据工作者,更容易进入一个技能上的危险区域(Danger Zone)—一堆数字,按照不同的数据模型和算法总能捯饬出一些结果来,但如果你不知道那代表什么,就并不是真正有意义的结果,并且那样的结果还容易误导你。“只有具备一定的理论知识,才能理解模型、复用模型甚至创新模型,来解决实际问题。”沈志勇说。

2.计算机编码能力

实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素。“因为许多数据的价值来自于挖掘的过程,你必须亲自动手才能发现金子的价值。”郑立峰说。

举例来说,现在人们在社交网络上所产生的许多记录都是非结构化的数据,如何从这些毫无头绪的文字、语音、图像甚至视频中攫取有意义的信息就需要大数据工程师亲自挖掘。即使在某些团队中,大数据工程师的职责以商业分析为主,但也要熟悉计算机处理大数据的方式。

3.对特定应用领域或行业的知识

在颜莉萍(Nicole Yan)看来,大数据工程师这个角色很重要的一点是,不能脱离市场,因为大数据只有和特定领域的应用结合起来才能产生价值。所以,在某个或多个垂直行业的经历能为应聘者积累对行业的认知,对于之后成为大数据工程师有很大帮助,因此这也是应聘这个岗位时较有说服力的加分项。

“他不能只是懂得数据,还要有商业头脑,不论对零售、医药、游戏还是旅游等行业,能就其中某些领域有一定的理解,最好还是与公司的业务方向一致的,”就此薛贵荣还打了个比方,“过去我们说一些奢侈品店员势利,看人一眼就知道买得起买不起,但这群人恰恰是有敏锐度的,我们认为他们是这个行业的专家。又比如对医疗行业了解的人,他在考虑医疗保险业务时,不仅会和人们医院看病的记录相关,也会考虑饮食数据,这些都是基于对该领域的了解。”

职业发展1.如何成为大数据工程师

由于目前大数据人才匮乏,对于公司来说,很难招聘到合适的人才—既要有高学历,同时最好还有大规模数据处理经验。因此很多企业会通过内部挖掘。

2014年8月,阿里巴巴举办了一个大数据竞赛,把天猫平台上的数据拿出来,去除敏感问题后,放到云计算平台上交予7000多支队伍进行比赛,比赛分为内部赛和外部赛。“通过这个方式来激励内部员工,同时也发现外部人才,让各行业的大数据工程师涌现出来。”

颜莉萍(Nicole Yan)建议,目前长期从事数据库管理、挖掘、编程工作的人,包括传统的量化分析师、Hadoop方面的工程师,以及任何在工作中需要通过数据来进行判断决策的管理者,比如某些领域的运营经理等,都可以尝试该职位,而各个领域的达人只要学会运用数据,也可以成为大数据工程师。

2.薪酬待遇

作为IT类职业中的“大熊猫”,大数据工程师的收入待遇可以说达到了同类的顶级。根据颜莉萍(Nicole Yan)的观察,国内IT、通讯、行业招聘中,有10%都是和大数据相关的,且比例还在上升。颜莉萍(Nicole Yan)表示,“大数据时代的到来很突然,在国内发展势头激进,而人才却非常有限,现在完全是供不应求的状况。”在美国,大数据工程师平均每年薪酬高达17.5万美元,而据了解,在国内顶尖互联网类公司,同一个级别大数据工程师的薪酬可能要比其他职位高20%至30%,且颇受企业重视。

3.职业发展路径

由于大数据人才数量较少,因此大多数公司的数据部门一般都是扁平化的层级模式,大致分为数据分析师、资深研究员、部门总监3个级别。大公司可能按照应用领域的维度来划分不同团队,而在小公司则需要身兼数职。有些特别强调大数据战略的互联网公司则会另设最高职位—如阿里巴巴的首席数据官。“这个职位的大部分人会往研究方向发展,成为重要数据战略人才。”颜莉萍(Nicole Yan)说。另一方面,大数据工程师对商业和产品的理解,并不亚于业务部门员工,因此也可转向产品部或市场部,乃至上升为公司的高级管理层。

F. 大数据处理需要什么样的人才需要具备哪些技能

既然你是零基础,就得从头学起了
先学习基础知识,从基本的学起,
首先要深刻理解什么是大数据,大数据的特点和价值等
先读一下《大数据时代》
然后,从基本的工具开始,比如EXCEL,SPSS
可以看书《谁说菜鸟不会数据分析》全套书籍
等有了一定的基础和能力后,再学习R语言或PYTHON
如果要做真正的大数据分析,HADOOP估计你也少不了要用的!
-

G. 聚焦大数据人才 需要哪些技能

市场观察人士称,大量公司目前正在寻求拥有综合技能,可发掘大数据竞争优势的人才。研究机构国际数据分析研究所(IIA)首席执行官Jack Phillips称:“排名第一的企业需求是招聘到能够通过数据的使用和分析获得竞争优势的人才。这一点是毫无疑问的。”那么“大数据人才”具体是指什么呢?这些职位都是什么?他们需要什么样的技能呢?从事大数据工作的人需要什么样的教育背景呢?为此,美国计算机世界网站对这一新兴领域内的杰出代表人物进行了专访。相关技能曾经出任瑞银财富管理公司商业风险与分析总监的Sandeep Sacheti称:“现在对‘大数据专业人员’还没有一个统一的定义。” 目前Sacheti已跳槽至威科集团,并出任该集团下属企业法律服务公司客户洞察与营运绩效副总裁。Sacheti的新职位全部是关于大数据的:利用分析法了解客户、开发新产品、削减运营成本。在他主管的一个项目中,威科集团为律师事务所提供电子账单服务的部门正在使用分析法挖掘从客户那里汇集到的数据(已取得了许可),以开发新的产品。为了处理这些大数据工作,Sacheti目前采取双管齐下的办法,一方面从外面招聘人才,一方面培训内部员工。他根据四组技能对大数据职位进行了划分:数据科学家、数据架构师、数据可视化人员和数据调整代理人。由于不同的人会使用不同的技能,因此目前这些职位还没有一个标准的称谓。Robert Half Technology公司高级执行董事John Reed称,同一个职位在一家公司里可能被称为数据分析师,但是在另一家公司里可能并不叫数据分析师。有的大数据职位的称谓就像Sacheti给出的职位名称那样,职位的称谓中既没有“大”这个字也没有“数据”这一词。Phillips称,目前已经有一些公司为了招聘到大数据人才向IIA寻求帮助。首先,他们会询问能够在哪里找到这类人才。“随后,他们会中止这些话题转而询问‘等一下,我怎么才能知道我正寻找什么?’”Talent Analytics 公司首席执行官Greta Roberts称:“每个人都会问,你是如何鉴别这些人的?你关注的是哪些技能?他们需要拥有什么样的学位?”Phillips 和Roberts都表示,大数据职位相关的技能主要包括数学、统计学、数据分析、商业分析和自然语言处理。尽管还没有达成一致,但是数据科学家、数据架构师等职位已经逐步获得了共识。责编:赵龙

H. 转行大数据应该怎么做

首先大数据的就业方向有:数据挖掘、数据分析&机器学习方向、大数据运维&云计算方向、Hadoop大数据开发方向。转行,得先选定发展方向。同时,要根据自己的自身情况和兴趣爱好来选择岗位。

其次,明白大数据要学的主要内容,首先要学习Java根底,学大数据课程之前要先学习一种核算机编程言语。Java是大数据学习需求的编程言语根底,由于大数据的开发根据常用的高档言语。而且不论是学习hadoop,还是数据发掘,都需求有编程言语作为根底。因而,假如想学习大数据开发,把握Java根底是必不可少的。还要学习大数据中心常识Hadoop生态体系;HDFS技术;HBASE技术;Sqoop运用流程;数据仓库东西HIVE;大数据离线剖析Spark、Python言语;数据实时剖析Storm;音讯订阅分发体系Kafka等。假如把大数据比作容器,那么这个容器的容量无限大,什么都能往里装,大数据离不开物联网,移动互联网,大数据还和人工智能、云核算和机器学习有着千丝万缕的联系,大数据海量数据存储要高扩展就离不开云核算,大数据核算剖析采用传统的机器学习、数据发掘技术会比较慢,需求做并行核算和分布式核算扩展。

最后,还要选择学习方式,学习方式一般就是自学和培训,自学一般学习时间比较长,难度比较大,对于转行急需就业的小伙伴来讲,选择第二种方式比较好,时间消耗短,学习知识系统,对于以后就业可能有一定的帮助。

关于转行大数据应该怎么做,青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣,希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

I. 小白想转行做大数据,怎么入行

大数据技术专业属于交叉学科:以统计学、数学、计算机为三大支撑性学科;生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。

此外还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是二专多能复合的跨界人才(有专业知识、有数据思维)。

大数据时代则对从业人员素质的要求越来越高,因为数据处理变得越来越复杂,数据人才的竞争也越来越激烈,很多大公司都在寻找尖端人才。而且,大到国防、金融,小到跟生活息息相关的物流、购物、医疗、交通等,都日益需要大数据的支撑。大数据正在成为一门“显学”。

对于大数据开发的学习,重在掌握基本知识以及实践应用,合理安排基础知识的学习,可以起到事半功倍的效果,以下是比较经典的大数据开发学习路线:

第一阶段:JavaSE+MySql+Linux

Java语言入门 → OOP编程 → Java常用Api、集合 → IO/NIO → Java实用技术 → Mysql数据库 → 阶段项目实战 → Linux基础 → shell编程

第二阶段:Hadoop与生态系统

Hadoop → MapRece → Avro → Hive → Hbase → Zookeeper → Flume → Kafka → Sqoop → Pig

第三阶段:Storm与Spark及其生态圈

Storm → Scala → Spark → Spark SQL → Spark Streaming → Spark机器学习

第四阶段:其他

Mahout机器学习 → R语言 → Python

第五阶段:项目实战、技术综合运用
希望对您有所帮助!~

J. 如何开展大数据相关的人才的储备和能力培养

一、引言
随着计算机软硬件技术的快速发展,计算技术已从传统的PC平台计算模式发展到嵌入式计算、移动计算、并行计算和服务计算等多种计算系统并存及融合的计算模式,处理的对象也呈现出网络化、多媒体化、大数据化和智能化需求的特征,而物联网、移动互联网的快速发展促进了这一趋势,从而迎来了大数据时代的到来。大数据是继云计算、物联网之后兴起的又一新兴发展方向,被学术界、工业界乃至政府机构密切关注和广泛研究。
大数据又称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极的目的的资讯。在维克托・迈尔・舍恩伯格及肯尼斯・库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。一般说来,大数据具有4V的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
二、大数据时代对人才的要求
从广义上讲,大数据人才就是具备大数据处理能力的科学家和工程师。目前,国际上开设了大量的数据科学方面的课程、数据科学学位计划以及数据科学短期培训班。从国际上设置的培养计划来看,大数据人才应该系统地掌握数据分析相关的技能,主要包括数学、统计学、数据分析、商业分析和自然语言处理等,具有较宽的知识面,具有独立获取知识的能力,具有较强的实践能力、创新意识和团队合作意识。具体来说,大数据人才首先应具备获取大数据的能力,例如能根据任务的具体要求,综合利用各种计算机手段和知识,收集整理海量数据并加以存储,为支撑相关的决策和行为做好数据准备。其次,应具备分析大数据的能力,对于经过预处理的各类数据,能够根据具体的需求,进行选择、转换、加载,采用有效方法和模型对数据进行分析,并形成分析报告,为实际问题提供决策依据。最后,应具备良好的团队合作精神,大数据时代下的数据分析任务通常无法依赖个人能力来完成,需要在团队制度的约束下,与他人一同携手、互相鼓励、分工合作来实现既定目标,因此具备较强的责任心与团队合作精神也是大数据从业人员必备的基本条件。
三、大数据人才培养的探索
大数据产业的发展,对大数据人才提出了新的需求,国内各高校在积极进行大数据学术研究的同时,也开始考虑将大数据相关课程纳入培养体系,以满足社会对大数据人才的需求。以下结合作者在数据库及分布式技术系列课程中的教学经验,以及大数据分析与处理方面的实践经验,探讨大数据系列课程教学内容和实践形式的设置。
在教学内容的设置上,大数据系列课程建议可分为理论教学和技术教学两个方面,因为理论是大数据认知的必经途径,也是被广泛认同和传播的基线;而技术是大数据价值体现的手段和前进的基石。在理论方面,讲授的理论内容可涵盖如下几点:
(1)大数据概念:大数据概念出现的历史,关于大数据定义的各种流派以及说明,大数据的四个特征,大数据与云计算、物联网的关系,大数据与大规模数据、海量数据的差别。这个部分主要突出“大数据”概念中应包含的“对数据对象的处理行为”。
(2)典型的大数据应用实例:精选有新意的大数据分析典型案例,可帮助学生更清晰的理解大数据的概念和含义,这样的案例如:美国梅西百货的实时定价机制(根据需求和库存的情况对多达7300万种货品进行实时调价)、网络搜索的实时热点排行榜(以数亿网民的搜索行为作为数据基础,建立权威的关键词排行榜与分类热点)、沃尔玛的搜索引擎Polaris(利用语义数据进行文本分析、机器学习和同义词挖掘使得在线购物的完成率提升了10%~15%)、谷歌流感趋势工具(通过跟踪搜索词相关数据来判断全美地区的流感情况)等。在教学过程中,教师应注意将授课的重点放在系统化的开发步骤和关键性问题的求解上,介绍案例的设计思想、主要方法和应用过程等。
(3)大数据关键技术与挑战:介绍大数据时代面临的新挑战,包括大数据集成(数据异构性和数据质量问题)、大数据分析(数据形式多样化、数据处理的实时性、索引结构的复杂性等)、大数据隐私问题(隐私保护和数据分析的矛盾)、大数据能耗问题(低功耗硬件的设计)、大数据处理与硬件的协同、大数据管理易用性问题以及性能测试基准。
(4)大数据存储和管理技术:介绍如何把采集到的大数据存储起来,建立相应的数据库,并进行管理和调用。主要内容包括:分布式文件系统(HDFS)、去冗余及高效低成本的大数据存储技术、新型数据库技术(键值数据库、列存数据库、图存数据库以及文档数据库等)、异构数据融合技术、分布式非关系型大数据管理与处理技术、大数据索引技术和大数据移动、备份、复制等技术。
(5)大数据分析及挖掘技术:介绍从大量数据中寻找其规律的技术,通常由数据准备、规律寻找和规律表示3个阶段组成。数据准备是从上述大数据中心存储的数据中选取所需数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含规律找出来;规律表示则是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。 在技术方面,可考虑分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程,具体可包括以下几点:
(1)NoSQL技术:NoSQL产生的背景、NoSQL现状、NoSQL数据库与关系数据库的比较、聚合数据模型、分布式模型、数据一致性、典型的NoSQL数据库分类、NoSQL数据库开源软件。
(2)MapRece:MapRece模型概述、编程模型:Map和Rece函数、MapRece工作流程、并行计算的实现、实例、Yarn等
(3)Hadoop分布式文件系统:Hadoop出现的背景、Hadoop的功能与作用、为什么不用关系型数据库管理系统、Hadoop的优点、Hadoop的应用现状和发展趋势、Hadoop项目及其结构、Hadoop的体系结构、Hadoop与分布式开发、Hadoop应用案例、Hadoop平台上的海量数据排序。
(4)还可进一步包括数据流的管理与挖掘、云数据库、图数据库等。
由于大数据系列课程所涉及的技术具有很强的应用背景和实践意义,因此应摒弃传统教学模式中“重理论、轻实践”的思想,在掌握大数据相关的理论知识和技术知识之后,还需重点培养学生的综合实践能力,以满足社会就业的需要。为此,应设立一定的大数据技术实践课程内容,帮助学生从知识型向能力型转变。结合上一节分析的大数据时代对人才的具体要求,建议按以下流程设置实践环节的内容:
(1)分组。如前所述,大数据时代下的数据分析任务通常需要以团队的形式来完成,因此首先要求学生根据自身情况,结合各自的技术优势,合理进行分组。
(2)选题。在具体选题上,可使用校企合作的具体项目或以Apache Hadoop、MongoDB、Dremel、Gephi等一系列的开源大数据分析软件作为实践平台,以Kaggle为数据科学平台来进行选题。
(3)明确需求并撰写大数据分析任务书。明确选定的题目范围内,数据分析要研究的主要问题和预期的分析目标。只有明确了数据分析的目标,才能正确地制定数据收集方案,即收集哪些数据,采用怎样的方式收集等,进而为数据分析做好准备。
(4)数据收集及预处理。由于大数据分析最终的结果与其获取的数据质量紧密相关,因此收集的数据是否真正符合数据分析的目标是必须注意的重要问题。该步骤要求学生从分析目标出发,从浩瀚的数据中正确的收集高质量且服务于既定分析目标的数据,然后对数据进行必要的加工整理,包括填写空缺值、平滑噪声数据、识别和删除孤立点、解决不一致性、规范化(消除冗余属性)和聚集(数据汇总)等。
(5)探索性数据分析。由于大数据分析的数据量通常达到PB甚至YB级以上,因此希望直接选定一个分析模型是不现实的,而且面对高维海量数据,也很难直接看出数据的规律。在这个步骤中,应指导学生通过基本描述统计量的计算、基本统计图形的绘制、用各种形式的方程拟合等手段,计算某些特征量等方法探索规律性的可能形式,帮助学生快速掌握数据的分布特征,这是进一步深入分析和建模的基础。
(6)模型选定分析。在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。有时选择几种统计分析方法对数据进行探索性的反复分析也是极为重要的。每一种统计分析方法都有自己的特点和局限,因此,一般需要选择几种方法反复印证分析,仅依据一种分析方法的结果就断然下结论是不科学的。
(7)模型的验证及分析报告。指导学生对选择的数据分析模型及结果进行分析,可使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。观察模型提供决策的信息是否充分、可信,所发挥的作用是否与期望值一致,数据分析方法是否合理,是否将风险控制在可接受的范围。
以上这种项目式实践形式的优势是:在学生参与完成某一具体的大数据分析任务过程中,通过主动地学习来自主地进行知识的建构,让学生经历项目开发的整个过程,从中去发现和掌握相关知识,达到既能熟悉大数据分析过程,又完成了经验的积累,还能实现学习知识、培养能力的目的。在这里,教师不再是知识的传授者,而是项目活动的组织者和咨询者。
四、校企合作推动人才培养
一方面,大数据的核心业务必然是一种扎根于特定行业,综合运用已有的存储、分析、挖掘、展现技术,根据用户需求并融入行业特色技术模型的一站式大数据平台业务。另一方面,对于企业来说,各类业务产生的数据为数据分析创造了非常好的基础条件。大数据解决方案是有价值的,但是苦于找不到既懂数据分析技术,又懂得业务的专业人才。由此可见,既懂得相关技术,又谙熟企业业务的复合型人才才是企业部署大数据应用最迫切需要的人才。因此,企业可以与学校联合培养自己所需要的大数据人才,这种方式有两方面的优势:一是大数据技能训练的对象,即大量的数据,只有企业才具备;二是在企业的支持下,学校也能通过针对性的实践训练来培养学生的大数据处理技能。
大数据时代下的校企合作的形式多种多样,可通过联合办学、联合制定人才培养方案、合作开发课程和教学内容、设置实训项目、教学管理和共建“双师”结构教学团队等形式展开。
五、结语
未来的十年将是一个“大数据”引领的智慧科技的时代。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富。更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代的脚步悄然而至,未来几年,中国项目数据分析专业人才需求达几十万人以上。国内高校应及时关注大数据时代的数据分析人才培养,融基础理论、实验教学、工程实践为一体,为大数据这样的新兴产业发展输出高层次、实用性、国际化的复合型专业人才,确保产业科学、持续、高速的发展。