1. 怎么培养数据分析的能力
数据分析需要哪些思维/能力/知识呢?
比如,数据分析思维、结构化思维、公式化思维、学法体系的思维.......这些思维帮助你,即使碰到自己不熟悉的问题,也能从一定的角度切入分析并保持清晰的逻辑;
一定的业务理解能力,能理解业务背后的商业思路。只有理解问题,才能转换成数据分析的问题,才知道如何设定分析目标并进行分析;
基础理论知识:数理统计、模型原理、近期市场的调研等;
常规分析工具的使用:常用办公软件(Excel、PPT、思维导图)、数据库、统计分析工具、数据挖掘等;
数据报告和数据可视化的能力。数据分析得再好,如果不能以简洁易懂的方式“表达”,成效也会大打折扣。
等等等,诸如此类的基本知识能力贮备......
那么想要提升这些能力该做点什么呢?下面具体来说说怎么做能把这些基础实力打好。
从分析理论和工具实践着手
1、分析理论
分析理论包括:明确业务场景、确定分析目标、构建分析体系和梳理核心指标。
我们要做的就是,首先明确是什么样的业务场景,不同的业务,分析体系也随之不同;然后,结合业务问题确定分析的目标,列出核心指标,再搜集整理所需要的数据。
推荐书籍:《数据化管理》、《决战大数据 》
数据分析的几个步骤:
(1)数据获取
数据获取往往看似简单,但是它需要分析者对问题进行商业理解,即转化成数据问题来解决,如,需要哪些数据,从哪些角度来分析等,在界定了这些问题后,再进行数据采集。
此环节,需要数据分析师具备结构化的逻辑思维。
推荐书籍:《金字塔原理》、麦肯锡三部曲:麦肯锡意识、工具、方法
推荐工具:思维导图工具(Xmind网络脑图等)
(2)数据处理
数据的处理需要掌握有效率的工具:
Excel及高端技能:
基本操作、函数公式、数据透视表、VBA程序开发。
我一般会先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛excelhome论坛,平常多思考如何用excel来解决问题,善用插件,还有记得保存。
专业的报表工具:
(成规模的企业会用)日常做报表可以设计一个通用模板,只要会写SQL就可上手。
相比excel做报表,这种工具开发的技术要求较低,能很快地开发常规报表、动态报表。
数据库的使用:
熟练掌握SQL语言(很重要!!!),常见的有Oracle、SQL sever、My SQL等。
学习流行的hadoop之类的分布式数据库来提升个人能力,对求职等都会有所帮助。
(3)分析数据
分析数据往往需要各类统计分析模型,如关联规则、聚类、分类、预测模型等等。
因此,熟练掌握一些统计分析工具不可免:
lPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。
SAS:经典挖掘软件,需要编程。
R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
各类BI工具:Tableau、PowerBI、FineBI,对于处理好的数据可作自由的可视化分析,图表效果惊人。
推荐书籍:
《说菜鸟不会数据分析》系列,入门级书,初学者最适。
《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,内容很系统很全面。
《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。
(4)数据可视化呈现
很多数据分析工具已经涵盖了数据可视化部分,这时就只需要把数据结果进行有效的呈现和演讲汇报即可,可用word\PPT\H5等方式展现。
2、工具实践
(1)对于入门小白,建议从Excel工具入手,这里以Excel为例:
学习Excel是一个循序渐进的过程:
基础的:简单的表格数据处理、打印、查询、筛选、排序
函数和公式:常用函数、高级数据计算、数组公式、多维引用、function
可视化图表:图形图示展示、高级图表、图表插件
数据透视表、VBA程序开发......
多逛逛excelhome论坛,平常多思考如何用excel来解决问题,学习用各种插件,对能够熟练使用Excel都有帮助。
其中,函数和数据透视表是两个重点。
函数
制作数据模板必须掌握的excel函数:
日期函数:day,month,year,date,today,weekday,weeknum 日期函数是做分析模板的必备,可以用日期函数来控制数据的展示,查询指定时间段的数据。
数学函数:proct,rand,randbetween,round,sum,sumif,sumifs,sumproct
统计函数:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs 统计函数在数据分析中具有举足轻重的作用,求平均值,最大值,中位数,众位数都用得到。
查找和引用函数:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata 这几个函数的作用不用多说,特别是vlookup,不会这个函数基本上复杂报表寸步难行。
文本函数:find,search,text,value,concatenate,left,right,mid,len 这几个函数多半用在数据整理阶段使用。
逻辑函数:and,or,false,true,if,iferror
(以上学会,基本能秒杀90%的办公室白领!)
数据透视表
数据透视表的作用是把大量数据生成可交互的报表,它具有这样一些重要功能:分类汇总、取平均、最大最小值、自动排序、自动筛选、自动分组;可分析占比、同比、环比、定比、自定义公式等
现实中,取数或报表+EXCEL+PPT似乎还是主流形式。
工具上,无论是业务人员还是分析人员,都可以通过自动取数工具或者BI工具来制作报表,减少重复操作的时间。
其次,增加与业务人员的沟通,充分了解业务需求,当你的业务水平和他们差不多甚至更高时,自然而然知道他们一言两语背后真实的需求是什么了。
最后,站在更高角度上,报表的基本粒度就是指标,可梳理出企业的基本指标体系,从经营分析的角度去做报表,把报表的工作标准化,降低报表的冗余,避免动不动就做一张报表。标准化包括指标分类,指标命名,业务口径,技术口径,实现方式等等。其实,最终目的是实现报表数据一致性,减少重复报表开发,降低系统开销的战略性举措。
在业余时间,可以多补充数理统计知识,学习R、Python语言,学习常用的挖掘模型,往高级分析师路上发展!
一起加油鸭!
以上,就是今天的分享,数据分析能力听起来很大很抽象,虽是软实力但却是行业的硬要求!量变引起质变,一步步来,才能做到触类旁通,做起项目才会越来越顺手。
2. 如何培养数据意识
2022-02-24
现在是大数据时代,都在讲算法,手碰悉那就更离不开数据。拥有数据意识,也更有利于我们去分辨,汇总,决策。
其实培养数据意识的核心,就是要想清楚目标,在拆解目标的过程中倒推需要的数据。
比如:目标是提高收入,怎么倒推?
1,思考决定工资高低的因素:是自身的能力,能力越高,工资也越高;
2,思考提升能力的因素:能力提升,一定程度上取决于学习。
这样倒推出来了,学习时长,学习效率就是数据,这样就可以把它量化,每天通过几个小时提高某项能力,来提高职场竞争力,从而提高工资。这样核心数据就是学习时长,学习效率,关注并优化它即可。
即使不需要懂技术,也可以运用拆解目标,倒推数据的思维,一定程度的培养自己的数据意识。不要陷入吵备获取数据的细节中,不懂技术,可以毕乎通过其他方法获取数据,保持拆解目标,倒推所需数据的习惯,可以培养出数据意识。
3. 作为大学生,如何培养大数据思维
在大数据时代,大学生应该具备的大数据思维如下:
1、利用所有的数据,而不再仅仅依靠部分数据,码兄即不是随机样本,而是全体数据。
2、唯有接受不精确性,才有机会打开一扇新的世界之窗,即不是精禅模桐确性,而是混杂性。
3、不是所有的事情都必须知道现象背后的原因,而是要让数贺坦据自己“发声”,即不是因果关系,而是相关关系。
大数据时代需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
4. 大数据怎么学
一、数据分析师有哪些要求?
1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。
2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。
3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。
4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。
二、请把数据分析作为一种能力来培养
从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。
三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:
数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。
(一) 获取数据
获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。
推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》
工具:思维导图、mindmanager软件
(二) 处理数据
一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:
Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。
UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。
ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。
Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。
当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。
分析软件主要推荐:
SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。
SAS:老牌经典挖掘软件,需要编程。
R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步关注文本挖掘工具的使用。
(三) 分析数据
分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。
推荐的书籍:
1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉着,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。
2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编着。属于入门级的书,适合初学者。
3、《统计学》第五版,贾俊平等编着,中国人民大学出版社。比较好的一本统计学的书。
4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等着,范明等翻译,人民邮电出版社。
5、《数据挖掘概念与技术》,Jiawei Han等着,范明等翻译,机械工业出版社。这本书相对难一些。
6、《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。
7、《问卷统计分析实务—SPSS操作与应用》,吴明隆着,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。
(四) 呈现数据
该部分需要把数据结果进行有效的呈现和演讲汇报,需要用到金字塔原理、图表及PPT、word的呈现,培养良好的演讲能力。