1. 怎麼培養數據分析的能力
數據分析需要哪些思維/能力/知識呢?
比如,數據分析思維、結構化思維、公式化思維、學法體系的思維.......這些思維幫助你,即使碰到自己不熟悉的問題,也能從一定的角度切入分析並保持清晰的邏輯;
一定的業務理解能力,能理解業務背後的商業思路。只有理解問題,才能轉換成數據分析的問題,才知道如何設定分析目標並進行分析;
基礎理論知識:數理統計、模型原理、近期市場的調研等;
常規分析工具的使用:常用辦公軟體(Excel、PPT、思維導圖)、資料庫、統計分析工具、數據挖掘等;
數據報告和數據可視化的能力。數據分析得再好,如果不能以簡潔易懂的方式「表達」,成效也會大打折扣。
等等等,諸如此類的基本知識能力貯備......
那麼想要提升這些能力該做點什麼呢?下面具體來說說怎麼做能把這些基礎實力打好。
從分析理論和工具實踐著手
1、分析理論
分析理論包括:明確業務場景、確定分析目標、構建分析體系和梳理核心指標。
我們要做的就是,首先明確是什麼樣的業務場景,不同的業務,分析體系也隨之不同;然後,結合業務問題確定分析的目標,列出核心指標,再搜集整理所需要的數據。
推薦書籍:《數據化管理》、《決戰大數據 》
數據分析的幾個步驟:
(1)數據獲取
數據獲取往往看似簡單,但是它需要分析者對問題進行商業理解,即轉化成數據問題來解決,如,需要哪些數據,從哪些角度來分析等,在界定了這些問題後,再進行數據採集。
此環節,需要數據分析師具備結構化的邏輯思維。
推薦書籍:《金字塔原理》、麥肯錫三部曲:麥肯錫意識、工具、方法
推薦工具:思維導圖工具(Xmind網路腦圖等)
(2)數據處理
數據的處理需要掌握有效率的工具:
Excel及高端技能:
基本操作、函數公式、數據透視表、VBA程序開發。
我一般會先過一遍基礎,知道什麼是什麼,然後找幾個case練習。多逛逛excelhome論壇,平常多思考如何用excel來解決問題,善用插件,還有記得保存。
專業的報表工具:
(成規模的企業會用)日常做報表可以設計一個通用模板,只要會寫SQL就可上手。
相比excel做報表,這種工具開發的技術要求較低,能很快地開發常規報表、動態報表。
資料庫的使用:
熟練掌握SQL語言(很重要!!!),常見的有Oracle、SQL sever、My SQL等。
學習流行的hadoop之類的分布式資料庫來提升個人能力,對求職等都會有所幫助。
(3)分析數據
分析數據往往需要各類統計分析模型,如關聯規則、聚類、分類、預測模型等等。
因此,熟練掌握一些統計分析工具不可免:
lPSS系列:老牌的統計分析軟體,SPSS Statistics(偏統計功能、市場研究)、SPSS Modeler(偏數據挖掘),不用編程,易學。
SAS:經典挖掘軟體,需要編程。
R:開源軟體,新流行,對非結構化數據處理效率上更高,需編程。
各類BI工具:Tableau、PowerBI、FineBI,對於處理好的數據可作自由的可視化分析,圖表效果驚人。
推薦書籍:
《說菜鳥不會數據分析》系列,入門級書,初學者最適。
《數據挖掘與數據化運營實戰,思路、方法、技巧與應用》,內容很系統很全面。
《市場研究定量分析方法與應用》,簡明等編著,中國人民大學出版社。
(4)數據可視化呈現
很多數據分析工具已經涵蓋了數據可視化部分,這時就只需要把數據結果進行有效的呈現和演講匯報即可,可用word\PPT\H5等方式展現。
2、工具實踐
(1)對於入門小白,建議從Excel工具入手,這里以Excel為例:
學習Excel是一個循序漸進的過程:
基礎的:簡單的表格數據處理、列印、查詢、篩選、排序
函數和公式:常用函數、高級數據計算、數組公式、多維引用、function
可視化圖表:圖形圖示展示、高級圖表、圖表插件
數據透視表、VBA程序開發......
多逛逛excelhome論壇,平常多思考如何用excel來解決問題,學慣用各種插件,對能夠熟練使用Excel都有幫助。
其中,函數和數據透視表是兩個重點。
函數
製作數據模板必須掌握的excel函數:
日期函數:day,month,year,date,today,weekday,weeknum 日期函數是做分析模板的必備,可以用日期函數來控制數據的展示,查詢指定時間段的數據。
數學函數:proct,rand,randbetween,round,sum,sumif,sumifs,sumproct
統計函數:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs 統計函數在數據分析中具有舉足輕重的作用,求平均值,最大值,中位數,眾位數都用得到。
查找和引用函數:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata 這幾個函數的作用不用多說,特別是vlookup,不會這個函數基本上復雜報表寸步難行。
文本函數:find,search,text,value,concatenate,left,right,mid,len 這幾個函數多半用在數據整理階段使用。
邏輯函數:and,or,false,true,if,iferror
(以上學會,基本能秒殺90%的辦公室白領!)
數據透視表
數據透視表的作用是把大量數據生成可交互的報表,它具有這樣一些重要功能:分類匯總、取平均、最大最小值、自動排序、自動篩選、自動分組;可分析佔比、同比、環比、定比、自定義公式等
現實中,取數或報表+EXCEL+PPT似乎還是主流形式。
工具上,無論是業務人員還是分析人員,都可以通過自動取數工具或者BI工具來製作報表,減少重復操作的時間。
其次,增加與業務人員的溝通,充分了解業務需求,當你的業務水平和他們差不多甚至更高時,自然而然知道他們一言兩語背後真實的需求是什麼了。
最後,站在更高角度上,報表的基本粒度就是指標,可梳理出企業的基本指標體系,從經營分析的角度去做報表,把報表的工作標准化,降低報表的冗餘,避免動不動就做一張報表。標准化包括指標分類,指標命名,業務口徑,技術口徑,實現方式等等。其實,最終目的是實現報表數據一致性,減少重復報表開發,降低系統開銷的戰略性舉措。
在業余時間,可以多補充數理統計知識,學習R、Python語言,學習常用的挖掘模型,往高級分析師路上發展!
一起加油鴨!
以上,就是今天的分享,數據分析能力聽起來很大很抽象,雖是軟實力但卻是行業的硬要求!量變引起質變,一步步來,才能做到觸類旁通,做起項目才會越來越順手。
2. 如何培養數據意識
2022-02-24
現在是大數據時代,都在講演算法,手碰悉那就更離不開數據。擁有數據意識,也更有利於我們去分辨,匯總,決策。
其實培養數據意識的核心,就是要想清楚目標,在拆解目標的過程中倒推需要的數據。
比如:目標是提高收入,怎麼倒推?
1,思考決定工資高低的因素:是自身的能力,能力越高,工資也越高;
2,思考提升能力的因素:能力提升,一定程度上取決於學習。
這樣倒推出來了,學習時長,學習效率就是數據,這樣就可以把它量化,每天通過幾個小時提高某項能力,來提高職場競爭力,從而提高工資。這樣核心數據就是學習時長,學習效率,關注並優化它即可。
即使不需要懂技術,也可以運用拆解目標,倒推數據的思維,一定程度的培養自己的數據意識。不要陷入吵備獲取數據的細節中,不懂技術,可以畢乎通過其他方法獲取數據,保持拆解目標,倒推所需數據的習慣,可以培養出數據意識。
3. 作為大學生,如何培養大數據思維
在大數據時代,大學生應該具備的大數據思維如下:
1、利用所有的數據,而不再僅僅依靠部分數據,碼兄即不是隨機樣本,而是全體數據。
2、唯有接受不精確性,才有機會打開一扇新的世界之窗,即不是精禪模桐確性,而是混雜性。
3、不是所有的事情都必須知道現象背後的原因,而是要讓數賀坦據自己「發聲」,即不是因果關系,而是相關關系。
大數據時代需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
4. 大數據怎麼學
一、數據分析師有哪些要求?
1、理論要求及對數字的敏感性,包括統計知識、市場研究、模型原理等。
2、工具使用,包括挖掘工具、資料庫、常用辦公軟體(excel、PPT、word、腦圖)等。
3、業務理解能力和對商業的敏感性。對商業及產品要有深刻的理解,因為數據分析的出發點就是要解決商業的問題,只有理解了商業問題,才能轉換成數據分析的問題,從而滿足部門的要求。
4、匯報和圖表展現能力。這是臨門一腳,做得再好的分析模型,如果不能很好地展示給領導和客戶,成效就大打折扣,也會影響到數據分析師的職業晉升。
二、請把數據分析作為一種能力來培養
從廣義來說,現在大多數的工作都需要用到分析能力,特別是數據化運營理念深入的今天,像BAT這樣的公司強調全員參與數據化運營,所以,把它作為一種能力培訓,將會讓你終生受益。
三、從數據分析的四個步驟來看清數據分析師需具備的能力和知識:
數據分析的四個步驟(這有別於數據挖掘流程:商業理解、數據理解、數據准備、模型搭建、模型評估、模型部署),是從更宏觀地展示數據分析的過程:獲取數據、處理數據、分析數據、呈現數據。
(一) 獲取數據
獲取數據的前提是對商業問題的理解,把商業問題轉化成數據問題,要通過現象發現本質,確定從哪些緯度來分析問題,界定問題後,進行數據的採集。此環節,需要數據分析師具備結構化的思維和對商業問題的理解能力。
推薦書籍:《金字塔原理》、麥肯錫三部曲:《麥肯錫意識》、《麥肯錫工具》、《麥肯錫方法》
工具:思維導圖、mindmanager軟體
(二) 處理數據
一個數據分析項目,通常數據處理時間佔70%以上,使用先進的工具有利於提升效率,所以盡量學習最新最有效的處理工具,以下介紹的是最傳統的,但卻很有效率的工具:
Excel:日常在做通報、報告和抽樣分析中經常用到,其圖表功能很強大,處理10萬級別的數據很輕松。
UltraEdit:文本工具,比TXT工具好用,打開和運行速度都比較快。
ACCESS:桌面資料庫,主要是用於日常的抽樣分析(做全量統計分析,消耗資源和時間較多,通常分析師會隨機抽取部分數據進行分析),使用SQL語言,處理100萬級別的數據還是很快捷。
Orcle、SQL sever:處理千萬級別的數據需要用到這兩類資料庫。
當然,在自己能力和時間允許的情況下,學習新流行的分布式資料庫及提升自身的編程能力,對未來的職業發展也有很大幫助。
分析軟體主要推薦:
SPSS系列:老牌的統計分析軟體,SPSS Statistics(偏統計功能、市場研究)、SPSS Modeler(偏數據挖掘),不用編程,易學。
SAS:老牌經典挖掘軟體,需要編程。
R:開源軟體,新流行,對非結構化數據處理效率上更高,需編程。
隨著文本挖掘技術進一步發展,對非結構化數據的分析需求也越來越大,需要進一步關注文本挖掘工具的使用。
(三) 分析數據
分析數據,需要用到各類的模型,包括關聯規則、聚類、分類、預測模型等,其中一個最重要的思想是對比,任何的數據需要在參照系下進行對比,結論才有意義。
推薦的書籍:
1、《數據挖掘與數據化運營實戰,思路、方法、技巧與應用》,盧輝著,機械出版社。這本書是近年國內寫得最好的,務必把它當作聖經一樣來讀。
2、《誰說菜鳥不會數據分析(入門篇)》和《誰說菜鳥不會數據分析(工具篇)》,張文霖等編著。屬於入門級的書,適合初學者。
3、《統計學》第五版,賈俊平等編著,中國人民大學出版社。比較好的一本統計學的書。
4、《數據挖掘導論》完整版,[美]Pang-Ning Tan等著,范明等翻譯,人民郵電出版社。
5、《數據挖掘概念與技術》,Jiawei Han等著,范明等翻譯,機械工業出版社。這本書相對難一些。
6、《市場研究定量分析方法與應用》,簡明等編著,中國人民大學出版社。
7、《問卷統計分析實務—SPSS操作與應用》,吳明隆著,重慶大學出版社。在市場調查領域比較出名的一本書,對問卷調查數據分析講解比較詳細。
(四) 呈現數據
該部分需要把數據結果進行有效的呈現和演講匯報,需要用到金字塔原理、圖表及PPT、word的呈現,培養良好的演講能力。