去美國留學(xué)數(shù)據(jù)科學(xué)專業(yè)的就業(yè)方向有哪些

字號:


    早從15年開始,在出國留學(xué)的浪潮里,大數(shù)據(jù)相關(guān)的專業(yè)就越來越火,老牌子的CS和統(tǒng)計專業(yè)自是不必說,新興的專業(yè)中最火的則是Data Science,Business Analytics 和Data/Applied Analytics。 下面由出國留學(xué)網(wǎng)小編給你們介紹具體情況!
    去美國留學(xué)數(shù)據(jù)科學(xué)專業(yè)的就業(yè)方向有哪些
    第一類:純數(shù)據(jù)分析類
    1. 數(shù)據(jù)分析師
    Data Analyst
    數(shù)據(jù)分析師側(cè)重于利用統(tǒng)計學(xué)、數(shù)學(xué)等知識進行數(shù)據(jù)挖掘,日常的主要工作內(nèi)容為收集數(shù)據(jù)、清洗數(shù)據(jù)、然后做一些分析或可視化處理,對編程語言有一定的要求,如R,Python,Javascript,C/C++,SQL等。初級的Analyst的工作就是配合Scientist和Engineer,當(dāng)業(yè)務(wù)需求使用某些方法的時候,他們就是一線操作者,當(dāng)scientist要數(shù)據(jù),他們要收集清理數(shù)據(jù),當(dāng)客戶或者子公司要數(shù)據(jù),他們也要收集清理數(shù)據(jù)。得出最終的分析報告給產(chǎn)品組工程組或管理層。 所以從這個角度講,analyst只是非常純粹的在和數(shù)據(jù)打交道罷了。
    2. 數(shù)據(jù)科學(xué)家
    Data Scientist
    數(shù)據(jù)科學(xué)家是數(shù)據(jù)領(lǐng)域非常具有復(fù)合型的高級崗位,往往需要具備能夠獨立完成一整套數(shù)據(jù)分析過程的能力:從數(shù)據(jù)提取,整合、并進行分層,進行統(tǒng)計或其他復(fù)雜的分析,創(chuàng)造引人注目的可視化詮釋和效果,開發(fā)具有更寬廣應(yīng)用前景的數(shù)據(jù)工具。實際工作中主要的精力大概在分布式算法的實現(xiàn)和優(yōu)化上,特別是后者,是極具挑戰(zhàn)性的,需要資深的數(shù)據(jù)科學(xué)家來完成,因此需要非常強大的數(shù)學(xué)、統(tǒng)計、計算機背景,在優(yōu)化問題上很有經(jīng)驗。
    3. 數(shù)據(jù)架構(gòu)師
    Data Architect
    都說不想當(dāng)數(shù)據(jù)架構(gòu)師的程序猿不是一個好前端。因為一個優(yōu)秀的數(shù)據(jù)架構(gòu)師應(yīng)該對所在領(lǐng)域的主流技術(shù)體系有一個全面清晰的認(rèn)識,對某一種技術(shù)的原理、運作機理有深入的理解,是該領(lǐng)域的專家,同時具有將客觀事物抽象出來的能力,關(guān)注當(dāng)前技術(shù)前沿和熱點,使用最高效的方式解決問題。他們的日常主要任務(wù)為創(chuàng)建數(shù)據(jù)管理系統(tǒng),對數(shù)據(jù)源進行整合、集中、和維護。具體來講,要求會SQL,XML,HIVE,PIG,SPARK等,對數(shù)據(jù)庫體系結(jié)構(gòu)有深入了解,擅長數(shù)據(jù)倉庫解決方案等。
    4. 數(shù)據(jù)工程師
    Data Engineer
    作為一個新興的職業(yè)類型, 數(shù)據(jù)工程師更傾向于掌握 “戰(zhàn)術(shù)層面” 的具體數(shù)據(jù)技能,專注于使數(shù)據(jù)可用并能夠在生產(chǎn)環(huán)境中對數(shù)據(jù)進行處理,如具體的編程語言、操作系統(tǒng)與數(shù)據(jù)庫等;而數(shù)據(jù)科學(xué)家更傾向于“戰(zhàn)略層面”的數(shù)據(jù)技能,如數(shù)據(jù)分析、數(shù)據(jù)挖掘、統(tǒng)計分析、機器學(xué)習(xí)等。他們的日常主要工作內(nèi)容是用SQL來回答分析型問題,用腳本來做數(shù)據(jù)集成,清洗ETL(提取-轉(zhuǎn)換-裝載)任務(wù)和使用Hadoop生態(tài)工具等,對編程語言要求較高,SQL,HIVE,PIG,R,MATLAB,SAS,SPSS,Python,Java,Ruby,C++,Perl等等都要會。
    5. 數(shù)據(jù)庫管理員
    Database Administrator
    數(shù)據(jù)庫管理員和數(shù)據(jù)分析的關(guān)聯(lián)不是很大,類似于一個IT職位,職責(zé)為管理數(shù)據(jù)以及支持?jǐn)?shù)據(jù)管理的設(shè)施,確保數(shù)據(jù)庫是提供給所有相關(guān)用戶,正在正確、安全的執(zhí)行,因此可能會用到SQL,hadoop及相關(guān)查詢語言,如Hive和Pig。日常專注于優(yōu)化數(shù)據(jù)倉庫,負(fù)責(zé)數(shù)據(jù)的讀寫和管理。
    第二類:以數(shù)據(jù)為驅(qū)動的商業(yè)分析類
    1. 商業(yè)分析師
    Business Analyst
    商業(yè)分析師和純數(shù)據(jù)科學(xué)家都是使用數(shù)據(jù)的專家,但他們的工作內(nèi)容是有比較大差別的。通常,商業(yè)分析師要對某專業(yè)領(lǐng)域具有深入的了解和深刻的認(rèn)識,商業(yè)敏感度高,擅長于從某一領(lǐng)域的數(shù)據(jù)中挖掘信息,以此評估過去、現(xiàn)在和未來可能的經(jīng)營業(yè)績。確定最有效的分析模型和途徑,為商業(yè)用戶提供和解釋解決方案。
    這個過程一般包括先和客戶溝通,確定客戶的問題和訴求,之后定義業(yè)務(wù)問題,搜集原始數(shù)據(jù),運用預(yù)測性、規(guī)范性和描述性分析來研究、解釋和可視化這些數(shù)據(jù),讓它們變得具有價值且能為客戶展示。在這一過程中與客戶反復(fù)商討需求,更新模型,最終利用數(shù)據(jù)模型理解、整合,得出最佳解決方案。
    2.?dāng)?shù)據(jù)產(chǎn)品經(jīng)理
    Data and Analytics Product Manager
    管理團隊分析師和數(shù)據(jù)科學(xué)家,除了要會一些必備的基礎(chǔ)語言如SQL,R,SAS,Python,Java,Matlab和數(shù)據(jù)挖掘、數(shù)據(jù)建模等能力,還需要對產(chǎn)品有深刻的理解、熟練應(yīng)用數(shù)據(jù)可視化工具,和良好的人際溝通能力。他們的主要職責(zé)包括但不限于搭建數(shù)據(jù)pipeline,做分析,實驗場景,評估和實施分析結(jié)果,同時要針對結(jié)果針對數(shù)據(jù)邏輯提出需求,解答來自其他部門的問題,設(shè)計出更好的產(chǎn)品,留住更多的客戶,產(chǎn)生更多的利潤。