那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

下一代數據科學家必須掌握的領域:機器學習

如意 ? 來源:讀芯術微信公眾號 ? 作者:讀芯術微信公眾號 ? 2020-09-15 14:07 ? 次閱讀

數據科學一直是個引人注目的領域,尤其是對于那些有計算機科學、統計、業務分析、工程管理、物理、數學等學科背景的年輕人。但霧里看花始終看不清晰,人們總是認為數據科學背后有許多神秘的地方,覺得它不僅僅是機器學習和統計。

多年來,我與許多專業人士討論過該如何進入數據科學領域。為什么總有關于數據科學的炒作?能夠幫助人們走進這一領域的仍然是統計數據和機器學習嗎?未來也仍是如此嗎?

兩個月前,我從研究生院畢業后直接作為數據科學家加入了媒體巨頭ViacomCBS。除了研究助理和實習之外,沒有任何全職行業經驗。我的工作職責包括從構想、開發到生產ML產品,使用過文中列出的大部分工作方式。希望本文能幫到所有有志于進軍這一領域的數據科學家和機器學習工程師們。

為什么總有關于數據科學的炒作?

幾乎人人都想要進入數據科學領域。幾年前,數據科學領域存在供需問題:自從DJPatil博士和JeffHammerbacher創造了Data Science一詞后,對數據科學家的需求大大增加,相關人才顯得供不應求。

到了2020年,情況有所好轉。受到過正規或者MOOC教育的數據科學愛好者的數量有所增加,人才需求也有所增加,但沒達到前者的增長程度。這一術語所涵蓋的領域越來越廣泛,包含了人們進行數據科學工作所需的大多數功能。每個人都在談論數據科學,但大多數卻不得其法。

我認為數據科學總被炒作有以下幾個原因:

前沿發展

工作滿意度高

業務影響巨大

數據生成量增加

數據科學家頭銜背后的神秘感

數據很好看!(不是字面意思~)

大量學校和訓練營能提供數據科學學位

許多招聘網站將其評為最熱門的工作(最近3年被Glassdoor評為美國最熱門的工作)

自稱是數據科學家的人?

總有人會這么介紹自己,所以讓我就當前的行業狀況講一些真相。

由于職位需求的增加和數據科學家頭銜的光鮮,許多公司已開始將產品分析師、商業情報分析師、業務分析師、供應鏈分析師、數據分析師和統計學家的職位改為數據科學家,因為許多人離職的原因便是去應聘數據科學家的職位,但實際上這些公司提供的工作內容往往是一樣的。

許多人從職位頭銜微小的字詞變化中感到了被尊重。因此,公司們以相同的思路改變職位名稱,使他們的職位顯得更耀眼也更令人期待,例如數據科學家-分析方向、產品數據科學家、數據科學家-增長方向、數據科學家-供應鏈方向、數據科學家-可視化方向或數據科學家,還有什么不能加的方向?

大多數接受教育或者在線培訓的人都有一個誤區,認為所有數據科學家都會建立精致的機器學習模型,但這種認知并不完全正確。我剛開始攻讀應用數據科學碩士時就是這樣想的,以為大多數數據科學家都是做機器學習。

但是當我開始在美國實習和就業時,才逐漸了解真相。推動人們走向數據科學的力量,其實源自對人工智能及其業務影響的炒作。

下一代數據科學家——機器學習

在2020年,對于想要以數據科學家-ML方向(這樣命名因為它不是數據科學家-分析方向)的身份進行應用機器學習,卻又沒有博士學位的人來說,除了人人都可做的將機器學習應用到數據集,可選的方法更多了。我將從自身經驗出發分享一些關鍵點,或許有助于你的面試:

分布式數據處理/機器學習:掌握Apache Spark、ApacheHadoop、Dask等技術的實踐經驗能夠證明你可以大規模創建Data / ML管道。有以上任何一種技術的應用經驗都很加分,不過我還是建議使用Apache Spark(使用Python或Scala)。

生產環境機器學習/數據管道:如果可以親身體驗Apache Airflow就再好不過了。ApacheAirflow是用于創建數據和機器學習管道的標準開源作業編排工具。行業里已經在使用它,因此建議你學習并圍繞它進行一些項目。

DevOps/Cloud:數據科學領域,很多人都過分忽視了DevOps。如果沒有基礎架構的話,要如何構建ML管道?構建在本地計算機上運行的筆記本或代碼,并不像我們在課程中所做的那樣容易。你編寫的代碼應該可跨自己或其他人可能在團隊中創建的基礎結構進行擴展。

許多公司可能尚未布局ML基礎架構,正在尋找入門人員。即使在課程學習中,熟悉Docker,Kubernetes以及使用Flask之類的框架構建ML應用程序也應該是標準做法。我喜歡Docker,因為它具有可擴展性,可以構建基礎架構映像,并在Kubernetes集群上的服務器/云上復制相同的內容。

數據庫:必須了解數據庫和查詢語言。盡管SQL被嚴重忽略,但無論在任何云平臺或數據庫上,它仍然是行業標準。開始在leetcode上練習復雜的SQL將幫助到你應對在DS profiles中的某些編碼面試部分,因為你要負責在預處理進行時從倉庫中導入數據,這將簡化你在運行ML模型前進行預處理。使用SQL將數據傳輸到模型中時,大多數功能工程可以隨時隨地完成,然而很多人會忽略這點。

編程語言:推薦用于數據科學的編程語言是Python、R語言、Scala和Java,了解他們中的任何一個都可以幫助你解決問題。對于ML類型的工作,面試過程中都將進行現場編碼,因此你需要在自己覺得有效率的地方練習——Leetcode或者Hackerrank等。

如今,除非你足夠幸運,在行業中有一些重要的關系(建立人際關系網非常重要!)或擁有署名的出色研究記錄,否則只了解機器學習或統計學的話,你仍無法進入數據科學領域并學習ML。商業應用程序和領域知識往往需要工作經驗,但是除了在相關行業進行實習之外,這些經驗事先無從習得。

我也曾站在數據科學的路口徘徊,如今就要親歷下一代數據科學家進入領域的需求在當下成型。這個行業日新月異,需要你不斷調整自己跟上它的腳步。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7145

    瀏覽量

    89584
  • 機器學習
    +關注

    關注

    66

    文章

    8441

    瀏覽量

    133087
  • 數據科學
    +關注

    關注

    0

    文章

    166

    瀏覽量

    10102
收藏 人收藏

    評論

    相關推薦

    深圳人形機器人行走視頻震驚英偉達科學家下一個劃時代產品是AI機器人?

    電子發燒友網報道(文/吳子鵬)日前,深圳特區報發布了則國產人形機器人行走的視頻,該視頻引起了包括英偉達高級AI研究科學家Jim Fan在內的業內人士和網友的廣泛關注。由于這款機器人步
    的頭像 發表于 01-14 00:53 ?2290次閱讀
    深圳人形<b class='flag-5'>機器</b>人行走視頻震驚英偉達<b class='flag-5'>科學家</b>,<b class='flag-5'>下一</b>個劃時代產品是AI<b class='flag-5'>機器</b>人?

    螞蟻集團收購邊塞科技,吳翼出任強化學習實驗室首席科學家

    領域的研究與發展。令人矚目的是,邊塞科技的創始人吳翼已正式加入該實驗室,并擔任首席科學家職。 吳翼在其個人社交平臺上對這變動進行了回應。他表示,自己最近接受了螞蟻集團的邀請,負責大
    的頭像 發表于 11-22 11:14 ?709次閱讀

    下一代機器人技術:工業自動化的五大趨勢

    隨著人工智能(AI)技術的迅猛發展和全球制造業的轉型升級,下一代機器人技術正在引領工業自動化領域的新輪變革。這些變革不僅深刻影響著生產模式,還為企業帶來了前所未有的機遇和挑戰。
    的頭像 發表于 10-23 15:52 ?778次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了種全新的科學研究范式,即數據驅動的研究范式,這種范式強調從大量
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度
    發表于 10-14 09:12

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

    大規模生產環境落地應用的條件。某種程度上,IoD 技術已成為下一代高性能算力底座的核心技術與最佳實踐。 白皮書下載:*附件:IaaS+on+DPU(IoD)+下一代高性能算力底座+技術白皮書(1).pdf
    發表于 07-24 15:32

    國科微AI首席科學家邢國良:打造全系邊端AI芯片,賦能下一代自動駕駛

    7月4日,2024世界人工智能大會在上海開幕。香港中文大學教授、國科微AI首席科學家邢國良在智能汽車主題論壇發表《下一代自動駕駛技術:從嵌入式視覺到車路協同》演講。他表示,智能網聯為自動駕駛帶來全新
    的頭像 發表于 07-09 11:35 ?632次閱讀
    國科微AI首席<b class='flag-5'>科學家</b>邢國良:打造全系邊端AI芯片,賦能<b class='flag-5'>下一代</b>自動駕駛

    天津大學科學家突破人類大腦器官成功驅動機器

    在科技探索的征途上,天津大學的科研團隊再次邁出了令人矚目的步伐。7月5日,該校宣布了項革命性的成果——科學家們利用前沿的干細胞技術,成功培育出了高度模擬人類大腦的類腦器官,并創新性地將其與機器人系統通過先進的片上腦機接口技術緊
    的頭像 發表于 07-08 16:00 ?663次閱讀

    新華社:突破性成果!祝賀我國科學家成功研發這傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家》為標題,報道了由我國科學家研發的傳感器成果。 我國科學家研發高通道神經探針實現獼猴全腦尺度神經活動監測 神經探針是種用來記錄神經活動
    的頭像 發表于 06-27 18:03 ?556次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發這<b class='flag-5'>一</b>傳感器!

    前OpenAI首席科學家創辦新的AI公司

    在人工智能領域擁有豐富經驗和卓越成就的深度學習專家伊爾亞·蘇茨克維(Ilya Sutskever)周三宣布,他正在創辦家名為Safe Superintelligence的新型人工智能公司。這
    的頭像 發表于 06-21 10:42 ?570次閱讀

    24芯M16插頭在下一代技術中的潛力

      德索工程師說道隨著科技的飛速發展,下一代技術正逐漸展現出其獨特的魅力和潛力。在這背景下,24芯M16插頭作為種高性能、多功能的連接器,將在下一代技術中發揮至關重要的作用。以下是
    的頭像 發表于 06-15 18:03 ?399次閱讀
    24芯M16插頭在<b class='flag-5'>下一代</b>技術中的潛力

    賽輪思與NVIDIA合作,利用生成式AI打造下一代車內體驗

    AI 驅動的移動出行創新企業與 NVIDIA 合作,打造下一代車內體驗。
    的頭像 發表于 05-23 10:12 ?1301次閱讀

    東盟能源和華為主編的《東盟下一代數據中心建設白皮書》正式發布

    2024年5月17日,在2024全球數據中心產業論壇上,由東盟能源中心(ASEAN Center for Energy)和華為主編的《東盟下一代數據中心建設白皮書》(以下簡稱《白皮書》)重磅發布,旨在推動東盟數據中心產業加快綠色
    的頭像 發表于 05-19 14:19 ?916次閱讀
    東盟能源和華為主編的《東盟<b class='flag-5'>下一代數據</b>中心建設白皮書》正式發布

    使用NVIDIA Holoscan for Media構建下一代直播媒體應用

    NVIDIA Holoscan for Media 現已向所有希望在完全可重復使用的集群上構建下一代直播媒體應用的開發者開放。
    的頭像 發表于 04-16 14:04 ?743次閱讀

    NVIDIA首席科學家Bill Dally:深度學習硬件趨勢

    Bill Dally于2009年1月加入NVIDIA擔任首席科學家,此前在斯坦福大學任職12年,擔任計算機科學系主任。Dally及其斯坦福團隊開發了系統架構、網絡架構、信號傳輸、路由和同步技術,在今天的大多數大型并行計算機中都可以找到。
    的頭像 發表于 02-25 16:16 ?1290次閱讀
    NVIDIA首席<b class='flag-5'>科學家</b>Bill Dally:深度<b class='flag-5'>學習</b>硬件趨勢
    百家乐官网连长| 澳门百家乐官网登陆网址| 南宁百家乐官网赌机| 百家乐官网投注网出租| 星港城百家乐娱乐城| 威尼斯人娱乐公司| 张家界市| 金银岛百家乐官网的玩法技巧和规则 | 大发888官网注册| 大关县| G3百家乐官网的玩法技巧和规则 | 大发888棋牌下载| 大发百家乐官网游戏| 网上百家乐官网指| 全讯网123| 濮阳县| 百家乐官网平一直压庄| 全讯网1| 百家乐官网玩法守则| 百家乐庄家抽水| 南宁百家乐的玩法技巧和规则 | 凤凰百家乐官网娱乐城| 百家乐分路单析器| 棋牌易发| 机器百家乐官网软件| 威尼斯人娱乐城官方网| 永利博百家乐官网现金网| 百家乐的庄闲概率| 博彩网站评级| 电玩百家乐官网的玩法技巧和规则 | 百家乐筹码多少钱| 十六浦娱乐城信誉| 无锡百家乐官网的玩法技巧和规则| 免水百家乐的玩法技巧和规则| 百家乐策略详解| 南通热线棋牌中心| 百家乐官网这样赢保单分析| 捷豹百家乐娱乐城| 玩百家乐官网秘诀| 金钱豹百家乐的玩法技巧和规则| 百家乐官网的规则博彩正网|