19
2021
10

一份关于数据科学家应该具备的技能清单

时间:2021-10-19 05:53栏目:麻豆福利 点击: 204 次
摘要:一份关于数据科学职业应该具备的技能清单,包含技术技能与非技术技能,相关的读者可以按照该清单逐步完善自己,文末有学习资源链接哦!

大数据时代,什么职业受欢迎?答案可以在今年的薪资清单中找到——算法工程师、人工智能研究员、数据分析等。其实这些岗位都有一定的交集,就是需要处理大量的数据,尤其是作为数据科学家,其主要工作是处理和分析数据,有些岗位与算法工程师和人工智能研究人员重叠,其优势在于对数据更加敏感。那么作为数据科学家你应该具备哪些技能呢?本文将一窥究竟。

1。学历数据科学家一般都是高学历——88%的数据科学家至少是硕士学历,46%的数据科学家是博士学历,这说明做数据科学家需要非常好的学历背景(深入的知识)。常见的专业有计算机科学、社会科学、物理科学和统计学。最常见的研究领域是数学和统计学(32%),其次是计算机科学(19%)和工程应用(16%)。以上学位所学的专业知识将为您提供处理和分析大数据所需的技能。拿到学位后,你能坐下来放松一下吗?答案是否定的,现在是终身学习的时代。事实上,大多数数据科学家在获得硕士或博士学位后,通过在线培训继续学习如何使用Hadoop或大数据查询等特殊技能。

2.R编程语言

对于数据科学家来说,R语言通常是首选的编程语言。r语言是专门为数据科学的需求而设计的,可以用来解决数据科学中遇到的任何问题。事实上,43%的数据科学家正在使用R语言解决统计问题。但是学习R语言有一个障碍,那就是如果你已经掌握了另一种编程语言,那学习起来是非常痛苦的。尽管如此,网上还是有很多R语言学习资源,比如Simplilearn的数据科学培训和R编程语言。

计算机科学。

3.Python编程

Python语言最近很流行。随着人工智能和深度学习的发展,Python已经超越Java语言,成为编程中最常用的语言。Python也是数据科学中常用的编码语言。调查显示,40%的受访者将Python作为主要编程语言。由于Python的多功能性,它可以用于涉及数据科学过程的所有步骤。例如,Python可以使用各种格式的数据,并且可以轻松地将SQL表导入到代码中。此外,允许创建数据集。

4.Hadoop平台

CrowdFlower对在LinkedIn注册的3490名数据科学家进行了调查,发现49%的数据科学家将Apache Hadoop列为第二重要的技能。作为数据科学家,您可能会遇到自己拥有的数据量超过系统内存的问题,或者需要将数据发送到不同的服务器。所有这些问题都可以通过用于分发数据的Hadoop来解决。此外,Hadoop还可以用于数据挖掘、数据过滤、数据采样和汇总。

5.SQL数据库/编程

虽然NoSQL和Hadoop已经成为数据科学的重要组成部分,但一些人仍然可以用SQL编写和执行复杂的查询。SQL (Structured Query Language)是一种编程语言,可以对数据库执行添加、删除、提取数据等操作,还可以执行分析功能,对数据库结构进行转换。作为数据科学家,需要精通SQL。这是因为SQL是专门为访问、通信和处理数据而设计的。当它用于查询数据库时,它提供了洞察力。此外,由于其简洁的命令,它可以节省时间并减少执行困难查询所需的编程量。

6.Apache Spark

Apache Spark正在成为世界上最受欢迎的大数据技术。与Hadoop类似,是一个大数据计算框架。唯一的区别是Spark比Hadoop快。这是因为Hadoop需要读写磁盘,而Spark将其计算缓存在内存中,类似于机械硬盘和SSD的区别。 Apache Spark是专门为数据科学设计的,它可以更快地运行复杂的算法。当处理大量数据时,它有助于分散数据处理,从而节省时间。此外,它可以处理复杂的非结构化数据集。Apache Spark的优势在于速度,这使得数据科学项目的开展非常容易。使用Apache Spark,您可以执行从数据收集到分布式计算的分析。

7.机器学习和人工智能

许多数据科学家并不精通机器学习领域的相关知识和技术,如神经网络、强化学习和对抗学习。如果你想从数据科学家中脱颖而出,你需要了解机器学习技术,如监督学习、决策树、逻辑回归等。这些技术将帮助您解决基于现有数据和结果预测不同数据的科学问题。数据科学需要在机器学习的不同领域应用技能。根据Kaggle的调查,少数数据专业人员掌握了高级机器学习技能,如监督学习、无监督学习、时间序列、自然语言处理、异常检测、计算机视觉、推荐引擎、生存分析、强化学习和对抗学习等。

8.数据可视化

大数据时代,大量数据杂乱无章,一些原始数据需要翻译成通俗易懂的格式。人们自然会以图表的形式表现数据的意义。“一图胜千言”。作为数据科学家,必须能够借助数据可视化工具(如ggplot、d3.js、Matplottlib和Tableau)对数据进行可视化,这些工具可以将项目的复杂结果转化为易于理解的格式。数据可视化为组织提供了直接处理数据的机会,可以快速掌握洞察,帮助组织抓住新的业务机会,保持领先地位。

9.非结构化数据

对于数据科学家来说,能够处理非结构化数据是非常重要的。非结构化数据不适合定义为数据库,如视频、博客文章、客户评论、社交媒体文章、视频文件、音频等。很难对这些类型的数据进行分类。由于非结构化数据的复杂性,大多数人将非结构化数据称为“暗分析”。使用非结构化数据有助于揭示对决策有用的见解。作为数据科学家,您必须能够理解和操作非结构化数据。

非技术技能

10.好奇心

我没有特别的天赋,我只是充满了好奇心——爱因斯坦。好奇心可以定义为获取更多知识的欲望。作为数据科学家,你需要能够提出关于数据的问题,因为数据科学家大约80%的时间都花在发现和准备数据上。随着数据科学领域的快速发展,有必要学习更多的知识来跟上时代。通过在线阅读和阅读有关数据科学趋势的相关书籍,定期更新知识。不要被互联网上的大量数据淹没。你必须知道如何理解这一切。好奇心是作为一名数据科学家取得成功所需的技能之一。例如,当我第一次看到收集的数据时,我不知道这些数据意味着什么。但是好奇心会帮助你筛选数据,找到答案和更多的见解。就像两个人的相亲。只有当你对对方好奇的时候,你才会更加了解对方。

11.商业头脑

要成为一名数据科学家,你需要对你所从事的行业有深刻的了解,并了解公司正在努力解决的业务问题。在数据科学方面,除了为企业找到使用数据的新方法,他们还可以确定哪些问题对于解决业务问题至关重要。要做到这一点,就要了解要解决的问题会对业务产生怎样的影响,这也是为什么要了解企业的运营模式,这样才能够朝着正确的方向去工作。

12.沟通能力

一些公司正在寻找具有良好沟通能力的数据科学家,他们能够清晰流畅地将技术发现传递给非技术团队成员,如市场部或销售部。除了了解非技术同事的需求以便适当调整数据之外,科学家还必须做出相关决定。除了说同一种语言,我们还需要用讲故事的方式用数据进行交流。作为一名数据科学家,你必须知道如何围绕数据创造一个故事,以便任何人都能理解它。例如,与其以故事的形式分享这些数据的见解,不如呈现一个数据表。讲故事可以帮助你与雇主正确地交流你的发现。沟通时,请注意数据分析的结果。大多数企业主并不想知道你分析的具体内容,而是对如何积极影响他们的业务感兴趣。专注于通过沟通提供价值和建立持久的关系。

13.团队合作

科学家不能单干,必须与公司高管合作制定战略,与产品经理和设计师合作创造更好的产品,与营销人员合作推出更好的转化活动,与客户端和服务器软件开发人员合作创建数据管道和改进工作流程。数据科学家必须与组织中的每个人合作,包括客户。本质上,数据科学家将与团队成员一起开发用例,以了解解决问题所需的业务目标和数据。您需要知道解决用例的正确方法、解决问题所需的数据,以及如何将结果呈现为每个相关人员都能轻松理解的东西。

资源1.Advance Degree:更多的数据科学计划正在涌现,以满足当前的需求,大多数是数学、统计学和计算机科学课程;2.MOOCs:Coursera、Udacity和codeacademy等公开课网站是不错的起点;3.Certifications:KDnuggets编制的一份清单列表;4.Bootcamps:有关如何将这种方法与学位课程或MOOC进行比较的更多信息,请查看Datascope Analytics的数据科学家的博客;5.Kaggle:Kaggle是举办数据科学竞赛的平台,可以在上面练手提升自己的技能,并解决实际的业务问题;6.LinkedIn群组:加入相关群组,并与数据科学社区的其他成员进行交流;7.Data Science Central和KDnuggets:Data Science Central和KDnuggets是保持数据科学行业趋势最前沿的优秀资源;8.Burtch工作研究(数据科学家的薪水):如果想了解更多有关当前数据科学家的薪水和人口统计信息,请务必下载数据科学家薪水调查。数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上是翻译,由阿里云起社区组织翻译。

翻译链接文章原标题“成为数据科学家所需的9项必备技能,已更新”。

译者:海棠,审校:大叔_LLD。这篇文章是一个简短的翻译。更多详细内容,请查看原文。

更多技术干货,请关注云起社区知乎机构号。:阿里云韵社区-知乎。

本文为云起社区原创内容,未经许可不得转载。


当前网址:http://couchmentality.com/madoufuli/30382.html
相关内容
热点内容

Powered by 国产精品麻豆1卡2卡3卡8卡 @2018 RSS地图 HTML地图

h福利社 2013-2021 版权所有