data-com / weekly

For community discussion on the weekly topics, please click here https://github.com/data-com/discussions
65 stars 0 forks source link

Data Weekly [第十三期] #14

Closed emptymalei closed 3 years ago

emptymalei commented 5 years ago

欢迎大家来到 Data Weekly 第二季!点击查看第一季十期

欢迎大家关注供稿作者们!

欢迎大家投稿

Data Scientist 职业发展的问题讨论

[@jindingars 提供] [讨论此话题]

Data weekly 过去主要在讨论 Data Scientist 具体工作的内容,今天想和大家讨论一下 Data Scientist 职业发展的问题,具体先来聊一聊初级 data scientist 的要求,以及从 data scientist 到 senior data scientist 的进阶。

按照我和 @emptymalei 在豆瓣上的交流,data scientist1 应该有的能力,按照领域划分,可以有如下的几点:

  1. 对于已知数据项目,清晰定义的问题能够有一个解决思路。
  2. 数据来源/data warehousing 方面: 能够完成 SQL or python or spark based 的取数/数据清洗需求。
  3. 基于数据的加工再生成:通过模型来提取更多信息, 能使用既有模型来进行一些分析,肯定需要的技能就是对一些经典模型,Logistic Regression/Random Forrest/boost 类模型等等的熟悉
  4. 展示和使用信息的能力,主要在于数据可视化以及一些方面的工程能力,能否将得到的信息以合适的方式展示出来,讲一个足够好的故事,或者能够在应用场景上,工程化找到的 pattern 从而重复的使用这个 pattern 带来效益的提升。

对于 senior data scientist, 能够提升的主要就是,针对第0点,能够提出要解决问题和处理模糊问题的能力/针对第2点,能够有更加多的想法进行模型研发或已有模型的再组合创新,而在工作之外,能够有一些资源去 access 到一些圈子里的人,这样一定程度可以形成集体决策的环境,得到一些外部的 insight。

针对第 0 点,章鱼喵(@emptymalei)有一个更具体和可执行的补充,有利于大家提升自己的问题解决能力: “第一个是跟你说的提出问题的能力有关。我觉得处理问题的能力,跟我们对这个行业的熟悉程度。这里行业不是指的 data science 行业,而是指的我们把 data science 应用的行业。往往有两个关键的角度:

  1. 这个行业的业务的完整的细节的流程,比如这个 funnel 哪一步是最先需要优化的。
  2. 这个行业应该关注哪几个数据。比如是关注 GMV 还是订单数量。

这样的话就有了全局观念。”

同样也咨询了我之前一位算法工程师同事,他的观点是,0 最重要,3 其次,之后是 2 和 1,因为他认为 data scientist 更多是一个面向商业化的岗位,商业 sense 比较重要,其实也就是对应到章鱼喵所说的行业认知能力。

感谢章鱼喵的 insight,也希望大家多多贡献自己的想法。


如果想要分享你的视角或者经历或者建议,可以通过 Discussions 来提交,或者参与讨论,也可以写邮件给我们:hi@getdataweekly.com

来自 GetDataWeekly.com