不到30岁就当上了科学家?!数据科学家究竟是份什么职业
在人工智能公司,数据科学家就犹如前线作战的士兵,每天需要用各种“武器”和能力处理海量数据。
一个从学校毕业的年轻人,如何能快速成长成为一名合格的数据科学家/分析师,这个工作究竟是干什么的?来看看这四位氪信同学们的故事。

JIA 高级数据科学家
明尼苏达大学双城分校硕士 丨 商业分析专业
#工作三年,从一个数据分析师,迅速成长为能够带领团队,了解行业的高级数据科学家#
来氪信之前,我在其他公司做过数据分析师,每个公司对于数据分析师的定位非常不一样。在有些公司这个职位要做的事情就是在数据库中写SQL,往外导数字。在氪信,数据分析师的工作内容包括了数据清洗、特征提取以及模型建构等整个建模流程。而数据科学家则需要在此基础上,基于客户的需求和对业务的理解,给出可落地实施的解决方案。
这两个职位对于人的能力要求的共同点在于,不仅需要对数据有敏感性,更要能掌握用数据去分析好解决问题的能力。比如,在报表上看到数据异常,就需要抽丝剥茧般地去分析异常点。有时候甚至需要这个职位的人有一点处女座的完美情节,对于任何异常都不能放过。
除了这些能力之外,一个数据科学家还需要有能力应对各种突发情况。印象最深的是去年我做的一个客户的项目。在上线的测试过程中,临时遇到部署环境不一致的情况,导致我们在3天内又做了3版方案,每一版方案要做8个模型,工作量非常大。幸好,我们公司自己内部的开发平台功能性非常好,能够支持我们在短时间内开发出20多个模型,保证项目顺利上线。
我的mentor是公司的首席科学家,这点非常幸运。从她身上,我学会了分析问题的思路,以及如何对内及对外的沟通。这些对我现在带团队都非常有帮助。带团队最大的挑战就是内部出现分歧,这个时候一定要把分歧归结为对不同解决方式的探讨,而不是对人的分歧的探讨,这样的讨论会带来更好的方案。
Q&A TIME:
Q: 成为一个优秀的数据科学家需要哪些硬核和软性技能?
JIA:
硬核的技能包括对数据和算法要有广泛和深入的理解,知道在什么情况下适合用什么样的算法。
软技能是把事情讲清楚的能力。包括对内和对客户的沟通。把事情讲清楚的方法有很多种,语言可以,好的代码和好的文档也可以把事情讲清楚。
Q: 对想做数据科学家的小伙伴说的话。
JIA:
如果你是想把事情做好,想通过自己努力发挥价值和影响力的人的话,创业公司是一个非常合适你的环境。

Simone 数据分析师
宾州州立大学公园分校硕士 丨 工业工程与运筹分析
#入职一年半,从不了解金融不懂工程的数据分析师,成为一个对金融行业有理解的pre数据科学家#
甚至在投简历的时候,我对于数据分析师/数据科学家究竟是份什么职业一点概念也没有。
加入氪信后,我跟着同事开始慢慢学习。发现要做好一个数据科学家,要数据、算法、工程三个点都要做得很好。我每天做的事情,就是处理数据、想工程模型、搞算法,最终把这些东西综合起来,形成有价值的方案,报给上级。
公司和学校比,很多解决方法的思维和路径是不同的。比如我们拿到一个项目需求,一般在学校的操作手法是,做一个算法规则,输出一套体系,让大家用一下。但是在公司的场景,就需要首先去了解业务,知道这个项目需求在整体的业务流程中扮演的是一个什么样的作用。
另外,在学校的时候,有人帮你处理干净的数据集。但在实际的业务场景中,拿到的很多数据都是“脏”的。所以数据清理是我们每一个项目中都要做的事情。算法层面,你可能会懂很多fancy的算法,但在实际的业务中,能落地并且有可行性的可能是更加偏基础和偏应用型的算法。这也需要我们做一个取舍和适应。最后研发完成之后,研发的方案在工程上有没有可行性,工程的对接,上线发布的措施,之后是否存在迭代风险的实施方案都需要考虑。
之前不是学计算机的,进公司之前的工程能力是一张白纸,完全不会,用到什么,就要立即学会。周末和平时不上项目的时候,会比较体系化地去学。在创业公司会有一种很独特的场景。有时候,你会发现公司的技术合伙人站在你背后看你写代码,你写错的时候,他会戳你不能这么写。很紧张,但也让人进步很快。
加入公司一年半,最具挑战的事情是工作内容的转变,从仅仅完成leader交付的数据任务,变成了一个小项目团队的负责人。这逼着我需要从单纯地考虑自己要交付的任务变成要去考虑更加宏观的局面。
Q&A TIME:
Q: 请用一句话形容数据科学家的工作。
Simone:
数据、工程到算法三条线,都能以比较实际的方案去输出,并能落地到业务里,创造收益和价值,这样才叫数据科学家。
Q: 工作中最有成就感的事。
Simone:
从自己手里交付出的每一件工作成果都是保证质量。
Q: 对想做数据科学家的小伙伴说的话。
Simone:
希望刚进这个领域的小伙伴能脚踏实地,有耐心做基础的数据处理的准备工作,不要急躁,在基础做扎实的前提下再寻求自我突破。

Yiming 数据分析师
密歇根大学安娜堡分校硕士 丨 区域与城市规划
#言语不多,思维缜密的深沉派数据分析师#
来公司之前觉得数据分析师做复杂模型的。进公司之后,发现解决客户的问题是更优先的任务,方法的复杂度是次要的,最重要的是高效。
要做好数据分析师,需要扎实的基础和细心。首先,对统计学和机器学习方面的方法论有一个基本的了解。然后动手能力要强,能把想法通过代码去实现。另外,在工作态度上要细心,同样一件事情两个人来做会不一样。有的时候对数据的处理有没有考虑到位,比如,数据清洗有没有清洗到位,把不该去掉的东西去掉了。在建模的时候,有没有考虑周全。不细心的话很容易导致返工。
来公司一年半,已经做了7个项目。成长方面最大的是在思考问题的时候不单纯从技术方面去想,而是从解决问题实际方面去想。另外因为是在创业公司,能接触到的内容更广泛,有更多的机会学习到新的东西。
项目做好了,交付给客户,客户对我们的肯定,让我挺有成就感的。
Q&A TIME:
Q: 请用一句话形容数据分析师的工作。
Yiming:
通过数据,从数据中发现价值,来解决各类型的问题,这样一种职业。
Q: 对想做数据科学家的小伙伴说的话。
Yiming:
在氪信,没有复杂的人事关系,主要看能力,有多大的能力就有多大舞台。

Sally 数据分析师
新加坡国立大学硕士丨商业分析
#加入公司半年中接触了4个项目,探索了不同的业务领域#
刚毕业时我在新加坡工作了半年,后来回国找工作,我就希望工作内容是我喜欢,能真正学习到东西的。看我们公司的时候,发现氪信做金融方面用人工智能,有数据有建模,是我喜欢和擅长的。大公司也是数据分析师的岗位,进去就是分到一块业务,每天做excel的任务,整体接触的模型比较少。在创业公司做数据分析师,能接触到不同的项目,每个项目是对不同业务的理解,眼界会越来越宽。
要做好数据分析,背后最重要的是对业务的理解。数据是有结构有逻辑的。怎么才能整合数据,每个行业的数据逻辑和重点都是不一样的。要知道业务是怎么样的,才能知道如何正确地处理数据。
作为一个行业新人,很幸运我有一个很优秀的mentor。他会密切的关注和指导我,但也会给我更多的空间。让我有思考的空间,发现更多的可能。我有问题的时候,他会给明确的答复,也很有耐心。他会说你不懂可以一直来问我,我会一直教到你懂。
我们公司的氛围和整体的管理很灵活,但大家不会摸鱼。大家对自己的工作是有热情的,没有任何其他想法,只是单纯地想把项目顺利地做好。能感受到大家工作的热情,不需要过多的约束。
我觉得在我们公司这半年的体验,更多是在创造。数据只是一种媒介,工作是在创造一些东西。比如有些客户在探索新的经营模式,我们用他们的数据帮助他们一起去创造新的业务模式。
Q&A TIME:
Q: 工作中最有成就感的事情是什么?
Sally:
看到自己做的项目,变成大家生活中用的东西。去年给一个客户做了App的改版,现在看到大家都在用,有一种孕育出了新生命的感觉。
Q: 新人该怎么跟数据打交道?
Sally:
洗数据、搭模型、验证、测试这个流程跟做菜一样。数据是原料,清洗数据相当于洗菜,做模型相当于炒菜。这道菜,先洗什么后洗什么,什么时候切,怎么切怎么炒,最后才能做出一道好吃的菜。
Q: 对想做数据科学家的小伙伴说的话。
Sally:
一定要选自己喜欢的事情。之前我读书的时候我们boss给我们的建议,不要过多追逐钱这种外在的因素。第一份工作最重要的是选自己喜欢的事情,感受到激情和快乐。
如果你对这个职位有兴趣,请关注“氪信科技”公众号
(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除。市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。)
原创文章,作者:陈晨,如若转载,请注明出处:https://www.kejixun.co/article/488585.html