数据科学管理中的7个任务

各个行业的大多数公司都在不断将数据科学用于企业实际运营和生产活动中。无论企业大小,数据科学家的数量在不断增加。数据科学团队的规模和复杂性也随之增加。但是据报道,与此同时只有极少数(22%)的数据科学项目获得高利润回报,大量(60%到85%)的大数据项目失败了。这就引出了一个问题:如何应对管理数据科学团队的复杂性?

我在本文中期望阐明:

1.定义什么是数据科学管理;

2.对促进数据科学文化提出建议;

3.描述数据科学经理的任务;

4.概述公司对数据科学经理的需求;

5.并浏览一下如何找到合适的人选。

 

北极星OKR知识库官网-数据科学管理中的7个任务插图

 

什么是数据科学管理?

数据科学家是训练有素的信息科学家,统计学家,自然科学家,社会科学家或数学家。有些人甚至将数据科学作为独立的学士或硕士课程学习。他们解决问题,挑战墨守成规,不断取得进展。他们提供了对复杂过程的详细分析意见,处理巨大的数据集并解决了以前未解决的问题。它们以多种方式帮助节省时间,自动化流程并构建未来。但是在某些情况下,他们往往热衷于解决问题,以至于失去了专注力。这正是数据科学经理开始工作的时候。

数据科学管理不是数据科学,而是管理的细分。聘用数据科学经理帮助实现公司的愿景并达成公司目标。为此,管理人员需要赋能员工,鼓励团队,引导并激励这些人。使他们拥有所需资源帮助他们完成任务。如果他们可以避免对团队进行微观管理,而是将精力放在更大的视野上,则他们的工作效率最高。而且,他们至少需要对数据科学的基础知识,迭代项目的性质以及大多数数据科学家的学术背景有基本的了解。首先,数据科学经理需要在各个方向上都成为良好的沟通者。

总而言之,我们对数据科学管理的理解如下:

数据科学管理意味着组织一个迭代过程,该过程利用科学方法从数据中提取知识,并追求高度自动化的软件基础结构以达成业务目标。

公司为什么要操心数据科学管理?

数字化和数字化转型已经影响了许多商业模式。颠覆性技术使以前成功的业务案例成为过去。许多企业必须专注于成本效率,于是需要进一步的流程优化。由于许多行业已经非常高效,因此只有自动化,优化和潜在潜力才能节省成本。自动化生产了大量数据,这对于现代数字机器也同样适用。此外,还可以访问来自不同上下文的许多其他数据源,例如社交媒体,天气预报甚至竞争对手生成的数据。

为了获得竞争优势,公司需要释放各种数据源的潜力,并将它们融合在一起,以获得更多更好的知识。在许多情况下,人们认为越多的数据越好(“大数据”),这并不完全准确。真正需要的是与其他数据集具有正确关系的正确数据。这通常称为“智能数据”。智能数据专注于数据(包括大数据)的集成和准备并用来提供真实的商业价值。

如今,许多公司正在招聘数据科学家。雇主与雇员的关系有可能对两者都造成幻灭:在数据基础设施和设施方面,公司往往没有为高技能人才做好准备。他们过分落后,无法使数据科学家适应正确的环境,因此他们无法发挥自己的潜力,尽管他们是昂贵的劳动力。另一方面,有时数据科学家在这样的环境中会受到挑战,并且会感到无聊。当他们从事技能水平以下的工作时,他们会感到沮丧。结果,数据科学家没有创造力,也没有挖掘公司的潜力。这些条件具有双重影响:公司拥有昂贵的数据科学家,却无法发挥数据科学在企业应用的潜力。

促进数据科学文化

理想情况下,数据科学经理会事先了解所有情况,能够在雇用数据科学家之前为公司做好准备,并且让数据科学家处于最佳工作环境中。

数据科学经理应该事先做好下述工作:他(她)必须能够确定公司中即将出现的问题,以便数据科学家需要对事物有不同且更深入的关注。它们消除了障碍(尤其是在数据可访问性方面),并促进了主题领域之间的交流。由于数据科学是一项团队工作,因此数据科学管理人员持续鼓励鼓励人们,以增强他们的团队精神。

最后,数据科学经理应具有一定程度的自由度。由于他们在一个不断发展变化的领域中工作,因此他们应该拥有参加会议和工作组会议所需的适当资源。这些东西应该被视为高级培训。公司应将经理视为一种工作组,并避免进行微观管理。数据科学管理者不是数据科学的额外负担。数据科学经理是正常进行数据科学的大使和推动者。

数据科学经理的日常工作任务

当涉及到数据科学经理的日常业务时,某些任务和工作是重复发生的,需要加以跟踪。这些步骤与典型软件工程项目中的步骤虽然类似;但是,在某些方面还是有很大不同。

1/需求管理

在大多数数据科学项目中,第一步是与利益相关者交谈并找出他们的需求。这主要是关于提取信息并了解现实中的业务问题。重要的是要弄清楚期望,并最终找到对这个问题的答案:一旦数据科学项目成功完成,对利益相关者会有哪些变化?

然后,记录下来的需求需要转化为数据科学家的分析任务。这些任务必须分解成易于完成的自任务。技术或科学深度便于与数据科学家讨论。这可以通过将所有项目放在待办事项中并编写用户案例来完成,这在软件开发中很常见。

2/时间和资源

处理复杂的问题通常意味着处理不确定性。同时,需要降低复杂性,以便对项目预算进行估算,从而对可用于支出的资金进行估算。对于有关人员而言,通过估算时间和精力将价格标签与用例挂钩但是,处理复杂问题意味着处理各种未知事项。最佳实践是根据不确定性程度在计划中放置时间缓冲区。软件开发中常用的一种方法是把所有的不确定事项列在一起进行排序。

那些将正确的技能带入项目中的人员至关重要,还要保证他们充分的时间发挥作用。在此问题上,重要的是不要使人们负担过多的项目。他们从事的项目越多,由于任务切换成本而浪费的时间就越多。由于任务切换,每个额外的项目损失了大约20%的工作时间。例如,如果一个人只有一个具有特定技能的人可能无法工作或离开公司,则可能会对整个项目构成风险。另外,需要事先弄清楚数据的可访问性。没有什么比数据科学家或其他团队成员无所事事地闲着等待他们所需的重要数据更没效率了。

下面几个问题,奠定获得时间和资源的概览的良好起点:

团队:需要哪些专业知识?是否有合适的人选,他们是否有足够的时间来实现该项目?

数据:哪些数据可用(内部数据,开放数据或购买数据),并且可以根据这些数据来解决分析问题?是否有必要进行数据收集(例如调查)?

基础架构:每个人都适当配备了软件,硬件和云资源吗?

上述问题有助于找到项目初期没有想到的利益相关者。此外,它可以阐明还有谁需要成为项目成员(例如,IT或法律部门)。

3/晋升

项目的进度和结果必须以允许每个人都以同样方式呈现给利益相关者。数据科学经理需要为不再是一维的各种问题做好准备:随着产品或解决方案的发展,人们倾向于更加严格的审查,因为他们可以在需求组合中使用比纯粹的想象力更多的感觉。

因此,有时对早期结果进行总结会很有帮助,例如在Scrum中使用冲刺模式。在许多情况下,利益相关者的正确参与很重要,因为将来还会有项目。如果利益相关者对结果和参与感到满意,他们将来很有可能会更加慷慨大方。

4/框架和环境

让我们回到团队。每个人都需要了解项目的路线图,愿景并了解时间表。这包括对正在发生的事情有深刻的理解,如果事情偏离轨道,则有义务大声说出来。破坏别人的乐事是困难的工作,特别是对于喜欢解决问题并在深入研究时迷失方向的数据科学家而言。但是有些问题并不在业务范围之内。在这里重要的是要表现出同理心并解释为什么还有另一个重点。

5/促进沟通

只要对项目有利,促进数据科学家,利益相关者和其他潜在参与人员之间的交流是每位数据科学经理的一项基本任务。最重要的是,需要支持各方之间的交流,达成注入在流程,方法和目标上的共识。

6/团队隔离

尽可能将问题与数据科学家隔离,以确保他们拥有最佳的环境来完成工作。设置“编码天”或预留早上的时间来集中精力工作可能会有所帮助。

由于需要与利益相关者一起完善任务和要求,现实中可能做不到团队隔离。数据科学经理经常并不掌握的所有信息,这就是为什么数据科学家需要参与会议的原因。

根据生产者(团队)和经理(数据科学经理和大多数利益相关者)最有效的时间表进行区分。尽管数据科学经理和利益相关者按小时间隔做计划,在会议室之间穿梭,但是这是团队成员最不想要的事情。他们通常需要很长的时间间隔(4个小时以上),以保持不间断地工作。不间断的意思是不间断-即使是良性的5分钟的谈话也可能是毁灭性的,需要20-30分钟才能使团队成员恢复正常。

7/项目管理要点

在大多数数据科学项目中,也必须考虑管理要点。一旦确定了时间和资源(见上文),便可以制定时间表。不同的项目管理方法,或多或少影响时间表的准确性。下列任务是必不可少的:

•跟踪目标,监控总体进度并控制财务资源;

•确保过程和结果的质量;

•管理文件,待办事项清单,董事会和会议;

•注意休假,病假和高级培训时间;

•让团队开心!

如何找到数据科学经理

“来自软件工程或业务方职能部门(财务,会计等)的经理可能在理解数据科学家和定义其项目工作方面遇到困难” 。

管理数据科学与管理资产或资源不同。除硬件和软件外,最重要的是人。在数据科学中,大多数人都有学术背景,并且经常从某个研究领域获得博士学位。这不同于传统的软件工程或大多数其他业务部门。如此高的教育水平通常在意义,责任,参与和薪水等方面都对就业条件提出同样高的要求。数据科学经理也是如此。

即使一些大学开始培训数据科学管理人员,但要广泛确立新的描述职位的概况,可能还需要花费几年的时间。同时,聘用数据科学经理通常意味着要聘用一个在其前职业中具有高度专业知识的人,并希望扩大他或她目前的工作重点。实际上,这意味着要聘请对沟通和管理技能特别感兴趣的书呆子-当然,这种技能组合是极其罕见的。

数据科学经理应该理解分析性思维,科学方法论,演绎推理并善于处理复杂任务。此外,他或她应该足够聪明并且有足够好奇心。数据科学经理是一个能够在客户或管理委员会面前进行讲演,同时也能在其团队中享有很高的敬意的人。

概括

对于希望通过数据驱动的决策来改善业务的公司而言,数据科学管理非常重要。这意味着要组织一个迭代过程,以科学的方法和高度自动化的软件基础架构从数据中提取知识,以追求业务目标。数据科学项目的最佳实践方法包括需求管理,时间和资源的管理;向利益相关者推销项目以及并对指导团队工作。此外,数据科学管理是沟通的促进,为重点工作和项目管理要素建立隔离。

到目前为止,分析性思维,编程技能和理解数据科学已经成为业务发展的重要组成部分。对于许多公司而言,他们一定会开发基于数据挖掘和数据分析的数字业务模型。由于数据驱动型业务模型的发展是一个复杂的过程,有许多障碍,因此培训或雇用数据科学经理是明智的。数据科学管理将在不久的将来成为独立的工作。

原文链接:https://towardsdatascience.com/the-7-tasks-in-data-science-management-b01f2a48c846

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注