数据分析项目是什么?该怎么做?
很多做数据的同学都有这个强烈的心声。每天机械地跑数,完全不知道数据有啥用的状态确实很不好。大家都想有个独立负责项目的机会。
然而,很多同学心中充满疑惑:
● 什么是数据分析项目?
● 为啥我在公司里没见过数据分析项目?
● 我在网上百度了泰坦尼克、淘宝电商、美国信用卡的代码,ctrl C+ctrl V一遍,算不算个项目?
今天就从第一个问题说起:什么是数据分析项目。
01什么是项目
项目本身的含义是:在特定时间期限内,将人力、物力组织起来,达成特定产出目标。这一句话虽然简单,却带出了项目三大关键维度:时间、成本、产出质量。这三个维度,就是俗称的“项目铁三角”(如下图所示)。
图片
之所以叫项目,是和常规工作对应的。
● 项目:特定时间,特定人群,特定产出。
● 常规工作:每天都干,固定一群人,干完就行。
你看同样是铁路,做老铁路的养护,兢兢业业一辈子也没人知道;但是新建一条线路,必定是张灯结彩,锣鼓喧天,鞭炮齐鸣。我们都喜欢做项目,不爱沉溺在常规工作里,大致也是如此。在企业里有些部门项目很多,经常动不动搞个大新闻,有些部门项目很少,就只能忍气吞声了(如下图)。
图片
02什么是数据项目
灵魂拷问:数据在公司里的地位,更像 【单选题】
- 销售
- 运营
- 品牌
- 供应链
一个残酷的真相是:虽然老板们嘴上嚷嚷的“大数据”“人工智能”“数字化转型”,但是在大部分企业里,数据更像供应链。虽然大家嘴上都说这玩意很重要,是未来,是趋势。可到头来,一你不能为公司挣钱,二你是服务其他人的脏活累活。
这种尴尬处境,就注定了数据的地位高不到哪里去。地位稍微高一点的,是可以直接拿数据挣钱(比如出售数据、数据服务的咨询公司、第三方服务公司、互联网toB产品)或者等着数据圈钱(招一堆程序猿,向VC爸爸证明自己是人工智能大数据公司)的少数企业。地位不高,自然分配的项目就少了。
03什么是数据分析项目
分配项目少的核心表现是:数据的工作一但拆开,就通通变成日常工作。
图片
是滴,写代码的又不是他们,他们完全理解不了“接一下那个数据”七个字背后,你到底得付出多少努力。这一点还比不上供应链呢,至少大家看到堆积如山的物料,会觉得他们辛苦。大家看数据的眼光,更类似家里的老妈子:“你一天天对着电脑在弄啥呢”。
因此,数据类工作想要立项,就只剩一种办法:毕其功于一役!在一个跟数据一点关系都没有,但听起来贼牛逼的名字(是滴,说的就是商业智能)的包装下,把上边这些脏活累活打包全干了。
其中最为合法、公开,有存在感的,莫过:带数据大屏的BI项目。无数传统企业的数据部门,就是靠着做大屏项目博得老板欢心的。
图片
当然,这种局面在这两年有变化。阿尔法狗一声汪汪,给无数老板们带来了人工智能的希望。当面对解决不了的问题的时候,人们总寄希望于某个自己耳朵听不懂、别人口中很神奇的力量。在过去是《周易》铜钱八卦,在现在是人工智能算法。于是很多算法项目纷纷上马。
实际上,在自媒体大肆炒作之前,就已经有很多利用算法改进业务的成功案例,比如通过算法识别违约风险,提高外呼成功率,提升用户点击率,预测用电数/话务量,等等等。
但这些应用有着非常严苛数据质量和非常明确的应用场景。并不是说随便捞几条数据丢进模型一弄就有效果的。更不是说脱离管理制度、资金投入、基础建设、业务配合,只要代码一运行钞票就从屏幕里喷薄而出。于是很多贸然趟进算法浑水的项目都悲剧收场。
不过没有关系。很快,大家就找到了新的自己耳朵听不懂、别人口中很神奇的力量:数据中台!于是重新的一轮眼见高楼起,眼见高楼塌又在2020年开始上演。
04数据分析项目的症结在哪里
站在项目铁三角的角度,对比数据和其他项目,症结非常容易看到:
图片
即使是数字本身,也很难体现价值。比如原因分析,即使不看数据,业务自己也能猜到几条原因。如果仅仅局限在业务提一个假设数据验证一个,那就跟叼飞盘的汪子没啥区别。虽然自己跑得辛苦,人家还认为你就是个打杂的。
以上,才是数据分析项目立项少,成功难的本质原因。当然,更要命的是,很多新人意识不到这一点(特别是研究生刚毕业,写了几篇名字高深的论文的)。他们炫耀着自己的图表、模型、代码,像一个在班里炫耀新买的变形金刚的小学生。内心满满的:“我好厉害吧”。忽视了真要运货,最普通的翻斗车都比擎天柱大哥强。
想破局,还得紧紧抓住项目铁三角:
时间
平时建立监控体系,把劳动力从临时取数解放出来。
基于日常数据,积累经验,捕捉战机!
在关键时机引发业务危机感,承接独立负责的项目。
成本
平时尽一切可能推动数据质量改善。
在时机合适时推动数据基础建设前进。
每次项目考虑最少数据,最简单模型解决战斗。
质量
基建类:多做从0到1的工作,填补空白,彰显成绩。
方法类:建立推理逻辑,带着业务的思路走,做教练、不做老师。
建议类:提100个假设,撑爆业务的脑袋,掌握输出成果的主动权。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341