【E2E】需求及产品设计

嗷!但凡是个要自己来写的东西,除了学习的目的以外,那肯定就是有需求驱动。


需求:尽量节省不必要的人工时间浪费,高效出表!


设计规划:

① 已有文件类型:OA导出的工单Excel文件

②计划使用工具:Python(Pandas, openpyxl, Pyecharts)

③思路:通过汇总问题标题可能性对标题进行识别,提取对应平台到对应列,实现自动平台识别。手工填写问题工单解决类型,通过Excel计算函数批量输出对应平台及类型的问题数量,最后通过Pyecharts生成数据展示的html。


难点:

① 对于平台提取,不同的工单提交人对于一个平台会有多种叫法(比如淘宝,有:淘小店,淘系,天猫,手淘,淘特等称呼),对于这种情况,需有一套对应的清洗流程,先识别到工单提交人所写的平台,然后再通过识别到的数据进行比对修改,如有命中,则进行平台名的覆盖,从而达到只要标题有,就能准确识别的目的。

② 对于平台名字的部分重叠问题,有些平台是有部分名称重复的,在第一次识别工单提交人写平台内容时,有一些时候,标题写的是:天猫超市一盘货,但是由于有天猫这个称呼,从而导致识别为天猫,而不是天猫超市一盘货,对于这种情况,应该降低【天猫】这一个识别词的识别顺序,这样,【天猫超市一盘货】如有命中,则不会遍历到【天猫】。

③ 上述所说的都是逻辑上的难点,这个难点是程序总体是否要做成整体,还是拆分进行执行。(或者做个GUI?)讲道理GUI最后肯定是要做的,要不然谁没事想跑个东西还要开IDE呀。就目前情况还是先拆开做,说白了还是懒(main里写个#会累死我)

④ 数据生成了,通过pyecharts生成html的时候具体的业务场景都有啥?对汇总数据做一个数量的统计,对涉及平台做个统计,对解决类型做个输出,没了。

⑤ 后续还需要做系统对接数量的输出,这部分该如何做(标题实在是没法详细展示问题具体类别,亦或者说要清理的量或者是要筛选的字段实在是太不固定,要做其实也能做,等我学了系统对接再说hhhh)

【E2E】序

嗷这是一个我入职不到三个月的时候,领导对我们技术支持小组提出的一个OKR。

事情是这个样子的,小组组长说:咱们组有研发也有技术支持,和其他的小组构成不太一样,其他小组的OKR都是研发相关的,咱们组除了这部分以外,还有你和婷姐两个技术支持,咱们对于CRM(OA)工单方面需要作出一些东西来,从工单角度反映出研发的不足和问题,推动代码质量blablabla……总之,需要对CRM(OA)的工单做统计,直接用Excel来展示就行了。

我当时心想,唉,每天工单都学不完呀(刚入职没多久,平台的东西很碎,不好一下子全都掌握,业务线太多太杂),但是组长的话又很有道理,研发有研发的OKR,技术支持没有的话岂不是开问题?!那就干吧!

于是,有了初期的构想:用Excel,然后人工去OA里面把问题种类一个一个的数出来,然后再汇总到一起,当时工单还没有现在多(现在是8月,当时是3月份,怀念当时的工单量TAT),因此还有些时间能够做这个Excel,因此就纯手工的做了一个Demo,记得当时因为这一个Excel,花了大概两天半的时间,总算是统计了一周的数据,数据细分从平台到问题类型到问题解决类型,都统计了一下,然后做了排序,显示出了各平台的问题占比。

那个周五(3月26号),我作为刚入职一个月的新人,第一次因为业务而在整组30人的周会上面给大家讲我的这个表格,一丝激动,一丝害羞,外加九十八丝的胆怯,颤颤巍巍的把表格讲完了,大组领导说,做的不错,但是还是有要改进的地方,之后让我再想想怎么优化。

这可好,我的工作成果得到了肯定,心里当然是很高兴啊,努力统计了两天半,眼睛差点瞎了的工作成果总算是没白费啊!NICE!

初期的样子是这样的:(数据涉及公司隐私,最终统计展示就马赛克咯)

怎么说呢,当时对于这一个表格,真的是废了好大的心思,反复翻看OA,一个一个的录入,然后做排序、汇总,最终出这么一个看上去简陋的Excel。

公司的同事挺nice,领导也没有说我这个Excel太烂了什么的,总之这个汇总的计划就被定了下来,但是我心想,如果每一次出一次数据都要这样纯手工,那自己还能有什么时间来工(mo)作(yu)呢?(PS:后来的时间基本上已经完全被工作充斥,从早九晚六变成了朝九晚八,得亏当初学了点,用上了自己的知识)

总之,一个半自动的小工具在我的脑子里面逐渐构思出来了。