目录
「一线」:新人和老人关于数据思维的50个区别
「数说」:我在B端做数据分析
「准绳」:2022,【算法】属于人民
「彩蛋」:
二零二二
新人和老人关于数据思维的50个区别
「10多年前自己以新人的身份开启数据生涯,现在算是一个数据老人了,与当初的自己相比,现在看数据的视角发生了很大的变化,这里列出了50条关于新人老人在数据认知上的可能的差异,希望能带来些启示。」
(为了排版美观,我将原文整理成了下列表格,方便观看,画幅受限,点击图片可放大。编者注)
文章转自与数据同行公众号,作者傅一平
链接:https://mp.weixin.qq.com/s/Qq6ZejiaEO7iHb-i3rGYNg
以上是一家之言,有机会跟大家聊数据治理、数据技术的新老人的思维差别!
我在B端做数据分析
数据分析工作就是从一堆看似杂乱无章的数据中找到有用的价值,工作也是如此,越做越清晰。本文作者从他过去的B端数据分析工作中总结经验,和大家分享,一起来看一下吧。
一、写在前面
最近也越来越喜欢Dambisa Moyo的这句话,
“The best time to plant a tree was 10 years ago. The second best time is now.”
我是西索,距离2011年6月22日,到现在是真正意义上做了十年数据分析,十年前没有种好树,十年后我想重新开始积累。工作之后的前两年是面向于C端的零售行业,余下的八年都沉浸在B端领域里面,研究数据增值、变现的场景。
二、为什么要写这篇文章?
前一阵子在[一个数据人的自留地]群里发了一个问题:
对于to B的公司,要不要做企业画像? 如何做企业画像? 结果一石激起千层浪,大家讨论非常热烈。原来一直以为用户画像在to C的公司用的比较多,没想到服务B端的企业也有这么多人在关注,大家一致认为企业画像是有必要的。然而大家的分歧在于:如何做?人肉做,还是大数据,是否需要用到大数据?
和simba大佬聊完之后,大佬出了一系列文章,分享了如何做B端的画像。看完之后产生了一些感触和想法,C端的分析案例一搜一箩筐,但是B端的案例是真的少。
simba:一篇文章让你掌握企业画像
老实说,数据就是一团浆糊,越搅越糊,至今还没怎么真正把数据的价值和意义搞懂,每天一个踩坑知识点,过山车一样的刺激,懂的人自然懂。于是就想把过去在B端里面的分析场景整理出来进行分享,一方面给过去这十年做一个简单的复盘,另一方面也看看能不能得到一些共鸣,产生新的idea,欢迎私信来交流。
做数据,欲速而不达,慢就是快,需要稳扎稳打把脉络理清楚,后面在应用的时候就会清晰很多。
三、B端的数据,得看的远管的宽,才显专业
在B端做分析,时刻记牢的几个关键要素:“营收”、“影响”、“知名度”。
首先必须是“营收”,区别于C端消费,B端的决策周期长,从触达到产生订单之间的过程很难做归因,对数据而言,获取线索比直接看;
然后才是“专业”,需要对生意、行业、企业经营、业务(市场、营销、供应链仓储物流、商品、运营、客服、研发)上的概念有比较全面的了解,否则很难和业务保持在同一个沟通层面,很容易被评价为不懂业务;
再后就是“方法”,在B端如果能往外延伸触达到客户,所接触到的对象非富即贵,不是老板就是高官,不同的场合下用的“道”、“术”、“器”都进行区别,变则通,见人说人话,见鬼说鬼话;
3.1 这些B端业务上的一些核心业务指标,老板们都喜欢看
合同金额、付费用户数、付费转化率、用户客单价、用户流失率、商机线索量、市场占有率;
3.2 这些B端业务上的一些主要分析场景,领导们都喜欢听
面向市场的竞品分析,帮助营销找线索,竞品的主要客户群体、竞品的客户群体特征(区域特征、行业特征)、竞品客户群体的财务情况、目标客户的背景、目标客户的喜好;
面向客户的运营分析,帮助客户找它的经营问题也是平台的切入点,客户的整体市场规模、主要客源渠道分布、主打产品的地域差异、潜在的市场机会;
面向产品的用研分析,帮助产品快速定位提升优化体验,产品使用过程中的埋点行为分析、用户获取留存和流失、核心业务链路的使用情况监控;
面向管理的经营分析,帮助管理层更好的了解业务线现状,从财务分析的视角研究业务上的商业数据模型、多业务视角下的业务分析报告、新增市场新增产品新增用户研究;
面向质量的问题分析,帮助所有人认清客观的事实,从客服角度触发,把用户的诉求、投诉、建议、反馈等信息和业务数据串联起来,从用户视角去剖析产品、业务环节的质量问题;
本文转自人人都是产品经理 作者 @郑小柒是西索啊
链接:http://www.woshipm.com/data-analysis/4862152.html
3.3 这些B端业务上的一些主要算法场景,同事们都喜欢吹
基于标签的推荐算法,需要根据标签、用户偏好、商品信息建立混淆矩阵,召回商品集合,生成差异化的规则和策略;
基于商品的类目预测,需要从商品的类目、品牌、型号、规格、属性等信息,建立分类模型;
基于交易的趋势预测,需要从市场大盘、行业趋势、单品交易等维度,建立预测模型;
基于市场的供需模型,需要从供需双方的频次、需求量、供给量等层面,建立供需模型;
基于用户的漏斗分析,需要从渠道来源、访问、页面浏览、模块点击、加购收藏、点击支付等链路,建立漏斗模型;
基于运营的画像分类,需要从用户、商品、交易、行为、风控、市场等粒度下,对用户建立标签;基于路径的最优模型,需要对地理位置、行车路线、配送路线、仓库建设等场景,建立基于时间、空间的最优模型;
基于风险的风控模型,需要从履约、违约、诉讼、行政处罚、刑事处罚等风险场景,建立风控模型;
基于客服的语义模型,需要对用户诉求、电话咨询、机器人问答、人工客服等场景,建立NLP模型;
四、说下B端常见的一些用户分类
对于绝大多数B类用户的研究,接触到的对象一般都是以中小型的B端公司为主;只有在KA用户里面,有少部分是真正大规模的企业、品牌商,这类公司的组织形态又极其复杂,可能所对接的业务只是贵司其中很小的一个模块而已。
五、说下B端常见的业务类型
产品是B端业务的根本,市场开发是业务营收的关键,而服务是业务稳定增长的核心。
做产品,深挖客户需求形成产品建议,包装产品方案进行技术演练,丰富产品适配场景提高通用性;
做市场,对线上线下营销活动资源进行整合,建立线索的收集、反馈通道,快速感知用户的诉求,并提供产品应用解决方案;
做服务,保障产品实施交付,提供同步的指导培训,复盘客户业务现状、应用实践案例,形成业务解决方案,以驱动产品和营销方案的升级,促成用户续约;
通过服务扩散产品价值增益,维护老客的稳定接触,建立市场口碑,吸引更多的新客户。
六、对比B/C端数据的一些特征
不同的业务下,产品模式不一样,在结果体现上区别就会更大,以至于有很多业务线上的数据量级极小,甚至于根本谈不上大数据分析,就更谈不上所谓的算法和工程。
需求层级上:因为是垂直领域,对接的也是企业级之间的供给关系,所以从动机上来说,考虑更多的部分是商业模式和生态玩法,而不是单一的购买意向;
数据量级上:没有C端规模那么大,无论是用户群、产品使用、流量、需求;
产品架构上:受制于用户群体,B端的产品分类目标导向性会比较强,工具类型产品、平台类型产品、服务类型产品;
画像分层上:做的好的B端企业一定都是垂直细分领域,所以用户群体相对单一,画像更多的是在细分用户的精准性区别上,标签多来自于产品和系统本身;
合作方式上:B端之间的合作一旦达成,往往都是强依赖关系,具象一点,拿交易举个例子,C端消费的交易达成一般是订单,B端合作的交易达成可能是订单、也可能是合同、还可能是商业合作(短、中、长);
盈利模式上:B端的盈利模式,服务费、佣金、返点、合作费用、广告投放费、会员费、线下活动入场费、培训费、咨询费等;
决策模式上:B端明显会偏向于多人决策、关键核心人决策,找准人找对人才是关键;
七、用户-业务-产品-数据,才是好的链路顺序
通过下表,对比下B端和C端之间的场景差异。
7.1 用户差异
7.2 业务差异
7.3 产品差异
八、社会才是最好的大学,都会有起有伏
每个人在离开学校,踏入社会的大门开始,都会经历很多个成长周期。在传统行业的产品管理中,有产品生命周期的一套理念,套用到职业生涯,应该也是可以的。
7.5 数据差异
e.g 以salseforce 为例,对于它的产品周期:
1. 最早提出SaaS的模式,这是一种全新的商业模式;
2. 后来以CRM 为突破口,建立了一个完整的以客户为中心的,售前(营销)、售中(销售、履约)、售后(客服)全链路的软件服务,可以看出他的产品就是围绕商业模式展开,战略就是围绕客户开展的一系列工作流程。
3. 到现在云计算, 促使他产生了几朵云,营销云, 销售云,客服云,而大数据又促使ta产生了 分析云,AI 又产生了AI 客户之类的服务;
7.4 行为差异
投入期,创新能力最重要,这时要考虑打造专利护城河;
成长期,销售最重要,持续打造规模效应护城河;
成熟期,利润最重要,持续打造网络效应和品牌护城河;
衰退期,成本最重要,用迁移成本减缓产品的衰退。
有一阵子,内心浮躁,无所事事。领导说有机会就跟着市场、营销、工程的同事去接触接触业务,如果可行,以后转型也方便。后面就跟着事业部的业务同学去拜访客户,到用户现场参观,了解产品是如何在用户公司使用的,到一线听他们的吐槽(大部分是骂声)。人间清醒是客户,付了钱,产品哪里好用、哪里有问题,意见反馈、客服电话打了一通又一通,这些都是从结构化的数据里面看不出来的。
有种说法是说客服才是一家公司最懂业务的人,只要他们想,随时可以去挑战任何一个产品、技术和业务!
在B端用户分析里面,很多时候通过数据分析在异常上找不到的原因,在用户现场指不定就茅塞顿开了。为什么这个用户原来很活跃,一个时间点之后,它就不活跃了,因为它的业务主体发生变更了,老板原来的确是做这个细分板块业务的,有一天他朋友来合伙投资,整体业务方向就变了;为什么这个用户的营业额突然就下降了,因为他们家老板又开了家子公司,还是同一拨人,当地有小企业扶持政策,还可以免一部分税;……这些部分都离不开对细分行业的了解,随着业务知识的增加,会更合理的看待数据,以及对数据中对异常做解释。
鉴于对产品、业务、用户有了更深层次的理解,再回过头来看数据,认知面就会不太一样。
十、认识用户,了解用户,切勿闭门造车
熟悉业务最好的方式,是直接去找用户进行面对面的对话,高效而简洁;
其次是角色代入式的按照用户视角去模拟用户在产品上的操作,熟悉产品模块和流程;
最次是通过数据库的表结构关系、DDL,去做业务假象,通过日常需求对接,丰富业务上的知识树。
了解C端的用户可以通过区域化的抽样问卷调查,或者通过采买第三方平台所提供的画像数据,能够用样本分析的方法去对人群标签做特征拟合。但是在B端,问卷调查的方式往往是行不通的,毕竟不同性质的企业,在群体特性的差异上是极大的。用户走访,是一个在B端不得不去做的事情,选择一群合适的访谈对象,去和用户做共创、做MPV、做试点,然后把研究的结果在更大范围内进行复制、应用,避免闭门造车。
对应上面的四张图,我周边很多朋友在毕业没多久就如第一个图的呈现,起点高,偶尔有起伏,站的总归一直在高处。回看我自己的职业生涯,觉得应该比较贴切右边最后一张,职场进阶的道路上虽然曲曲折折,但是总会在一个小周期之后能得到突破。
九、入门难,深造更难,不要沉迷于工具带来的爽感
不得不说,初入职场的前几年,特别沉迷于数据本身而不是业务,以及对各种数据处理技巧的深层次研究,用VBA、R、SPSS、Python不同的软件去自研各种自动化的小工具,小有成就。
工具毕竟只是工具,就跟打游戏开荒一样,当每个模块、功能都尝试用过一遍之后,就丧失了兴趣,数据分析不过如此,几年之后就索然无味了,分析无用。当对一件事情失去了兴趣和焦点,整个人就会变得很浮躁,傲慢、漫不经心、焦躁、忧虑……以及冲动,我想辞职!
庆幸的是,碰到了一些比好的领导,都是人生中的引路人,在状态极其不好的时候,给予方向上的指导,给了很多选择。
前面已经提到过,对于企业用户,其看重的是“生意”,功能诉求为主,普遍有丰富的生意经验和复杂的业务流程,因此调研不仅要了解用户使用网上产品的诉求、意见,更需要还原用户原生行为(即线下做生意的行为,链路等)、诉求,据此对应投射到互联网产品。
因为B端的业务决策链路长,且参与角色多,所以不同的人所掌握的信息和权力都有非常大的区别,即使是同一个岗位,不同级别、不同业务分工,所负责内容,关注点的不同。比如在市场营销部门里面,总经理、总监、经理、主管,四个角色在同一事情上的视角和焦点都会不一样;而在零售类型的企业,负责电商、线下渠道、直播渠道为了一个决策所需要的信息也会大不相同。
十一、写在最后
过往面试的时候,面试官问最有成就感的事情是什么,我的回答“通过数据分析、挖掘去促成了2亿市场规模的合同达成(专项项目组)”;“面向B端公司进行定制化的数据报告实现5000万左右的数据营收(报告营收)”……我觉得这是比较感觉到自豪的。
回过头看这些年的经历,感慨万千,在过去这十年的工作经验里面,一直都是在数据分析这个title上。很想把这些年积累的一些知识内容以文字的形式记录下来,对于一个纯理科生来说,这无疑是一种挑战。后面应该会拆成很多个部分,缝缝补补,陆陆续续的完善。
“人们就是把数据上传了,我也不知道为什么。他们‘信任我’,一群傻 X(dumb fucks)。”
2022,「算法」属于人民
本文转自品玩 ,作者郭海惟
链接:https://mp.weixin.qq.com/s/nhzJZ_NKGN-y81UV4ndbXg
2004年,一位名叫扎克的大学生,正在创立一家名叫Facebook的社交网站。而“海量”的信息正让这位24岁的大二学生有点手足无措。这4000个信息中,或许就有隔壁班女孩的地址,有校园明星的照片和SNS。而这段隐喻了社交帝国命运的经典对话,后来被《纽约客》的记者写进了脸书的长篇报道里。
18年以后,小扎克电脑里的4000个私人信息,快速变成了在全球无数个服务器中存储的接近40亿用户数据。后者支撑着这个社交帝国,每年进账超过860亿美元(折人民币5481亿人民币)的广告收入。
显然,扎克伯格再也无法像看4000个信息一样,望穿40亿账户的信息。取而代之帮助他“穿透”信息的工具,叫做“算法”。不止是社交网站,在全球各地,无论是搜索、购物,还是新闻、短视频,哪里有海量的数据,哪里就有算法。
长期以来,“算法”一直是巨头们最好的助手。他帮助互联网巨头去理解用户,延长用户在自己内容社区中的使用时间,并形成海量且精准的商业投放决策。
这或许是互联网的先贤们始料未及的:我们原以为自己只是为平台让渡了注意力和时间,但没想到被一同出卖的还有自己的信息画像。而我们即便是知道了自己的信息被出卖的事实,也不太了解这些信息究竟是如何被平台利用的。
某种意义上来讲,正是那4000个无偿为扎克伯格上传各类私人信息的“傻X”,帮助扎克伯格们开启了未来十几年金钱不眠的每一个晚上。
我们确实是扎克伯格口中的傻 X。可悲的是,我们也没得选。
一边是巨大的利益链条,一边是缺少知情权和否决权的用户。算法以及算法背后的数据规范,已经成为了全球数据监管部门的关注重点。而在新年的第一个工作日,我国的算法管理规范站上了一个新的台阶。
2022年1月3日,我国的《互联网信息服务算法推荐管理规定》正式发布,后者将在3月1日起正式执行。这也标志着,在征求意见稿发布数月之后,我国第一个专门针对算法推荐的规章制度正式落地。
从实际内容上来看,征求意见稿与正式稿件略有不同。在规定方面,正式版规定有增加包括老年人权益在内的更多细节内容,并提高了对应条例的罚款标准。
一边是巨大的利益链条,一边是缺少知情权和否决权的用户。算法以及算法背后的数据规范,已经成为了全球数据监管部门的关注重点。而在新年的第一个工作日,我国的算法管理规范站上了一个新的台阶。
2022年1月3日,我国的《互联网信息服务算法推荐管理规定》正式发布,后者将在3月1日起正式执行。这也标志着,在征求意见稿发布数月之后,我国第一个专门针对算法推荐的规章制度正式落地。
从实际内容上来看,征求意见稿与正式稿件略有不同。在规定方面,正式版规定有增加包括老年人权益在内的更多细节内容,并提高了对应条例的罚款标准。
“算法中立”、“算法无罪”将变为历史
以往在无罪推定原则下,算法提供者在具体场景中往往存在“权责不清”等问题。算法进而很轻易地成为了一个虚无的权力代名词——无论是B端的流量分发、外卖派单;还是C端的内容阅读体验、动态价格体系,算法都拥有一切“说不清、道不明的”负面结果的“最高解释权”。
但算法的机制,对于普通用户来说往往是一个“玄学”,用黑箱来解释黑箱,很多事情只能不了了之。当然,相比于算法带来的模糊权责空间,算法背后“确定性”的商业收益却都回归到了平台手中。
《规定》明确提出,算法提供者需要向使用者打开算法背后的黑箱:
“应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。”“(鼓励)优化检索、排序、选择、推送、展示等规则的透明度和可解释性。”
而在算法的目的和使用程序上,《规定》也有明确的指导意见。
对于算法的目的,除了不能违反现有国家法律规定以外,算法同样不能用来进行“不正当竞争”、“诱导用户沉迷”、“过度消费”等目的,并且要“坚持主流价值导向”,“积极传播正能量”。
在节点过程中,《规定》则提出“应当加强算法推荐服务版面页面生态管理,建立完善人工干预和用户自主选择机制”,“不得将违法和不良信息关键词记入用户兴趣点或者作为用户标签并据以推送信息。”
这等于是对原先“算法无罪”、“技术中立”所带来潜在衍生后果的一个警示。
算法在实际的互联网实践中是有倾向和价值观的,而算法的所有者需要对算法衍生出来的价值观和内容负担责任。
用户将拥有更细颗粒度的算法权力
一方面,《规定》赋予了用户“拒绝算法”的权力。
《规定》要求算法提供者应当“向用户提供不针对其个人特征的选项”,或者“提供便捷的关闭算法推荐服务的选项”。而用户一旦执行关闭,“算法推荐服务提供者应当立即停止提供相关服务。”
另一方面,《规定》还赋予了用户“改良算法”的权力。
《规定》要求,“算法推荐服务提供者应当向用户提供选择或者删除用于算法推荐服务的针对其个人特征的用户标签的功能。”作为用户,我们也可以更了解系统赋予我们的“标签”,并且有针对性地进行删除选择。
* 手机淘宝上线的个性化广告标签管理
此外,《规定》还要求算法推荐服务提供者赋予用户更加方便形式监督权力,“设置便捷有效的用户申诉和公众投诉、举报入口,明确处理流程和反馈时限,及时受理、处理并反馈处理结果。”
而除了以上对算法方向上的行为规范外,《规定》也“点名”鼓励了部分“算法策略”在平台生态建设的积极作用。
如,“鼓励算法推荐服务提供者综合运用内容去重、打散干预等策略,并优化检索、排序、选择、推送、展示等规则的透明度和可解释性,避免对用户产生不良影响,预防和减少争议纠纷。”
其中也是内容去重、打散干预等,与平台长期以来扶持腰部生态、鼓励原创作者等策略长期一致,有助于整体算法平台生态的发展。
而藏在一切规范背后的问题是,谁才应该是算法的主人?
算法看上去是程序员的代码。但好的算法之所以能成立,更多来源于用户的数据和行为反馈——没有数据,就没有算法。从某种程度上而言,算法背后的基石是机器对每一个用户及其行为的“理解”。在理解的基础上,再做出对于未来行为概率学上的预判。
在过去,这种解释权和收益权都是属于大公司的。大公司如何“理解”我与我的决策,在过去对于我本人来说是一个“黑箱”。以至于大部分用户从来没有想过,如果有一天自己可以驾驭算法是一种什么样的体验?
最简单的权力行使方式是,我可以拒绝算法提供者通过滥用自己的信息获利。
而更深层次的影响或许是,未来我很快就可以看到自己在各个平台中的画像——原来B站认为我喜欢鬼畜、抖音认为我爱围观社会热点……
而如果未来平台真的可以让规则机制变得透明、可以把算法权力让渡给用户,进而让用户可以决策自己的内容偏好。那么,我是否可以值得一个我更喜欢的、脱离了简单低级趣味的算法内容产品?
这或许还没有那么快能实现,但至少有一点是确定的:
以2022年为起点,算法这个“神器”,应该属于人民。
彩蛋
那些为共同目标劳动因而使自己变得更加高尚的人,历史承认他们是伟人;那些为最大多数人们带来幸福的人,经验赞扬他们为最幸福的人。
History recognizes those who work for a common purpose and thus become more noble Great men; those who bring happiness to the greatest number of people, experience praises them as the happiest.
联系电话:15801365057
投稿方式:kai.zhao@yeepay.com