注册

驱动力

电子杂志旅游2022-06-17
387

VOL8.0

2022-06

目录

CONTENTS

一线

数说

准绳

驱动力

目录

        疫情反反复复,政策每天都在变,好在一个月的坚持后,除了丰台和昌平,绝大多数地区都陆续恢复了正常生活和工作秩序。
        新一期的《驱动力》也准时见面,复工复产之余提醒各位注意安全防护,闲暇之际看看小文章,希望给大家忙碌的工作带来一些小小的调剂,利用碎片时间共同进步。

导语

导语

page/01

page/02

元数据技术架构设计方案

整个分享分为三个部分。
第一部分,说说我和我的团队眼中的元数据。
第二部分简单介绍如何实现元数据管理的架构。
第三部分,我将通过举例的方式,说明元数据的应用价值。

驱动力

一线

page/03

page/04

(PPT全文附解读)

        元数据是信息的维度,可以说,掌握了元数据就掌握了信息的维度。 只有充分利用好元数据(也就是信息的维度),通过合理的元数据建模(维度整合),对元数据进行科学管理(维度完善),才能更好地认知信息。
         那么,就可以将元数据管理看成是这些信息概念和信息本身之间的一种连接。其中信息概念表示某个业务所有维度的集合,连接则是描述元数据与元数据之间关系的方式。

一线

驱动力

page/05

page/06

        元数据管理是随着数据仓库的建设逐渐完善起来的,这也决定了元数据管理主要集中在数据领域。例如数据结构、数据加工转换关系等。 而随着我们对元数据理解的不断深入,其实元数据广泛存在于企业架构的方方面面,而不仅仅局限于数据领域里。

        因此,元数据管理的范围也在不断扩大,从简单的库表,到整个数据平台,再到服务管理,不断地突破传统管理的范畴,形成了广义元数据管理。 
        在这个过程中,对元数据的技术架构也有了新的要求,稳定可扩展的架构才是实现广义元数据管理的基础。

一线

驱动力

page/07

page/08

        要实现元数据管理有三个方面,         1、采集:指从各种工具中,把各种类型的元数据采集进来,采集是元数据管理第一步。
         2、存储:采集之后需要相应的存储策略来对元数据进行存储,这需要在不改变存储架构的情况下扩展元数据存储的类型; 
        3、管理和应用:在采集和存储完成后,对已经存储的元数据进行管理和应用。 
         随着元数据管理范畴的不断扩大,如何保证元数据从采集、存储到应用等关键环节的稳定和扩展,成为元数据管理架构设计的关键问题。 
         OMG的模型体系规范为元数据管理提供了基础,所以整个元数据管理设计的关键应该以模型体系规范为指导。          OMG提出的CWM(Common Warehouse Metamodel)规范对数据仓库相关的所有模型进行了描述,在初期我们也遵照此规范设计元数据管理的架构,但是规范里也有坑,我们很快就发现了问题。 
         我们发现CWM规范本质上是针对数据仓库领域的规范,按照OMG的模型体系来看,模型的抽象层次还是太低

一线

驱动力

page/10

page/09

        如果继续提高抽象层级,MOF规范位于模型体系最底层,所有模型体系规范的基础都应该是MOF(Meta Object Facility)规范,UML,CWM都是由MOF扩展而来。 
        基于MOF的还有模型交换的规范XMI,为不同元数据交换提供了很好的模型基础。 
         那么若整个元数据围绕MOF设计和扩展,不用修改元数据管理核心部分,就可以适应元数据种类的不断扩展。

        下面我们来看看如何设计元数据的存储 元模型对元数据属性及关系进行了定义,一般来讲,元模型存储有两种方式。
        1、第一种方式是将元模型转换成系统数据库表和属性,实现一对一管理存储。例如可以将主键元模型存储在主键记录表中、将存储过程元模型存储在存储过程记录表中等。
        2、另一种方式是基于MOF元元模型把所有属性和关系打散,以此来实现元模型的通用存储结构。 
         如图所示,以CWM模型中关系型包为例进行说明,方式一是直接将元模型转化为库表,方式二按照元元模型的方式存储元模型; 尽管第二种实现方式上复杂度会更高一些,但是在扩展性有绝对优势,是元数据管理实现的优先选择方式。

一线

驱动力

page/12

page/11

        再来看看模型体系的层次结构。
        和元数据有关的体系分三层,M1(元数据)、M2(元模型)、M3(元元模型),其中MOF元元模型中描述了包、元素、属性、命名空间和约束等对象及其关系,位于层次结构的最上层,也是最抽象的一层。
        
        以MOF作为底层元元模型来支持元数据管理,在M2层中就可以对元模型进行定义和扩展(例如CWM模型),将来还可以扩展到微服务模型、业务模型等。

        选定了实现方式后,一般可以通过三步来实现元数据的管理,
        第一步,以MOF规范设计元模型存储结构,从而支持元模型的扩展。
        第二步,基于MOF设计元模型,例如将CWM(公共仓库元模型)规范中定义的元模型,存储在元模型中。
        
        第三步,按照扩展后的元模型,采集元数据,存储到元数据系统中。

一线

驱动力

page/14

page/13

        在元数据管理三层管理架构的支持下,通常只需要做元模型定义和元数据采集,就对不同元数据进行管理。
        例如,要将表与字段元数据采集到元数据管理系统,只需要如下两步:
        首先,对元模型定义并描述元数据特征,包括类属性描述、关系的描述等;
         然后,将元数据采集进来,存储到系统中;
         良好的元数据架构,能够给元数据带来更多的应用价值。我们再看看元数据的应用价值。

        通过元数据管理我们能够做到: 
        1、实现多样、繁杂的元数据信息集中管理,为企业数据(服务)管理提供统一的视图,实现企业级数据(服务)资产管理,方便数据(服务)交互共享,同时为后续规划提供依据; 
        2、通过管理维护数据(服务)之间关系,实现数据(服务)自动关联分析,为问题定位、影响分析、上线加速等提供支撑。 
        3、建立数据(服务)标准,统一交换、存储、应用口径,减少共享壁垒,降低应用出错几率,提升质量。 
        ⋯ 
         通过这些基本能力,元数据在数据管理、微服务管理、业务管理等方面都能发挥很大的作用。

一线

驱动力

page/16

page/15

        通过元数据管理,在数据方面能做到:
         1、数据标准化;
         2、数据开放;
        3、数据质量提升等
        在微服务方面,能够提供以下支撑:
        1、服务开发、应用等标准化;
        2、服务应用监控,优化服务应用等
        将来在业务方面也能通过元数据实现业务流程分析、业务流程优化等能力。
         下面我们用几个例子,举例说明元数据的作用。

        数据治理之中,元数据是整个治理体系落地的技术核心。
        比如:在数据标准中将数据标准作为一类业务元数据存储,将其和技术元数据一定程度的关联,去看标准的落地效果
        在数据质量中,通过元数据追溯质量问题。在共享发布中,利用元数据自动形成数据服务等等。

一线

驱动力

page/18

page/17

        元数据还能够自动化的准确的管理应用的上线、变更。
        元数据通常企业系统建设会分为开发、测试与生产三个不同的环境,而在软件开发过程中,无论是需求变更还是BUG修改都避免不了元数据的改动,这时候往往会出现开发库、测试库测试通过,而在上线过程中又出现问题的情况,这会让运维部门非常头疼。
        此时若通过元数据对系统的上线变更进行管理,自动采集三个环境的库表结构与存储过程等信息,保证各个环境中的元数据都是最新的、最准确的,再将上线环境与测试环境的元数据进行对比,不一致的地方一目了然。
        如果把系统的开发库、测试库、生产库的元数据都管理起来,上线时突然出现问题的概率就会大大降低。

        通过扩展模型,元数据也能够管理微服务,微服务的生命周期有多个阶段,在前期需要与多个微服务协同考虑,上架后也会有多个使用者,在这种复杂的状况下需要管理微服务的全生命周期。 
        在规划阶段提供标准元数据规范微服务,在设计阶段提供连接其他微服务的元数据信息,在开发阶段使用元数据协助开发测试。 
        上线后分析微服务的使用情况,并协助维护微服务的变更。最后微服务下架时将微服务的元数据存档,并确保对目前体系不产生影响。 
        同时微服务的不同版本间的元数据的变化也可以做追溯和分析。

数说

驱动力

page/20

page/19

        最后,未来元数据将是连接业务,数据与服务的企业核心基础设施,可扩展的元数据架构也能够产生更多更有价值的应用场景。

年轻人头发报告:
每 4 位男性就有1人脱发

本文作者叶不凡
原文链接:https://mp.weixin.qq.com/s/oOyWXt8HiIgbtVeALL9Axw

当代年轻人苦头发已久,《中国人头皮健康白皮书》数据显示,我国脱发人数已超2.5亿人(男性约1.63亿,女性约0.88 亿,相当于每4位男性中有1人脱发,每8位女性中有1人脱发。与此同时,30岁前脱发的比例高达84% ,较上一代人的脱发年龄提前了20年,呈现明显的低龄化趋势。
写不完的代码、修不完的Bug,除了格子衫,程序员们还有个重要的标志:头顶有点光。

数说

驱动力

page/22

page/21

不过现在,脱发早已不是程序员的专属悲伤,越来越多人开始秃了。今天,我们分析一下年轻人与头发之间的爱恨情仇。
中国约2.5亿人存在脱发问题,其中90后占比上升,超越80后,脱发现象呈现年轻化趋势。

90后脱发情况分布中,46.7%有严重的脱发。女性中,有43.7%会脱发,而男性中脱发人群占比相对更高,达51.4%。

90后脱发区域分布中,男性或女性都认为发际线是最主要的脱发区域,其次,女性的发缝也脱发明显。

IT 通信行业不出意外地成为秃头的“重灾区”,“秃头程序员”的说法绝不是句玩笑话,尤其是男性码农,惨遭折磨。如果你身边有这么一位亲朋好友是码农,那么防脱发产品或许是程序员节的最佳礼物。
对于女生来说最容易头秃的行业是广告营销和医药卫生。她们为工作付出的不止是青春,还有飘逸的长发。

数说

驱动力

page/24

page/23

秃头大军遍布大江南北,江浙沪的打工人不出所望地全部光荣上榜,在所有省份中,广东、江苏、山东位列榜单前三。
在北上广深等大城市,秋风飒爽也显得格外清凉。除了我们熟悉的互联网重地外,成都、武汉、郑州也挤入脱发的行列。

各地程序员关注的问题,连起来能写成一部秃头史,不过显然不同地方的码农遭受的折磨还是有差别的。在广州程序员还在搜索“头顶脱发是什么原因?”的时候,北京的程序员已经在搜索“植发后还会脱发吗?”
90后脱发原因中,超50%认为熬夜、压力过大是他们脱发的主要原因,其次,也有内分泌失调、缺乏运动等自身原因。

90后睡眠质量调研中,有脱发现象的人群睡眠质量处于非常差、较差和一般的占比(46.0%)明显高于没有脱发现象的人。

数说

驱动力

page/26

page/25

90后的脱发人群中,仅16.4%不会因为脱发烦恼,而37.7%会经常因脱发烦恼。他们认为脱发对颜值、自信、脱单影响程度最大。

购买防脱洗发水的消费者中,90后占比达58.3%。  

90后拯救脱发方法中,超2成90后认为植发是最有效的方法,通过手术方式从根本解决发量问题。

中国植发人群中,90后占比超5成,在他们对植发的问题中,最关心的是植发的价格。

治疗脱发吃药虽然有效,但是有些人可能会有比较明显的副作用。植发一般是按毛囊数量收费,一个毛囊价格从十几块到几十块不等。不同的脱发程度需要的毛囊数是不同的。
脱发较轻的,1000-2000个毛囊就够了,严重的往往要植3000-4000个毛囊,这样算下来至少要为其付出几万块甚至数十万的治疗费。

准绳

驱动力

page/28

page/27

相比于脱发、发质干枯,人们更担心的是熬夜、巨大精神压力以及可能存在的身体亚健康信号。所以,脱发成了数亿90后共同的痛,当他们无力改变工作制度和调整生活节奏,就只能苦哈哈地调侃一句:我变秃了,也变强了。
虽然,我们无法完全解决头发问题,但我们可以尝试为秃头正名。用年轻人的自黑精神消解秃头的尴尬,打破脱发的标签。就像一位朋友说的,人没有十全十美的不是吗?
最后,祝愿你有好头发,如果没有,愿你在苦恼后赶紧就医,注意休息。祝愿你有好发型,如果没有,愿你失意中再接再厉,从头再来。
参考资料:
网易熟读:中国脱发地图出炉,这里的人最秃
Mob研究院:2021年90后脱发调研报告

天津人脸识别案居民胜诉:
小区以刷脸作为唯一通行方式二审被改判违法

来源:新京报 记者:胡闲鹤
原文链接:https://mp.weixin.qq.com/s/wJ5EBk4YuIqmwEkw7lE29w

人脸信息具有唯一性、不可变性和易获得性,这既为人脸识别技术带来了价值,又带来了风险。
因将人脸识别作为进出小区的唯一通行验证方式,天津市一物业公司被居民告上法庭。一审法院认为,相关证据不能证明被告侵犯了其隐私权。近日,该案二审作出改判,法院要求物业公司删除原告人脸信息,并为其提供其他出入小区的通行验证方式。
受访专家表示,二审判决的突破性在于,法院正确而合理地适用了2021年8月1日施行的《 最高人民法院关于审理使用人脸识别技术处理个人信息等相关民事案件适用法律若干问题的规定》中的相关规定,物业公司必须给业主或者其他有权进出的人提供人脸识别之外的其他合理验证方式。

准绳

驱动力

page/30

page/29

拒绝小区人脸识别:隐私权纠纷还是个人信息保护纠纷?
顾某居住于天津市和平区诚基经贸中心,该小区物业公司采用人脸识别作为出入小区的验证方式。
判决书显示,2021年8月2日至5日期间,顾某与兰州城关物业服务集团有限公司天津分公司(以下简称“城关天津公司”)诚基经贸中心项目部工作人员多次沟通,要求删除其人脸信息,并向其提供无障碍出入小区的方式,但物业公司拒绝了顾某的要求。此后,顾某委托律师事务所向城关天津公司发出律师函,提出同样要求,后者签收律师函后,并未与顾某或其代理人联系。
2021年9月,顾某将兰州城关物业服务集团有限公司及城关天津公司告上法庭。
顾某诉称,被告拒绝删除其人脸识别信息、使用人脸识别作为出入物业服务区域的唯一验证方式,侵犯了原告的人格权,违反了处理人脸信息需要遵循的合法、正当、必要原则。城关天津公司辩称,人脸识别信息采集是经过业主委员会、综合洽理办公室、社区、街道办共同完成的工作,同时在天津市公安局和平分局进行联网监控,并符合现在疫情管控要求,原告人脸信息只在门禁上使用。

此案一审的案由被法院定为隐私权纠纷。依据《民事诉讼法》第六十四条“当事人对自己提供的主张,有责任提供证据”的规定,一审法院判决认为,原告顾某并未提交被告对其信息存在泄露、篡改、丟失的相关证据,且提供的相关证据不能证明二被告侵犯了其隐私权。故原告的诉讼请求没有事实和法律依据,不予支持,驳回全部诉讼请求。
顾某不服一审判决,后上诉至天津市第一中级人民法院。上诉人认为,本案的主要法律问题是个人信息保护而非隐私权,一审法院适用法律错误,案由选择错误。其未主张个人信息被泄露、篡改、丢失,无需提供相关证据,一审法院对举证责任的认定有误。
二审法院对一审法院查明的事实予以确认,认为本案系因处理个人信息引发的纠纷,案由应确定为个人信息保护纠纷。
北京炜衡(成都)律师事务所合伙人魏冬冬长期关注数据合规与个人信息保护领域,她对记者表示,隐私与个人信息是两种相互区别、相互交叉的个人权益,对二者进行保护的法律规则也不同。“隐私只有在受到实际的侵害或潜在威胁时候,才能受到保护,隐私案件中的举证责任主要由原告承担,而在个人信息案件中举证责任是倒置的。二审法院将案由纠正为个人信息保护纠纷,主要举证责任就转变到物业公司一方。这是原告本案二审胜诉的基础。”

准绳

驱动力

page/32

page/31

法院:物业需提供人脸识别以外的通行验证方式
清华大学法学院教授劳东燕对记者表示,根据《个人信息保护法》等相关规定,人脸信息作为生物识别信息属于法律保护的敏感个人信息范畴,使用人脸识别技术时应严格遵守个人信息保护的相关法律规定。除法律、行政法规另有规定外,处理个人信息应征得该自然人或者其监护人同意, 同时应当遵循合法、正当、必要原则。
顾某在上诉中还认为,一审法院认为城关天津公司处理人脸信息系疫情防控之需要,没有事实和法律依据,不符合必要、合法原则。
二审法院审理指出,城关天津公司基于涉案小区人员密集、安全防范难度较大的情况,在征得业主及物业使用人同意的情形下,于2020年2月启用人脸识别系统作为业主及物业使用人出入验证方式,能够更精准识别出入小区人员,在新冠肺炎疫情防控中发挥了较大作用,并不违反法律规定。
但二审法院同时指出,根据2021年8月1日起施行的《最高人民法院关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》第10条规定,如果有业主或者物业使用人不同意采取上述验证方式而请求物业公司提供其他合理验证方式的,物业公司不能以智能化管理为由予以拒绝。

二审法院认为,顾某在办理入住时虽然同意城关天津公司提取其人脸信息作为通行验证方式,但其后多次就城关天津公司提取人脸信息作为唯一的验证通行方式提出异议。城关天津公司以人脸识别验证方式系业主委员会同意拒绝为顾某提供其他验证方式的抗辩理由,与前述规定相悖。城关天津公司关于使用人脸识别验证方式是按照疫情防控的相关规定和要求的主张,亦无证据证实。
最终,二审法院撤销一审判决,要求城关天津公司删除顾某人脸信息,并提供其他通行验证方式,赔偿合理费用6200元。
劳东燕认为,除了案件性质的重新界定,即本案涉及的是个人信息权益而非隐私权,上诉能够改判的关键是二审法院对于现有法律法规及司法解释的理解更为准确,比如对必要性原则的理解。
魏冬冬表示,对人脸信息采集必要性的判断,需在确定采集目的的基础上,综合考虑收集人脸信息是否系实现该目的必要的方式,是否有其他替代方式,以及人脸识别造成的危险是否超过了这个目的本身。“在将人脸识别用于小区的进出是不必要的,刷卡进出在便利性和安全性上也有保障,人脸识别带来的利益并不明显,却可能给小区住户带来隐私和个人信息泄露、财产损失等风险。”

准绳

驱动力

page/34

page/33

“此外,《个人信息保护法》本来就规定了撤回权,基于个人同意处理个人信息的,个人有权撤回同意。个人信息处理者应当提供便捷的撤回同意的方式。对业主来说,根本不需要具备个人信息存在被泄露、篡改、丢失等危险的前提,便可以向物业提出撤回、删除的要求。”劳东燕说。
人脸信息采集有风险,物业公司需合法合规存储
人脸信息具有唯一性、不可变性和易获得性,这既为人脸识别技术带来了价值,又带来了风险。魏冬冬表示,人脸识别滥用的风险主要在于加大了人脸信息泄露的风险,泄露后可能危害个人的人身安全、隐私权和财产安全,如泄露的人脸信息,可能被用于追踪个人行踪、盗窃资金账户、私闯住宅以及未经授权进入机要场所等。
为保障居民的合法权益,部分地区已立法规制物业的个人信息采集行为。2022年3月起施行的新修《杭州市物业管理条例》规定,物业服务人不得强制业主、非业主使用人通过提供人脸、指纹等生物信息方式进入物业管理区域或者使用共有部分,不得泄露在物业服务中获取的业主、非业主使用人个人信息。
而在人脸识别设施的安装过程中,劳东燕特别强调了“告知—同意”原则的基本要求——个人信息收集方必须就收集目的、范围相关与风险做明确而充分的告知,并事先征得被收集人的单独同意。

“根据《个人信息保护法》相关规定,人脸信息属于敏感个人信息,在使用人脸识别设施之前,物业需要单独征求每个居民的同意。”劳东燕表示,“另外,部分已经安装人脸识别装置的小区,看似很多居民都同意了,但此种情形下同意的获得,可能是因为在征求同意时,物业并没有把人脸信息采集可能存在的风险真实全面地告诉居民。严格说来,这样的同意在法律上是无效的。”
人脸信息收集之后,数据的存储、保管成为一个重要问题。
上海汇业律师事务所律师、注册信息安全专业人员(CISP)史宇航对记者表示,目前,小区人脸识别系统的人脸数据库一般是由物业在管理,技术提供商可能会参与系统的搭建,但是否参与管理要看具体系统架构,政府部门主要负责监督。
魏冬冬介绍,相关法律法规和国家标准对人脸信息收集和存储的合规性要求较多,物业公司存储人脸信息需履行一系列义务。存储人脸信息时,物业公司不应存储原始的人脸照片,应仅存储人脸的消息摘要,对人脸信息存储和传输采取加密措施,对人脸信息设置适当的访问权限和操作权限;还应进行个人信息保护影响评估(PIA),形成书面的评估报告并保存三年以上,以及对员工进行个人信息保护的培训等。

准绳

驱动力

page/36

page/35

“在技术上,物业公司应当将人脸信息与个人身份信息(如个人身份证号码)分开存储,这可以大幅降低人脸信息泄露造成的危害。人脸信息产生危害的前提是‘知道这个人脸信息是谁的’,如果不知道人脸信息的主人是谁,自然无法用于跟踪和诈骗。”魏冬冬表示。
在2022年的全国两会上,全国人大代表、广西宏智科技有限公司董事长易捷表示,人脸识别目前在技术、应用管理和政府监管层面仍然存在空白。“一方面是数据存储随意,一些分散的、未经安全认证的存储单位安全技术力量薄弱,数据安全得不到保证;另一方面是海量的无监管人脸数据存在被买卖交易的风险。”
易捷提出,应按照相关规范要求,建立由政府部门监管的全国统一的第三方人脸信息数据库,出台专项管理制度或法规,严格要求所有进行人脸识别的单位只能将采集数据存储于第三方人脸信息数据库。

彩蛋时间

近期在给爸爸挑选生日礼物的时候刷到了一个测评博主,感觉测评维度,评价标准都很专业和有趣,分享给大家。
《一个测评博主的数据分析思维》:(点击图片打开链接)

驱动力

主办单位:易宝支付数据部
编辑:赵凯

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号