注册

萨摩耶内刊 | 第16期

撰写人:王某力

Welcome

欢迎来到萨摩耶内刊

目录

contents

01

萨摩耶之光

07

政策之风

13

行业之争

苏炳添牵手水滴保,担任“保险科技领跑官”
新科奥运冠军谌利军担任平安健康险健康大使
多家消金公司为河南受灾用户提供息费减免延期还款等政策

21

萨摩耶之乐

7月党建主题系列活动
职场健身体验课
跳蚤市场

激情七月,燃情奥运
截至目前,中国代表团已夺得32枚金牌
但比金牌更闪亮的
是运动员们在赛场上展现出的
坚持、乐观、永不言败的拼搏精神
人生最精彩的不是实现梦想的瞬间,
而是坚持梦想的过程
赛场无处不在,夺金势不可挡
愿大家都能在彼此的赛场中
全力以赴,勇攀高峰

17

萨摩耶之享

人工智能部:化腐朽为神奇,
看萨摩耶数科如何用目标编码打造智能风控

董事长林建明应邀出席毕马威2021中国金融科技高峰论坛
萨摩耶数科获亚洲银行家“中国最佳无摩擦信用评估应用”奖
鸿蒙系统登陆,萨摩耶数科全力支持国产系统
马布里携手好耶出道,“马耶CP”献上超值观赛好礼

《深圳经济特区数据条例》正式发布
完善数据安全等相关法律法规,加强中概股监管
工信部大力整治APP开屏弹窗信息骚扰用户问题
《网络产品安全漏洞管理规定》 9月1日起施行
网络平台不得向金融机构提供个人数据 
收集人脸信息须征得“单独同意”

01

02

7月25日,由毕马威和青岛市崂山区人民政府共同举办的2021中国金融科技高峰论坛在青岛隆重举办。作为国内金融科技企业的重要代表,萨摩耶数科应邀出席论坛,萨摩耶数科董事长林建明在主题为“数字化转型:探索创新,金融机构数字化转型展望”的圆桌论坛发表观点。
本届论坛邀请业界代表围绕财富科技、数字供应链金融、金融科技趋势以及数字化转型等议题展开交流与探讨。在圆桌论坛环节,萨摩耶数科董事长林建明同业界企业代表共同围绕“数字化转型:探索创新,金融机构数字化转型展望”这一主题各自分享了经验和看法。

萨摩耶之光

萨摩耶数科董事长林建明应邀出席
毕马威2021中国金融科技高峰论坛

图:萨摩耶数科董事长林建明在毕马威圆桌论坛发言

萨摩耶数科董事长林建明认为,金融机构数字化需要数字产业化来推动,萨摩耶数科运用决策科学应用这一核心竞争力,为金融机构提供一系列工具以及整个业务完整的解决方案。通过不断实践积累的技术和经验,可以应用到商业机构甚至监管方面,推动各行各业实现数字化发展。
关于金融数字化未来,林建明提到,金融服务将会走向更加开放和便捷,未来金融业基于数字的运营,实现数字化和智能化,决策科学将会应用到金融的全环节全链条。数据将成为比资金更重要的核心生产要素,安全的数据将成为“石油”,为产业数字化提供原动力。优秀的银行家一定首先是数据科学家,其次才是金融家。
当前,随着人工智能、大数据、云计算等为代表的新一代技术与金融业态加速融合,金融机构数字化改革持续推进,金融业生态格局发生着重大变化。作为两度入选毕马威年度评选榜单的萨摩耶数科基于自主研发的技术产品不断赋能金融机构,通过“F·I·R·S·T”战略体系,帮助金融机构等开展数字化转型,促进其实现数字化智能化发展。
眼下,金融科技和创新推动着新的金融服务模式在全球持续发展,伴随着金融科技的蓬勃发展,通过信息数字化、服务平台化、金融智能化,对于金融行业全业务环节的变革影响将会继续深化。未来,萨摩耶数科将会继续专注科技赛道,持续优化产品创新服务,发力小微、三农、绿色等领域,牢记服务实体经济的使命,为数字中国建设创造价值。

03

04

7月22日,由亚洲银行家主办的2021中国未来金融峰会暨中国奖项计划颁奖礼在京成功举办,会上揭晓了2021年度中国奖项榜单。萨摩耶数科凭借其在信用风险策略和管理等方面的服务优势,荣获“中国最佳无摩擦信用评估应用”奖。
本届峰会吸引了来自亚太地区众多金融行业精英和决策者,政界、商界、学界领袖共聚一堂,探讨新格局下金融业未来,寻求金融数字化转型全新之道,分享数字化时代全面风险管理经验,共同展望绿色金融未来发展。

萨摩耶之光

5G、人工智能、大数据等技术的落地应用,也使得科技与金融实现深度融合,为金融机构、商业机构等数字化转型发展提供了更多可能,拓宽了服务场景,催生出开放智能化的金融商业生态。
近日,萨摩耶数科宣布正式接入鸿蒙系统,全力支持国产系统应用,成为率先接入鸿蒙系统的科技企业之一,使得“5G+科技+金融”生态更为丰富,促使金融服务走向万物智联新时代。

萨摩耶数科荣获亚洲银行家2021年度
“中国最佳无摩擦信用评估应用”奖

图:萨摩耶数科获亚洲银行家零售金融类奖

亚洲银行家中国奖项计划是目前金融服务行业内最受尊重和认可的年度奖项计划之一,自2006年启动,由亚洲银行家研究院严格按照评分卡机制进行多维度评估产生入围机构,经由知名学者、行业顾问和业界领袖组成的项目独立评审委员会进行综合审查,确认产生最终评选结果。萨摩耶数科从400余位申请机构中脱颖而出,最终获得上述殊荣。

鸿蒙系统登陆,萨摩耶数科全力支持国产系统

2021年6月初,华为在HarmonyOS 2系统及全场景新品发布会上正式推出服务卡片,颠覆了人们对APP信息展示的认知,引起了行业内极大关注。
萨摩耶数科通过技术研发,基于鸿蒙系统开发定制“服务卡片”的技术目前已经熟练掌握并应用。当用户于手机桌面上滑添加万能卡片后,点击卡片时可以立即唤起产品使用其功能,无需安装,以全新方式助力金融机构为用户带来更加方便的操作和服务。
萨摩耶数科技术团队有关负责人表示,当前萨摩耶数科所提供的技术及开发的产品线上版本运行稳定,安装鸿蒙系统的手机用户可以随时使用其产品获取相关服务,享受全新的智能化金融服务。

05

06

萨摩耶之光

官宣!
马布里与吉祥物好耶携手出道,马耶CP献上超值观赛好礼

当篮球明星马布里遇上省呗,将会碰撞出怎样的火花?
近日,一站式综合生活服务平台省呗APP正式宣布,由篮球明星马布里担任省呗首席活动体验官,与省呗吉祥物好耶,组成“马耶CP”限定成团,并发布全新品牌TVC,以“燃情观东京,上省呗夺金”的活动口号,邀请广大用户共襄东京体育盛事,赢观赛超值好礼。

燃情梦想达成共识,“马耶CP”限定成团出道
自从1996年开始效力NBA后,马布里就正式进入大众视野,后凭借在CBA中多次获得总冠军并入选全明星。2010年加入中国球队以来,率领首钢俱乐部夺得三次CBA总冠军。因其娴熟的职业技能和富有亲和力的形象,在中国人气大幅提升,深得球迷喜爱,被亲切的称为“马政委”、“老马”。
省呗作为一款有温度的一站式综合生活服务平台,可为终端用户提供购物消费、文化娱乐、信用管理、金融信息、生活工作、虚拟空间等涵盖多场景、多领域的服务。

自2015年9月上线以来,省呗始终以用户为中心,秉持“信用生活、年轻主张”的品牌理念,助力年轻用户燃情追梦。与信用组队,邀好运相随。作为省呗首席活动体验官,马布里在比赛中冲锋在前,敢拚勇闯,多次带领团队取得佳绩,他力求卓越、信守诺言的人格魅力,与省呗“信用生活,年轻主张”的品牌主张颇为匹配。
也正是因为这个原因,省呗与马布里强强联手达成合作,不仅向广大用户传达积极向上的生活态度,同时也在彼此专注的领域相互碰撞,绽放实力。此番马布里与省呗吉祥物好耶携手,以“马耶CP”的组合之名邀请大家共襄体育盛事,号召大家关注健儿们在东京的热血夺金之旅。
省呗推出三支全新TVC,邀用户共襄体育盛事赢观赛好礼
除了官宣马布里为首席活动体验官,省呗还发布了三支全新TVC,迅速霸屏众多写字楼及小区的电梯,以及写字楼的广告场景。这三支TVC均将省呗的特点与马布里的篮球动作相结合。而三支TVC片尾,则共同告知了广大用户活动信息:7月23日至8月8日东京奥运会期间,“燃情观东京,上省呗夺金”活动通道在省呗APP正式上线。
健儿在东京夺金,用户加油助力之外,还可以上省呗“夺金”。预测中国队最终奖牌榜排名,瓜分百万现金红包、借款免息券,更有限量版老马亲笔签名球鞋、篮球、球衣等超值好礼相送。
作为深耕年轻消费群体的品牌,省呗此次的“燃情观东京,上省呗夺金”活动,不仅是对中国健儿的加油助威,也是为了以缤纷的观赛好礼回馈广大用户。而省呗与马布里的携手合作,也正是体现了省呗的品牌战略,积极拥抱年轻消费群体,为年轻人提供更加优质的普惠金融服务,帮助更多人追梦、圆梦。我们也共同期待着中国奥运健儿在赛场上尽显光芒,取得优异的成绩,再创辉煌!

07

08

7月6日,深圳市人大常委会网站正式公布了《深圳经济特区数据条例》,并将于2022年1月1日起实施。《条例》内容涵盖了个人数据、公共数据、数据要素市场、数据安全等方面,是国内数据领域首部基础性、综合性立法
关于违反条例相关规定的法律责任方面,《条例》规定违反本条例规定处理个人数据的,依照个人信息保护有关法律、法规规定处罚。《条例》明确规定,市场主体不得使用非法手段获取其他市场主体数据,不得非法收集其他市场主体数据提供替代性产品或者服务,不得通过数据分析无正当理由对交易条件相同的交易相对人实施差别待遇。违反上述规定拒不改正的,处5万元以上50万元以下罚款,情节严重的,处上一年度营业额百分之五以下罚款,最高不超过5000万元。

政策之风

中共中央办公厅、国务院办公厅印发了《关于依法从严打击证券违法活动的意见》,提出进一步加强跨境监管执法司法协作,完善数据安全、跨境数据流动、涉密信息管理等相关法律法规;加强中概股监管,切实采取措施做好中概股公司风险及突发情况应对。
《意见》提出,加强跨境监管合作。完善数据安全、跨境数据流动、涉密信息管理等相关法律法规。抓紧修订关于加强在境外发行证券与上市相关保密和档案管理工作的规定,压实境外上市公司信息安全主体责任。加强跨境信息提供机制与流程的规范管理。坚持依法和对等原则,进一步深化跨境审计监管合作。探索加强国际证券执法协作的有效路径和方式,积极参与国际金融治理,推动建立打击跨境证券违法犯罪行为的执法联盟。
加强中概股监管。切实采取措施做好中概股公司风险及突发情况应对,推进相关监管制度体系建设。修改国务院关于股份有限公司境外募集股份及上市的特别规定,明确境内行业主管和监管部门职责,加强跨部门监管协同。
建立健全资本市场法律域外适用制度。抓紧制定证券法有关域外适用条款的司法解释和配套规则,细化法律域外适用具体条件,明确执法程序、证据效力等事项。加强资本市场涉外审判工作,推动境外国家、地区与我国对司法判决的相互承认与执行。

《深圳经济特区数据条例》正式发布,最高可罚5000万元

中办国办发文:完善数据安全等相关法律法规 
加强中概股监管

09

10

据工信部网站消息,APP用户权益保护关乎人民群众获得感、幸福感和安全感,工业和信息化部一直以来高度重视个人信息保护工作,持续开展APP专项整治。
特别是,近期对用户反映强烈投诉较多的“弹窗信息标识近于无形、关闭按钮小如蝼蚁、页面伪装瞒天过海、诱导点击暗度陈仓”等违规行为进行了集中整治,督促企业重视用户诉求,解决好在开屏信息页面中存在利用文字、图片、视屏等方式欺骗误导用户跳转等问题。
截至目前,百度、阿里、腾讯、字节跳动、新浪微博、爱奇艺等68家头部互联网企业已按要求完成整改。2021年第二季度,开屏弹窗信息用户投诉举报数量环比下降50%,误导用户点击跳转第三方页面问题同比下降80%。

政策之风

7月13日,工信部、网信办、公安部联合印发《网络产品安全漏洞管理规定》。
《规定》旨在维护国家网络安全,保护网络产品和重要网络系统的安全稳定运行;规范漏洞发现、报告、修补和发布等行为,明确网络产品提供者、网络运营者,以及从事漏洞发现、收集、发布等活动的组织或个人等各类主体的责任和义务;鼓励各类主体发挥各自技术和机制优势开展漏洞发现、收集、发布等相关工作。《规定》自9月1日起施行。部分条款:
第四条 任何组织或者个人不得利用网络产品安全漏洞从事危害网络安全的活动,不得非法收集、出售、发布网络产品安全漏洞信息;明知他人利用网络产品安全漏洞从事危害网络安全的活动的,不得为其提供技术支持、广告推广、支付结算等帮助。
第五条 网络产品提供者、网络运营者和网络产品安全漏洞收集平台应当建立健全网络产品安全漏洞信息接收渠道并保持畅通,留存网络产品安全漏洞信息接收日志不少于6个月。
第七条 网络产品提供者应当履行下列网络产品安全漏洞管理义务,确保其产品安全漏洞得到及时修补和合理发布,并指导支持产品用户采取防范措施。

工信部大力推进APP开屏弹窗信息骚扰用户问题整治

工信部、网信办、公安部联合印发
《网络产品安全漏洞管理规定》

11

12

近日中国人民银行(央行)征信管理局,向网络平台下发相关通知,要求平台机构在与金融机构开展引流、助贷、联合贷等业务合作中,不得将个人主动提交的信息、平台内产生的信息,或从外部获取的信息以申请信息、身份信息、基础信息、个人画像评分信息等名义直接向金融机构提供
这一通知意味着,互联网平台利用“大数据”获取的个人信息,将不能够被金融机构获取。近年来,随着大数据征信行业的发展,助贷机构在位金融机构提供借款人推荐服务时,会同时会过度收集个人信息。这些公司使用“爬虫”技术采集信息,同时还向金融机构收取导客引流费,或者信息服务费。
这种行为不仅造成了个人信息的滥用,同时推高了用户的借贷成本。IT之家此前报道,银保监会此前还表示,大型互联网平台向金融机构收取导客引流费或者信息服务费,推高了融资成本,引流费高达 6%、7%。
2021 年 4 月,人民银行、银保监会等金融管理部门,联合对 13 家主要网络平台企业进行监管约谈。据上海证券报消息,目前互联网平台大多已于 6 月末前完成初步整改方案,本次通知再次强调这一事项,原因是仍存在一些网络平台直接为金融机构提供个人信息的现象。

政策之风

7月28日,最高人民法院发布《关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》,对人脸识别的应用场景、使用目的、责任认定等层面做出规范。
《规定》在民法典第一千零三十五条的基础上,充分吸收个人信息保护立法重要成果,进一步将“同意”细化为“单独同意”,目的在于对人脸信息提供增强式保护,让个人更加充分地参与到人脸信息处理的决策之中。
根据《规定》第二条,基于个人同意处理人脸信息的,未征得自然人或者其监护人的单独同意,或者未按照法律、行政法规的规定征得自然人或者其监护人的书面同意的,应当认定属于侵害自然人人格权益的行为。
所谓“单独同意”,是指对人脸信息的处理行为及其规则,个人能够独立于其他个人信息处理行为及规则自由地作出同意。换句话说,对人脸信息的处理,不能与其他个人信息的处理合并在一起获得个人的同意。在充分知情、自愿、明确、单独等要素的有力支撑下,“单独同意”能够有效遏制人脸识别技术的使用乱象。

央行征信管理局:网络平台不得向金融机构提供个人数据

最高法发布人脸识别新规:
收集人脸信息须征得“单独同意”

13

14

7月23日,东京奥运会正式开幕。近日,国内领先的保险经纪大平台水滴保正式宣布,牵手被誉为“亚洲飞人”的著名运动员苏炳添成为其品牌“保险科技领跑官”。与此同时,水滴保携手腾讯《中国荣耀》奥运特别栏目,为奥运健儿喝彩,守护国民健康。
目前,水滴保累计保险用户数超过7940万,平台与国内62家保险公司达成合作,推出240余款高性价比保险产品,覆盖医疗、重疾、意外、寿险、年金等人身健康险各类险种,为成人、少儿、老人以及慢病人群提供全方位的保障和服务。

行业之争

苏炳添牵手水滴保,担任“保险科技领跑官”

新科奥运冠军谌利军担任平安健康险健康大使

7月30日,平安健康险宣布邀请奥运会举重冠军谌利军担任健康大使。
从里约伤退,到5年后再次身披中国队的战袍站在东京奥运赛场,7月25日,谌利军实现了登上最高领奖台的目标——以抓举145公斤、挺举187公斤、总成绩332公斤打破挺举、总成绩的奥运会纪录,夺得奥运会男子67公斤级举重金牌。 
中国平安表示:很荣幸邀请到谌利军担任我们的首位健康大使。举重是力量和技巧的较量,更是毅力和勇气的比拼。不负每一托,是胆气,更是底气,我们看好你。未来,平安健康险将和谌利军一起托起每一份信任,为14亿中国人的平安健康加油。

15

16

近日,河南省出现极端强降雨天气,多地遭遇持续性暴雨和大暴雨。截至目前,包括招联消费金融、马上消费金融、中原消费金融、中邮消费金融、晋商消费金融、哈银消费金融以及湖北消费金融在内的8家持牌消费金融公司,推出为河南灾区用户提供息费减免、延期还款等优惠政策。
马上消费金融对河南地区受灾情影响的客户提供差异化豁免罚息、罚金,合理延后还款期限,并对河南部分灾情区域的逾期用户实施不同程度的豁免政策。 
招联消费金融推延期还款服务,对于河南受灾地区的用户,因汛情影响无法正常还款,可于7月30日(含)前在招联金融APP及微信公众号提交延期还款登记,在确认后将还款期限延长至下一个还款日。 
中原消费金融对河南全省用户推出延期还款服务,河南省内贷款还款日在7月20日至25日的用户,均可享受自然向后延长7天还款的服务,且针对河南省内部分灾情严重的地区,视情况再次提供30至60天的延期服务。 
晋商消费金融发布公告称,现居河南地区且还款日在7月20日至7月25日期间的客户,可申请将还款期限延期10个自然日。

多家消金公司为河南受灾用户
提供息费减免、延期还款等政策

行业之争

湖北消费金融针对通过“嗨袋APP”进件且还款日在7月的河南受灾地区客户,推出本月账单延长至最后一期还款的服务。
哈银消费金融针对河南地区符合条件的“哈哈贷”用户,从即日起至8月15日可向客服申请减息金每户50元。此外,河南地区“哈哈贷”客户如严重受灾影响还款,符合延期条件的可以主动申请延期。
厦门金美信消费金融为河南受灾地区的客户提供延期还款、优惠减免等服务,包括不列入逾期与不良记录,减免逾期产生的费用;此外,延长宽限期0.5至1个月。
除减免、优惠等政策外,马上消费金融捐赠200万元,全体员工联合捐赠328万元,累计捐款528万元驰援河南防汛救灾。同时借助其自身科技优势,向河南受灾企业免费开放自研的云呼叫中心、智能外呼机器人以及其他创新技术支持服务,通过智能化、数字化科技手段支持防汛救灾和灾后重建工作。

17

18

化腐朽为神奇,
看萨摩耶数科如何用目标编码打造智能风控

文章投稿 :萨摩耶数科人工智能部

引言
随着互联网技术的快速发展,以机器学习为代表的人工智能技术,可以充分利用大数据背景下的海量资源来训练模型,实现描述原始资源所隐藏的丰富内在信息,从而解决高维复杂的数据分析难的问题,在智能金融和大数据风险控制领域取得广泛应用,并加强了风险控制以及业务处理能力。
在机器学习模型的构建和使用过程中,模型处理的信息通常都是数值型。但在风控场景下,特别是贷前审批流程中,用户信息通常存在大量的字符型或类别特征,这些类别特征必须经过转换后,才能进入到模型中,而转换后的特征表达效果,直接影响到模型的最终预测效果,因此针对类别特征或字符型特征的处理方法,其作用便尤为重要。
在风控场景下,由于更注重模型与变量的可解释性,对于类别特征或字符型特征常用的处理方式就是目标编码。
Target Encoding — 目标编码
目标编码,也称为均值编码,是特征编码的一种非常有效的方法。该方法是统计每个类别标签对应目标值,每个类别标签都被该类别的平均目标值替代。例如有1000名样本,其中男性600名,女性400名,相应的男性有10名标签为1的样本,女性有5名标签为1的样本,则对应的男性标签目标编码值为10/600 = 0.0167,女性标签的目标编码值为5/400 = 0.0125。目标编码是一种有监督方法,需要根据样本标签情况进行操作,且估计有关参数时不应有测试集的参与。 

目标编码处理类别特征简单有效,但在使用时存在一个问题,即统计类别标签的目标均值时,当一个类别标签其数量较少,但其对应的目标值较大,会导致其编码值较大,但其在总体样本占比较小,可信程度可能不高,从而导致模型会出现一定程度的过拟合。举个例子,一个球员投篮,投100个,命中50个,命中率50%可信度较高,但当他投3个命中3个,命中率100%,可信度可能不足以让人信服。因此,采用目标编码时,需设置阈值,对类别标签数量少于阈值的,我们认为其目标响应情况可信度低,其编码采用全量样本的目标均值(即全部样本的坏样本率)来进行填充。
而这种填充方式则引入另一个问题—编码噪声。在风控场景下,与类别标签对应的目标均值相比,整体样本目标均值通常比较小,而目标编码值通常均比整体样本目标均值大。

萨摩耶之享

技术干货

为更直观说明,假设有一群样本,其分布如图1所示,图中y坐标轴是类别标签对应编码值,x坐标轴是类别标签对应的样本数量,黄线是目标编码值(这里假设所有类别标签均值编码均为0.2),蓝线为整体样本目标均值(图中为0.02)。

当对类别标签设置阈值(图中阈值为48),即类别标签样本数量不足48时,标签对应的目标编码值采用整体样本目标均值填充。加阈值的目标编码就会出现图1中绿线所示情况,即在阈值附近,编码值会发生突变,从而引入编码噪声。而这种突变引起的噪声会影响模型提取编码信息的能力,从而影响模型效果。
因此,为进一步提升模型效果,避免编码噪声出现,需对目标编码存在的问题进行改进。
改进目标编码 — 概率平滑目标编码
针对目标编码过程中小类别特征编码值突变引入噪声的问题,我们希望提出一种编码方式来对其进行改进,消除这种突变带来的影响,概率平滑编码便由此诞生。

图1 编码方式对比

19

20

选择Sigmoid函数作为平滑函数的原因在于:对于所有实数,其取值都在(0,1)范围之间,并且是平滑连续的,曲线如图2所示。利用sigmoid函数的这种特性,可以很好地将编码值进行平滑处理。
引入概率平滑函数后,根据设置的类别标签数量阈值,可计算得到在阈值附近可信度概率分布,再将其概率与均值编码值或全量样本目标值相乘,便得到经平滑后的目标编码值,从而实现在阈值附近的目标编码平滑。还是以球员投篮命中率来举例说明,例如球员某一次投篮40次,投中25个,则命中率(即目标编码值)是0.625,假设他整个生涯的命中率(即整体样本目标均值)为0.28,设置投篮10次以内的命中率不可信,采用概率平滑后,计算其平滑函数值为,则对应的目标编码值0.28*(1-0.9999)+ 0.625*0.9999 = 0.6249,也就是说其本次投篮的命中率可信度较高,可以作为命中率进行统计。若某一次投篮8次,投中7次,命中率为0.875,但由于低于10次,其可信度不足,采用概率平滑后,计算其平滑函数值为,则对应的目标编码值为0.28*(1-0.1192)+0.875*0.1192 = 0.3509,可以看到经平滑后的命中率不等于整体命中率,而是与整体命中率接近,表明本次命中率不可信,经概率平滑后的命中率可信度更高。也就是说当标签数量小于设置的类别标签数量阈值时,我们认为其可信度较低,但也不能直接忽略其目标表现,根据其数量在阈值附近的概率分布进行权衡,从而给出一个权衡后的编码值。
此外,还可以增加平滑系数,来对函数的平滑程度进行控制,系数越大,其平滑程度越大,即小类别标签编码向整体样本目标均值靠近的越慢。

目标编码经概率平滑后,效果如图3所示,图中的绿线为概率平滑编码,相比红线的目标编码值,其分布更为平滑,当其类别标签数量小于阈值时,其编码值逐渐接近全量样本平均目标值,大于阈值时,其编码逐渐接近类别标签对应的目标均值,从而有效避免噪声的出现。

概率平滑的核心思想是引入概率平滑函数,而这个概率平滑函数就是机器学习模型中常用的sigmoid函数,函数形式:

图2 sigmoid函数曲线

为验证改进目标编码的效果,采用真实贷前审批业务场景特征,使用变量包含数值型变量和类别变量,分别使用均值目标编码和概率平滑目标编码方法对类别变量进行处理,对处理后的特征,使用Automan自动建模工具进行建模,建模效果如图4所示,在同一份OOT样本上,概率平滑编码的AUC为0.714,略高于均值编码AUC0.705,且在风控常用指标KS上,KS从均值编码的0.33提升到了0.38,模型效果提升较为明显,表明概率平滑编码确实有助于消除均值编码的噪音。

图3 概率平滑编码效果图

图4 不同编码模型OOT样本表现

结论
目标编码是一种简单高效的编码方法,可以有效对模型无法处理的类别特征进行转换,但其对小类别特征的处理容易引入噪声,影响模型提取有效特征信息。针对目标编码的问题,提出了概率平滑编码,该方法通过引入平滑函数—sigmoid函数,将过滤规则转换为依据类别标签的数量计算真实值与均值之间的概率分布,从而有效消除了因差值较大而引起的噪声。通过真实业务特征验证,相比均值编码,采用改进后的概率平滑目标编码处理特征后,训练的模型在测试集上有更好的表现,表明概率平滑编码有效消除了噪声,提升了模型效果表现。本篇介绍的均值编码和概率平滑编码不是处理类别特征唯一的方法,后续将为大家介绍其他同样可以解决同类问题的方法。

萨摩耶之享

技术干货

21

22

萨摩耶之乐

7月庆祝建党系列活动

萨摩耶之乐

特色党日活动

今年是中国共产党成立100周年。
百年征程波澜壮阔,百年初心历久弥坚。
为了给党庆生,7月企业文化中心在四地职场举办了一系列线上线下、职场户外的主题活动。同时以公司党员牵头,带动全员一起了解建党历史,更好地学习党员精神。
下面,让我们一起来回顾一下这精彩的七月党建活动。

7月1日,公司特别邀请到中国人民银行深圳市中心支行原行长、萨摩耶数科党支部书记 张建军同志,以别开生面的方式,和四地职场的党员、入党积极分子一起,重温入党仪式、唱国歌、宣誓、宣读先进党员流动岗名单,并进行了党课分享和现场互动。

六年来,萨摩耶数科创始团队从早期的16人,4名党员,成长为今天近500人,89名党员的组织。未来,我们也将继续秉持着温暖初心,科技向善,不断自信自强、守正创新;扎根产业,心系实体;勇闯敢拼,自省自新。

23

24

萨摩耶之乐

主题快闪活动

萨摩耶之乐

深圳美术馆探展活动

周末,公司及各大社团组织在四地职场发起党主题快闪活动
以跑步、登山、参观等形式打卡拍照。其中,
深圳职场同事,前往关山月美术馆参观《与人民同行》主题展
上海职场同事,前往中共一大会址参观学习
长沙职场同事,前往橘子洲头参观游览
北京职场同事,前往中国人民革命军事博物馆参观

7月15日,公司党支部及视觉研究社团的同事,一起组织参观了以“文化名人大营救”为主题的深圳美术馆馆藏丁聪《东江百日杂忆》组画暨专题美术作品展。
策展人结合有关文化名人大营救主题的美术作品和文献资料,向大家讲述在中国共产党的领导下,东江游击队营救800多名文化民主人士及其家属这一重要的历史事件,并在现场体验了油墨印刷装置。
珍贵的历史资料、沉浸式观展体验,也让大家从历史和艺术的维度走进东江纵队,走进那段光辉的岁月。

25

26

萨摩耶之乐

党旗下的手机摄影大赛

自七月庆祝建党100周年系列活动启动以来,四地职场的同事积极参与。党旗下的手机摄影大赛收到众多同事来稿,由SMY视觉研究社的同学组成的评审团,从主题内涵、创意性、视觉效果等维度进行了不记名打分。以下是获奖作品赏析。

二 等 奖

作者:陈炜  作品名称:《负重前行》
评语:这张作品是作者在参观南京大屠杀纪念馆时留下的,时空交错,意味深长。用一张照片承载了过去和现在,画面主体非常鲜明的建党100周年标志在南京大屠杀纪念馆外墙的背景下格外显眼和瞩目,提醒我们勿忘国耻,珍惜现在的美好生活。

二 等 奖

作者:苏凯  
作品名称:《忆往昔峥嵘岁月稠
评语:这张作品记录了一个非常温馨的画面。两位互相搀扶着的老人停留在纪念馆内仔细观看着老照片,他们在看什么呢?是怀念自己经历过的革命岁月?还是在回忆照片里的人?这些人跟他们两个是什么关系呢?我们不得而知,给看到这张照片的人留下了无限的遐想。

三 等 奖

作者:孙嘉伟         
作品名称:《新青年》
评语:这张作品是一张肖像人物作品抓拍。在党旗的背景下,竖版的构图中的人物形象非常醒目,人物的服装和发型以及聚精会神的模样恍惚间让人想起1921年,13位来自五湖四海的热血新青年,突破国际国内各股复杂势力的监控和追踪,聚集于上海召开中国共产党第一次代表大会,见证中国共产党的成立。

一 等 奖

作者:卿羽           作品名称:《与党同行》
评语:纪实摄影是一种声音,是一种力量。它的魅力在于拍摄者对于这个复杂世界细微地观察。这张作品用同一个画面展现了这个时代,尤其是2021年的两件非常令人难忘的大事件。高高飘扬的党旗与穿着防护服带着口罩的医生出现在同一张画面中,足够体现作者的用心。

27

28

萨摩耶之乐

党旗下的手机摄影大赛

萨摩耶之乐

职场党建知识分享论坛

7月21日,企业文化中心的邹捷为大家带来了《百年党史中的红色艺术》的知识分享讲座。
其中包括百年党建邮票设计的制作技术与视觉艺术,以及百年党史中重要的艺术家与艺术运动。

作者:胡梦媛  
作品名称:《风和日丽》
评语:就像这个作品名字描述的一样,画面中阳光明媚,树影婆娑,红色的公交车在画面中与茂密的树木和蓝天白云交相呼应,透露出一股静谧和安详,寓意着我们现在幸福生活来之不易。

三 等 奖

作者:胡超美  
作品:《党建从娃娃抓起》
评语:画面主体是两个儿童手拿党旗非常开心的样子被记录了下来。 儿童是祖国的未来,也是民族的希望,少年强,则中国强;少年美,则中国美。少年儿童从小树立爱祖国、爱家乡的情感非常重要。在星星火炬的照耀下,在党的阳光的沐浴下,为实现中华民族伟大复兴的中国梦时刻准备着。

三 等 奖

7月14日,用户体验设计中心的罗帝达为大家带来了《走进国旗与党旗的设计史》的知识分享讲座。
其中包括各国国旗的设计共性与差异性,以及中国国旗与党旗的设计由来与理念。

1

2

29

30

萨摩耶之乐

献礼主题免费观影活动

七月,四地职场的党员到电影院
观看了建党100周年献礼影片
《1921》
并分享了个人观后感
该片讲述了1921年的上海
租界林立,局势剑拔弩张
13位来自五湖四海
平均年龄仅28岁的热血青年
从民族危亡的困境出发
突破国际国内各股
复杂势力的监控追踪
聚集于上海
召开中国共产党第一次代表大会
见证了中国共产党的成立

31

32

萨摩耶之乐

职场健身体验课

萨摩耶之乐

跳蚤市场

在防范疫情的长期作战中
除了积极做好防护外
我们更要强身健体,多运动提高自身免疫力
7月,公司在职场内举办了燃脂课和瑜伽课
让大家在繁忙的工作之余,挥洒汗水,有效锻炼身体

SMY的信息交流平台上线啦!
该群业务范围:
资源置换、二手物品交易
租房信息共享、婚恋交友
组队开黑、吃喝玩乐
宠物上门喂养等等
欢迎大家扫码进群~
(仅限SMY员工)

Work Smart , Play Hard 

策划出品:品牌管理部

小程序
好耶防骗情报局

官方抖音
省呗

微信公众号
萨摩耶数科

微信公众号
小省在线

Copyright © 2024 陕西妙网网络科技有限责任公司 All Rights Reserved

增值电信业务经营许可证:陕B2-20210327 | 陕ICP备13005001号 陕公网安备 61102302611033号