• [区域初赛赛题问题] 第一次参加这种,请问所以初赛可以用pytorch吗?
    看了一些其他帖子有的说要手搓pytorch的,汗。。。
  • [技术干货] 【转载】什么是不经意传输?
    不经意传输(oblivious transfer)是一个密码学协议,在这个协议中,消息发送者从一些待发送的消息中发送一条给接收者,但事后对发送了哪一条消息仍然oblivious(不知道),这个协议也叫茫然传输协议。第一种形式的不经意传输(oblivious transfer),最初是在1981由Michael O.Rabin提出,在这种不经意传输中,发送者Alice发送一条消息给接收着Bob,而Bob以1/2的概率接收到信息,在结束后Alice并不知道Bob是否接收到了信息,而Bob能确信地知道自己是否收到了信息。另一种更实用的不经意传输协议,被称为2选一不经意传输(1 out 2 oblivious transfer)由 Shimon Even, Oded Goldreich, 和Abraham Lempel 在1985年提出,在这种形式的不经意传输模型中,Alice每次发两条信息(m1、m2)给Bob,Bob提供一个输入,并根据输入获得输出信息,在协议结束后,Bob得到了自己想要的那条信息(m1或者m2),而Alice并不知道Bob最终得到的是哪条。转自https://zhuanlan.zhihu.com/p/208295083
  • [技术干货] TICS隐私计算技术路线指引
    近年来,大数据、人工智能、云计算等数字技术蓬勃发展,新技术带来了新业态和新增长。然而,隐私泄露、网络欺诈、流量欺诈等现象也成为数据要素健康流通的阻碍,给互联网治理带来严峻挑战;同时,机构把数据视为重要资产,基于行业竞争、隐私安全等考虑,都不愿与其他机构明文共享,导致数据孤岛问题长期存在。因此,有必要构建一套各参与方认可的安全有效的数据协作技术,隐私计算应时而生,开始受到广泛的重视和运用。隐私计算(Privacy computation)是指在保护数据本身不对外泄露的前提下,实现数据共享、分析、计算、建模的技术集合,达到对数据“可用不可见”的目的。在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。这套复杂的技术体系包含硬件、密码学、分布式机器学习等多种底层技术,目前常见的技术路线主要有三种,即多方安全计算(Secure Multi-party Computation, MPC)、联邦学习(Federated Learning, FL)、可信执行环境(Trusted Execution Environment, TEE)。1、 多方安全计算MPC指参与者在无可信第三方的情况下,利用隐私数据共同计算一个目标函数,每方仅获取自己的计算结果,无法通过计算过程中的交互数据推测出其他方的输入数据。其优点是数据加密基于严格的密码理论,不以信任任何参与方、操作员、系统、硬件或软件为基础。各方对其数据拥有绝对控制权,保障基本数据和信息不被泄露,计算准确度高。缺点是大量使用密码学算法,导致计算性能存在瓶颈,如几十万数据样本的计算时长要比明文方式慢数倍甚至数十倍。2、 联邦学习联邦学习是以一个中央服务器为中心节点。中央服务器生成通用模型供各参与方下载,各参与方利用本地数据训练模型,将训练后的模型更新内容上传。中央服务器聚合更新内容后,优化初始通用模型,各参与方继续下载更新的通用模型训练迭代,上述过程不断重复直至达到既定标准。整个联邦学习过程中,各参与方的数据始终保存在本地服务器,降低了数据泄露的风险。根据参与方数据源分布的不同情况,联邦学习可以分为横向联邦学习、纵向联邦学习和联邦迁移学习。一般数据矩阵横向为行,表示一条训练样本;纵向为列,表示一个数据特征。横向联邦学习是指联合多个参与者具有相同特征的多行样本进行学习(如同一地区的两家银行),即数据特征是重叠的,这可以增加模型训练的样本总量。纵向联邦学习是指联合多个参与者共同样本的不同数据特征进行学习(如同一地区的银行和商超),即训练样本是重叠的,这可以增加模型训练的数据维度。联邦迁移学习是指参与者间数据特征和样本重叠都很少时,如不同地区的银行(多为收支及信用数据)和商超(多为浏览和采购数据)间的联合,需要利用数据、任务、模型之间的相似性,将在源领域学习过的模型迁移到目标领域的学习过程。FL的优点是一方面能够解决训练阶段数据特征单一的问题,另一方面各参与方计算的数据体量未增加,算力成本小。缺点是利用中心服务器收集的模型梯度及权重等信息,还是存在反推出参与方数据分布的可能,且较难规避某参与方恶意提供虚假数据影响模型准确性,以及各参与方计算能力不一致、网络连接状态不稳定等影响操作效率的问题。3、 可信执行环境可信执行环境是一种基于硬件的技术。它将数据、特定功能、应用程序,同操作系统、管理程序、虚拟机管理器以及其他特定进程隔离,保证其内部加载的程序和数据在机密性和完整性上得到保护,只有经过授权的参与方才能访问数据和执行操作。TEE具有通用和高效的优势,可以单独用于隐私计算,也可以和其他技术结合来保护隐私,计算性能与明文计算基本相同;缺点是交付模式太重,需要较高的硬件投入,且跟国际CPU 厂商绑定较深,会影响TEE技术的可信度。以上三种技术路线各有所长,MPC应用场景最广,FL在联合建模时最为常用,TEE仍在探索软硬件结合的交付模式。同时,多种技术结合应用于同一个隐私计算项目也开始出现,比如某些金融科技公司推出的隐私计算一体机,将基于硬件的TEE和MPC及FL无缝衔接,以提升计算及安全性能。另外,随着行业标准的建立,可以降低市场认知成本,实现产品间的互联互通,促进行业朝更加标准、规范的方向发展。 当前华为云TICS产品在隐私计算的三条路线中均有布局,联邦数据分析是可信智能计算提供的关系型数据安全共享和分析功能,即多方安全计算。支持创建联邦数据分析作业,根据合作方已提供的数据,编写相关sql作业并获取您所需要的分析结果,同时能够在作业运行保护数据使用方的数据查询和搜索条件,避免因查询和搜索请求造成的数据泄露。联邦机器学习是可信智能计算服务提供的在保障用户数据安全的前提下,利用多方数据实现的联合建模,当前支持横向联邦和纵向联邦功能。
  • [技术干货] ChatGPT是什么
     ChatGPT(Chat Generative Pre-trained Transformer)是人工智能研究实验室OpenAI(OpenAI:马斯克等人创建的人工智能公司)新推出的人工智能技术驱动的自然语言处理工具。主要使用了TransFormer神经网络架构,使得ChatGPT具有聊天互动的能力,可以根据特定聊天场景进行交流,还具备撰写邮件、脚本、文案、翻译、代码等不同类型文字的功能。同时,ChatGPT使用预先设计的道德准则进行训练,拒绝回答不合理的提问和要求,以及拒绝提供包含暴力、歧视、犯罪意图的提问回答。  据了解,微软也将全线接入ChatGPT,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。这些产品包括且不限于Bing搜索引擎、包含Word、PPT、Excel的Office全家桶、Azure云服务、Teams聊天程序等等。根据媒体Semafor的一份新报告,微软计划在未来几周内将ChatGPT的下一代版本GPT-4整合到旗下搜索引擎必应(Bing)中。谷歌正着手测试新聊天机器人,该聊天机器人名为“学徒巴德(Apprentice Bard)”,员工可以提出问题并收到类似ChatGPT的详细答案。另一个产品部门一直在测试新的搜索桌面设计,以便用问答的形式来使用。百度也已投入开发类ChatGPT的相关技术,项目名字:文心一言(ERNIE Bot),预计三月完成内测,面向公众开放,目前,文心一言在进行上线前的调试。  ChatGPT的功能可以带来科技便利,并具有在许多领域产生有益影响的潜力,但也伴随着很多风险。  上线像ChatGPT这样的工具,使得一些技术工作人员面临失去工作的风险。例如,聊天机器人可以被开发来培训组织中的员工,从而导致人类培训师冗员。会计师、法律文员、软件开发人员,甚至X射线分析师,这些工作将被全世界的ChatGPT抢走。ChatGPT的迅速普及有可能颠覆包括教育、金融、新闻媒体、法律等许多行业。  前OpenAI研究团队负责人、英属哥伦比亚大学计算机科学系副教授Jeff Clun在接受采访时也提到:真正的风险是,人们在不是某个主题的专家时通常会信任它的输出,因为在局外人看来那似乎非常有说服力、正确和权威,但只有专家可以认识到它犯了很多错误。目前,所有大型语言模型都倾向于过度自信、编造事实、有偏见和犯错误,尽管它们经常生成令人印象深刻的文本。每个行业和人类社会的各个方面都应该考虑这项技术的影响。即使我的预测是错误的,但有一件事是肯定的:AI驱动的大规模变革正在影响我们经济和人类文化的几乎每个方面。  认知科学家加里·马库斯(Gary Marcus)认为,ChatGPT存在两个核心问题:神经网络“既不可靠也不真实”。谷歌的人工智能研究人员在最近的一篇论文中承认,仅仅扩大模型的规模难以成功。仅扩大规模不会带来“安全和事实基础方面的改进”。许多对ChatGPT的怀疑和批评都归结为将其与人类的比较,而事实上,大型语言模型并不能像人类那样思考。  ChatGPT语言模型还需要不断更新和完善,其数据来自训练数据库,但是目前数据库只更新到2021年,无法确保其真实可靠性。 
  • [其他] 【资讯】【转载】一图读懂|数据二十条系列解读
      https://www.ndrc.gov.cn/xxgk/jd/zctj/202212/t20221220_1343711.html?code=&state=123
  • [指导教程] 如何使用sha256生成用于样本对齐的id字段
    在TICS可信智能计算服务中,进行模型训练前要求提供数据集的双方执行样本对齐,建立起描述相同样本的特征和标签之间的对应关系。在实际生产业务中往往使用手机、身份证等唯一性较高的字段作为id列,但出于用户隐私保护的考虑,这些数据不建议使用明文的方式进行样本对齐,TICS建议使用SHA256的散列算法对原始数据进行处理后再投入样本对齐功能中。以java代码为例,下列代码列举了几种将字符串转换为sha256哈希码的方法。使用Apache Commons Langimport org.apache.commons.codec.digest.DigestUtils; class Main { public static void main(String[] args) throws Exception { String password = "SHA-256"; String sha256 = DigestUtils.sha256Hex(password); System.out.println(sha256); } } 输出结果: bbd07c4fc02c99b97124febf42c7b63b5011c0df28d409fbb486b5a9d2e615ea使用guavaimport com.google.common.base.Charsets; import com.google.common.hash.HashCode; import com.google.common.hash.Hasher; import com.google.common.hash.Hashing; class Main { public static void main(String[] args) throws Exception { String password = "SHA-256"; Hasher hasher = Hashing.sha256().newHasher(); hasher.putString(password, Charsets.UTF_8); HashCode sha256 = hasher.hash(); System.out.println(sha256); } } 输出结果: bbd07c4fc02c99b97124febf42c7b63b5011c0df28d409fbb486b5a9d2e615eaJava原生类MessageDigestimport javax.xml.bind.DatatypeConverter; import java.nio.charset.StandardCharsets; import java.security.MessageDigest; class Main { public static void main(String[] args) throws Exception { String password = "SHA-256"; MessageDigest md = MessageDigest.getInstance("SHA-256"); byte[] digest = md.digest(password.getBytes(StandardCharsets.UTF_8)); // DatatypeConverter在java9+的版本后被删除,可使用bytesToHex()方法 // String sha256 = bytesToHex(digest); String sha256 = DatatypeConverter.printHexBinary(digest).toLowerCase(); System.out.println(sha256); } private static final char[] HEX_ARRAY = "0123456789ABCDEF".toCharArray(); public static String bytesToHex(byte[] bytes) { char[] hexChars = new char[bytes.length * 2]; for (int j = 0; j < bytes.length; j++) { int v = bytes[j] & 0xFF; hexChars[j * 2] = HEX_ARRAY[v >>> 4]; hexChars[j * 2 + 1] = HEX_ARRAY[v & 0x0F]; } return new String(hexChars); } }
  • [云服务] 【数据使能】可信智能计算服务 TICS能力项
    分类文档链接备注最新动态cid:link_4特性清单cid:link_3FAQcid:link_2华为云在线课程(免费)华为云可信智能计算服务TICShttps://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXEX013+Self-paced/about?isAuth=0&cfrom=hwc本课程由华为EI的张老师,介绍华为云可信智能计算服务TICS——使能多方数据安全融合分析和联邦训练。华为云可信智能计算服务基于可信执行环境TEE、安全多方计算MPC、联邦学习、区块链等技术,实现数据在流通、计算过程中全链路的安全保护和审计回溯,推动跨机构数据的可信融合和协同,安全释放数据价值。一小时玩转可信智能计算服务TICScid:link_1本课程主要介绍什么是隐私计算及云服务TICS的功能与使用。华为云开发者网TICS开放能力cid:link_5
  • [指导教程] 【视频课程】TICS发布视频课程《一小时玩转可信智能计算服务TICS》,欢迎学习
    正式链接:https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXCC004+Self-paced/about
  • [最佳实践] 基于华为隐私计算产品TICS实现城市跨部门数据隐私计算,助力实现普惠金融【玩转华为云】作者:dayu_dls
       华为云可信智能计算服务TICS,旨在打破组织内部、行业内部、跨行业之间的数据孤岛,基于可信执行环境、安全多方计算、同态加密、区块链等技术,实现在数据隐私保护下的多方数据联合SQL分析和联邦学习,协同伙伴和客户,推动数据要素的可信流通和开发利用。本案例以普惠金融为背景,介绍下华为可信智能计算服务TICs是如何助力城市跨部门数据实现隐私计算的。TICS官网链接1、普惠金融的背景       2005年联合国首次提出了普惠金融的概念,并将其定义为:一个能有效、全面地为社会所有阶层(特别是贫穷的、低收入的群体)提供服务的金融体系。通俗点讲就是:让所有的老百姓们都享受到更多的金融服务。截止目前,我们国家相继出台了多篇普惠金融政策文件,可见国家对于普惠金融的扶持力度之大。在普惠金融发展过程中也遇到一些问题,其中之一就是社会信用体系建设滞后。我国因为没有完善的个体信用信息,银行判断风险难度大,小微企业融资的难度也因此提升2、客户痛点信用评估:小微企业数量多、经营波动大、坏账率高,对数据的覆盖度和及时性要求高,单水电气数据对评估企业实时经营状态就具有价值安全隐患:把全量明文数据暴露会有潜在安全隐患,一旦泄露难以有效控制,委办局数据共享存在顾虑流程繁杂:社保、个税和水电气等数据放在政务云,但由不同委办局管理,银行单独申请非常困难3、客户诉求希望以更贴近用户已有的SQL应用开发模式,实现隐私保护下的多方数据统计分提供一种隐私增强计算技术保护下的多方数据联邦SQL统计分析能力4、实现步骤利用政府的数据支撑企业决策,银行是数据提供方、社保、个税、水电气等是数据提供方,主要目的是消费方想使用提供方的数据做一些决策,这里不是联邦学习的例子,会给出一个规则,公式里面的字段涉及到不通数据的提供方,这时候保护的一个主要目标就是数据消费方可以使用这些数据去做计算,但是这些字段的数据又是敏感的,在用的过程中不能泄露这些数据,所以这是一个要解决的关键问题。银行导入小微企业信用评估规则到可信智能计算节点;向政数局数据管理员发起数据使用的申请;数据管理员同意银行使用数据;TICS分发计算任务,加密调用社保、个税、水电气数据;银行基于可信智能计算环境运行评估模型,获取企业信用的评估结果;5、带来价值数据安全:通过联邦SQL、联邦学习、多方安全计算等技术,对委办局数据在数据接入传输处理使用中实现全链路隐私保护服务于人:把属于不同委办局的数据通过可信机制发挥价值,促进金融效率提升可追责:政数局、其他委办局、银行分别扮演监管者/处理者、数据拥有者、数据使用者的角色,责任模型清晰可追踪:可以实现全链路可视化和区块链审计溯源,可在关键场景追溯数据处理流程
  • [技术干货] 【大架光临】TICS可信智能计算,让数据释放更多价值
    视频见链接:https://hcs.huawei.com/portal/cloud-horizon/details?id=41a85b20b60c40dbb543767806e2e51c
  • [公告] 【TICS动态】可信智能计算服务TICS HCS 8.2.0版本正式发布
    【TICS动态】可信智能计算服务TICS HCS 8.2.0版本正式发布可信智能计算服务TICS 配套HCS 8.2.0版本正式发布,将联合伙伴打造端到端的数据可信流通解决方案。产品功能动态联盟管理动态构建可信计算联盟,实现联盟内严格可控的数据使用和监管。邀请云租户作为数据方,动态构建可信计算联盟,实现联盟内严格可控的数据使用和监管。联盟是联邦计算的载体,合作方只有加入联盟才能参与联邦计算。安全的作业管理作业时,数据使用的过程可审计、可追溯。TICS数据集成支持联邦数据分析、联邦机器学习和联邦预测作业等作业方式。联邦数据分析联邦数据分析是可信智能计算提供的关系型数据安全共享和分析功能。您可以创建联邦数据分析作业,根据合作方已提供的数据,编写相关sql作业并获取您所需要的分析结果,同时能够在作业运行保护数据使用方的数据查询和搜索条件,避免因查询和搜索请求造成的数据泄露。联邦机器学习联邦机器学习是可信智能计算服务提供的在保障用户数据安全的前提下,利用多方数据实现的联合建模。联邦预测作业联邦预测作业在保障用户数据安全的前提下,利用多方数据和模型实现样本联合预测。可信智能计算节点数据参与方使用数据源计算节点模块实现自主可控的数据源注册、隐私策略(脱敏、加密、水印)的设定、元数据的发布等,为数据源计算节点提供全生命周期的可靠性监控、运维管理。多方融合分析对接多种主流数据存储系统,为数据消费者实现多方数据的融合分析,参与方敏感数据能够在具有TEE安全支撑的聚合计算节点中实现安全计算。多方联邦训练对接主流深度学习框架实现横向和纵向联邦建模,支持基于TEE和SMPC(如不经意传输、同态加密等)的多方样本对齐和训练模型保护。云端容器化部署参与方数据源计算节点云原生容器部署,聚合计算节点动态扩容,支持云、边缘、HCSO多种部署模式。可视化数据监管为数据参与方提供可视化的数据使用流图,提供插件化的区块链对接存储,实现使用过程的可审计、可追溯。应用场景政企信用联合风控金融机构对于中小微企业的信用数据通常不足,央行征信数据覆盖率有限,不良企业多家骗贷事件屡有发生。金融机构与政府部门,如税务部门、市场监管部门、水电公司等在保护各方原始数据隐私的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。优势:提升模型准确率多方机构实现算法层面联合建模,提升了需求方模型的预测效果。数据隐私保护强多方采用隐私集合求交PSI对齐样本数据,本地数据或模型加密后在安全环境可信执行环境ArmTrustZone中运算,实现数据可用不可得。精细化的数据隐私保护策略,确保分析结果中强制执行隐私数据的脱敏。图1 政企信用联合风控政府数据融合共治由于数据安全以及隐私保护问题,政府各委办局数据尚未充分共享。多委办厅局数据的融合碰撞对于政府业务共治起到关键作用,例如本次疫情联防联控、综合治税等业务场景。共治场景均要实现在保护数据隐私的前提下,通过多个局委办数据的融合分析,得到数据碰撞结果,提升政府业务的治理效能。优势:政府多委办局之间密文数据融合计算,实现多方数据的融合分析。基于隐私集合求交实现多方安全SQL JOIN分析, 原始数据保存在各个用户本地,统计分析算子下推到本地数据域执行。多方分析JOIN算子通过可信执行环境ArmTrustZone进行数据隐私保护,计算过程将多方加密后数据提交到可信执行环境ArmTrustZone中完成计算,计算结果加密返回给数据使用方。支持自定义脱敏保护策略,设定SQL语句安全等级检查,防止非法SQL执行。图1-1 政府数据融合共治金融联合营销传统金融企业联合营销模式中,金融企业往往需要将双方的数据集中到一个安全实验室中进行标签融合,模型训练,但常面临数据泄露和隐私等挑战。联邦建模采用分布式架构进行部署和建模,参与联合营销的企业原始和明细数据不出库的前提下进行跨域数据建模,实现精准营销,同时保障企业数据安全与个人隐私。优势:原始数据不出企业安全域、不出库,实现“数据不动、算法动”,数据使用自主可控。联合多方正样本的效果,丰富模型的特征,提高模型的泛化能力。计算全程保障企业数据安全与个人隐私。图1 金融联合营销使能数据交易传统数据交易方式,交易的是数据所有权,交易完成后,数据被无限制的拷贝和复制。采用可信交易方式,交易的不是数据,而是数据的使用权,卖家卖的是对某个数据的用法用量,不用担心数据被拷贝和复制。优势:数据不离开卖家,更放心。卖家控制“隐私规则”,控制“用法和用量”。支持三层异构,跨组织、跨地域、跨数据源。低成本部署,支持边缘模式单节点部署。图1 使能数据交易
  • [其他] 【资讯】【转载】隐私计算发展脉络丨从技术起源了解隐私计算备受资本青睐的原因
    https://baijiahao.baidu.com/s?id=1743911840200045229&wfr=spider&for=pc
  • [最佳实践] 【转载】华为云可信智能计算服务TICS在联邦广告算法上的探索及应用
    ​原文文章来自《华为在联邦广告算法上的探索及应用》https://mp.weixin.qq.com/s/3_ZGEzoOG7WRuofbBFIeFw作者:刘璐 DataFunTalk***04纵向联邦学习如何服务广告场景​​​接下来我们看一下,纵向联邦学习是怎么服务于广告场景的。上图画的是纵向联邦学习在广告中的架构图。纵向联邦学习天然可以解决标签缺失问题,除了这个问题之外,还可以解决是转化率预估这种稀疏场景下的特征不足,特征维度有限的问题。如果广告主系统和DSP系统进行联邦学习,它不仅能够解决标签问题,同时能够帮助模型增加特征维度,更好地提高模型的准确度。在广告主和DSP进行离线联邦训练服务中,必然要用到特征和标签。广告平台侧(DSP)可以利用用户特征、广告特征、上下文特征以及High Level特征和Low Level特征;广告主除了可以提供后端转化数据之外,还可以提供端内行为数据、历史兴趣标签以及短期行为标签,来完成模型的训练。不同于已有的广告链路,整个请求响应都是在广告平台侧发生。如果使用了纵向联邦学习,在离线训练阶段请求就必然要经历广告主系统,同样在线推理也必然要经历广告主系统,所以它的请求链路发生了改变。​ 纵向联盟学习我们主要是依托于TICS服务完成,TICS全称是可信智能计算服务,产品架构图如上图所示。TICS基于多方安全计算以及区块链等技术,实现了数据在存储、流通和计算过程中端到端的安全和可审计。它主要提供如下一些功能,如联盟管理、数据融合分析、计算节点、联邦分析计算、数据使用监管和容器化部署。使用这个服务的前提是,所有参与方要在一个联盟链中,也就是说在同一个联盟的用户,需要进行相关节点的部署。计算节点是以两种方式进行部署的,一种是以容器化的形式部署,支持云容器CCE引擎,另一种是边缘节点的部署,也就是智能边缘平台服务部署。云容器引擎的优点是提供了高可靠和高性能的企业级服务,支持Kubernetes社区原生应用以及相应工具的使用。TICS服务内有一个计算节点,计算节点的主要功能是实现数据源注册,并且提供了一些隐私策略的发布,比如某个数据源可以选择是敏感的、非敏感的以及脱敏的设定,然后是元数据的发布。​ 使用TICS平台构建联邦学习服务非常简单。首先我们要加入联盟,进入计算节点,选择作业类型。作业类型有两种,一种是联邦数据分析,一种是联邦机器学习(模型训练)。​ 在作业类型选择完成之后,就会进行样本初筛和样本对齐。纵向联邦学习第一个过程就是要进行PSI隐私交集,找出共同的用户群体。不同的参与方其用户量天然就不一样,比如有的参与方用户量达到了亿,有的参与方则只有百万或者几万等等。为了加速求交过程,我们首先要进行样本粗筛,然后再进行PSI样本对齐。​ 在样本对齐之后,就可以进行特征选择,并且启动训练,配置模型参数,发起评估,包括准确率、AUC、KS、F1、召回率等各项指标的评估。纵向联邦学习主要是跟广告主进行合作,主要产品形态有两种:一种是广告主只需要提供标签Y;另外一种如果广告主很open,并且希望其转换效果能够得到提升,他既可以提供标签Y,也可以提供特征X,然后广告主和广告平台发起联邦学习。广告链路中性能是一个重要的问题,整个广告链路过程要控制在100毫秒。并不是所有的广告主都可以满足时延的性能要求,针对这种场景我们提供了两种方案,一种是离线方案,不需要做实时计算。另一种是在线方案,广告主和广告平台测试发现性能100毫秒可以满足,就可以做模型的实时推理在线计算。如果广告主侧满足不了时延要求,就用模型提前预测出广告主的转化率放在在线模型上面,不做实时计算。比如请求来了之后,通过查表获得转化率,然后再进行后边的竞价和播放链路。这就是纵向联邦学习的两种产品形态。07QA环节Q2:TICS平台目前在系统里实现了什么样的联邦学习算法,在线预测的时候是否会影响用户体验?A2:TICS目前最基本的逻辑回归是有的,最基本的XGBoost树模型也是有的,因为这两种模型是针对一些银行或者金融是比较常见的,因为它要求模型可解释。对于广告而言,因为广告涉及到的数据还有一些特征是非常多的,而且数据也非常稀疏,所以对于广告产品而言往往需要一些深度模型。TICS上一些深度学习模型,多任务模型等后续都会发布上线。​
  • [其他] 【资讯】【转载】共筑金融安全屏障,华为云金融安全CXO思享会成功举办
    来源:南早网原文链接: https://baijiahao.baidu.com/s?id=1718754606138823220&wfr=spider&for=pc近日,《中华人民共和国个人信息保护法》正式施行,隐私保护、信息安全再度成为各界的热议话题。信息技术的快速发展和广泛普及,成为了互联网金融行业发展的重要推动力,与此同时,也为企业在数据治理方面增加了诸多前所未有的挑战。妥善经管隐私数据、筑建信息安全堡垒成为互联网金融企业进阶发展的关键。大会合影  为探索数字时代个人信息保护以及更为广泛的数据治理方案,12月9日,华为云联合北京市互联网金融行业协会、祥云科技举办了以“发展金融科技,保障金融安全”为主题的金融 安全 CXO 思享会。会议活动邀请华为云中国区金融行业总经理朱兵、北京市互联网金融行业协会秘书长王思聪、中国银行法学研究会理事肖飒、华为云金融行业总监诸旻、华为云 EI 可信智能计算服务 TICS 首席架构师张煜及北京市互联网金融行业协会会员单位代表、祥云科技代表等人,来到华为北京高端交流中心进行行业交流,共同探讨金融行业安全管理与发展趋势、分享互联网金融行业信息安全最佳实践,探索数字时代个人信息保护以及广泛的数据治理方案。嘉宾热切交谈  金融行业的新赛道,可信治理是大势所趋  对于金融业而言,《个人信息保护法》的颁布影响深远。近年来,金融科技快速发展,大数据被视为行业转型升级的一大助推器。在数字经济时代下,作为资产的数据能够产生财富效应,拥有了数据就拥有了资产。中国银行法学研究会理事,肖飒女士  中国银行法学研究会理事肖飒表示,随着个保法的正式实施,公民个人信息授权方式也发生了极大变化,国家将不再认可概括授权的合法性,获取公民个人信息,必须先取得公民的同意。在我国,只要公民同意授权,企业获取数据就是合法合规的。肖飒提出,金融行业属于数据密集型行业,对数据依赖性极强,如何守护好个人信息,更好地保障数据安全,是金融业必须面对的重要课题。企业应当及时调整“隐私协议”、“注册协议”等及内部数据合规体系。同时,应当采取必要措施,保障境外接收方处理个人信息的活动达到《个信法》规定的个人信息保护标准。  深耕数字化,共建全场景智慧金融  全场景、智慧、生态是走向全场景智慧金融的三个关键词。“全场景”就是通过人、物、应用的全互联,将金融服务带向千行百业。“智慧”指的是将AI引入金融行业的核心生产系统和业务主流程,通过AI与应用的结合,提供智慧服务。“生态”是指全场景智慧金融的目标是打造生态型金融产业,共建开放、共赢的产业环境。华为云金融行业总监,诸旻先生  华为云金融行业总监诸旻在会上指出,云原生正在成为金融机构云基础设施的标配,华为云云原生2.0提供资源高效,极致体验,敏捷创新,数据智能,安全合规的云基础设施,为金融客户提供以应用为中心的金融云数字底座。帮助金融客户进行全面的创新升级,真正打造出科技与金融业务协同发展的数字化优势,携手共建全场景智慧金融。华为云EI可信智能计算服务 TICS首席架构师,张煜女士  华为云EI可信智能计算服务TICS首席架构师张煜表示,数据是重要的资产已经成为社会共识,数据创造价值必须实现流通,尤其在数据安全上升到国家战略层面时,更需要在保护隐私的前提下挖掘数据的价值。隐私计算技术在多种金融场景中极大的满足了大家的合规需求, 实现“可用不可见”、“可用并可控”、“可控可计量”。预计到2024年,在一些大数据平台,隐私计算技术将成为数据保护刚需。华为云TICS为了保护用户隐私,一方面,在各类数据提供方的信任域内,通过构筑安全代理,实现数据的安全提供;另一方面,通过构筑可信执行环境TEE或采用安全多方计算MPC技术,实现数据的安全聚合,将数据资源范围从企业扩张到海量的社会数据,在数据隐私保护前提下实现多方数据联邦探查分析和联邦学习,通过数据流通创造更大价值。圆桌会议  在圆桌讨论环节上,参会人员围绕国家政策对金融科技行业的影响、技术驱动金融科技行业业务发展以及金融科技行业对云技术的诉求等议题展开了讨论。  华为云目前自服务220+金融客户,已经成为全球五朵云之一。华为云作为金融数字化转型的重要伙伴,不仅在技术上追求创新,同时积极地与客户一同探索,以实现数智融合,升级有道。展望未来,华为云希望与金融伙伴共同成长,以技术创新引领产业发展,实现共创共赢。
  • [公告] 可信智能计算TICS通过金标委《多方安全计算金融应用》评测
总条数:19 到第
上滑加载中