数据处理的方法、端侧设备、云侧设备和端云协同系统.pdf
《数据处理的方法、端侧设备、云侧设备和端云协同系统.pdf》由会员分享,可在线阅读,更多相关《数据处理的方法、端侧设备、云侧设备和端云协同系统.pdf(26页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910229629.6 (22)申请日 2019.03.25 (71)申请人 华为技术有限公司 地址 518129 广东省深圳市龙岗区坂田华 为总部办公楼 (72)发明人 李建军吴饶金周昕宇 (74)专利代理机构 北京龙双利达知识产权代理 有限公司 11329 代理人 时林毛威 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2006.01) (54)发明名称 数据处理的方法、 端侧设备、 云侧设备和端 云协同系统 (57)摘要 本申。
2、请公开了人工智能领域中的一种数据 处理的方法、 端侧设备、 云侧设备和端云协同系 统, 该方法包括: 端侧设备接收来自云侧设备发 送的标签值关联关系模型信息, 所述标签值关联 关系模型信息用于指示用户的标签值关联关系 模型, 所述标签值关联关系模型包括所述用户的 不同标签值之间的关联关系; 所述端侧设备根据 第一用户当前已存在的标签值和所述标签值关 联关系模型, 确定所述第一用户当前缺失的标签 值, 以得到所述第一用户的画像标签值集合。 本 申请的数据处理方法、 端侧设备、 云侧设备和端 云协同系统, 可以实现在保护用户隐私的同时提 高用户画像能力。 权利要求书2页 说明书17页 附图6页 C。
3、N 110069706 A 2019.07.30 CN 110069706 A 1.一种数据处理的方法, 其特征在于, 包括: 端侧设备接收来自云侧设备发送的标签值关联关系模型信息, 所述标签值关联关系模 型信息用于指示用户的标签值关联关系模型, 所述标签值关联关系模型包括所述用户的不 同标签值之间的关联关系; 所述端侧设备根据第一用户当前已存在的标签值和所述标签值关联关系模型, 确定所 述第一用户当前缺失的标签值, 以得到所述第一用户的画像标签值集合。 2.如权利要求1所述的方法, 其特征在于, 所述方法还包括: 所述端侧设备根据所述第一用户的画像标签值集合确定所述第一用户的用户画像。 3.。
4、如权利要求1或2所述的方法, 其特征在于, 所述方法还包括: 所述端侧设备对所述第一用户的画像标签值集合中的画像标签值进行差分加噪处理, 得到差分加噪处理后的画像标签数据; 所述端侧设备向所述云侧设备发送所述差分加噪处理后的画像标签数据。 4.根据权利要求1-3中任一项所述的方法, 其特征在于, 所述第一用户当前已存在的标 签值属于第一类型标签值, 所述第一用户当前缺失的标签值属于第二类型标签值; 所述第二类型标签值包括下列标签值中的至少一种: 所述第一用户的性别标签值、 所 述第一用户的年龄标签值、 所述第一用户的位置标签值。 5.一种数据处理的方法, 其特征在于, 包括: 云侧设备获取画像。
5、标签值训练数据, 所述画像标签值训练数据包括多个用户的画像标 签数据; 云侧设备根据所述画像标签值训练数据生成标签值关联关系模型信息, 其中, 所述标 签值关联关系模型信息用于指示用户的标签值关联关系模型, 所述标签值关联关系模型是 根据所述画像标签值训练数据训练得到的, 所述标签值关联关系模型包括所述用户的不同 标签值之间的关联关系; 所述云侧设备向端侧设备发送所述标签值关联关系模型信息。 6.如权利要求5所述的方法, 其特征在于, 所述云侧设备获取画像标签值训练数据, 包 括: 所述云侧设备接收来自多个端侧设备的画像标签数据, 以得到所述画像标签值训练数 据。 7.如权利要求5或6所述的方。
6、法, 其特征在于, 所述画像标签值训练数据中的画像标签 数据是经过差分加噪处理后的画像标签数据, 所述云侧设备根据所述画像标签值训练数据 生成标签值关联关系模型信息, 包括: 所述云侧设备对所述画像标签值训练数据中的画像标签数据进行差分降噪处理, 以得 到差分降噪处理后的画像标签数据; 所述云侧设备根据所述差分降噪处理后的画像标签数据生成标签值关联关系模型信 息。 8.根据权利要求5-7中任一项所述的方法, 其特征在于, 所述第一用户当前已存在的标 签值属于第一类型标签值, 所述第一用户当前缺失的标签值属于第二类型标签值; 所述第二类型标签值包括下列标签值中的至少一种: 所述第一用户的性别标签。
7、值、 所 述第一用户的年龄标签值、 所述第一用户的位置标签值。 权利要求书 1/2 页 2 CN 110069706 A 2 9.一种端侧设备, 其特征在于, 包括: 接收单元, 用于接收来自云侧设备发送的标签值关联关系模型信息, 所述标签值关联 关系模型信息用于指示用户的标签值关联关系模型, 所述标签值关联关系模型包括所述用 户的不同标签值之间的关联关系; 处理单元, 用于根据第一用户当前已存在的标签值和所述标签值关联关系模型, 确定 所述第一用户当前缺失的标签值, 以得到所述第一用户的画像标签值集合。 10.根据权利要求9所述的设备, 其特征在于, 所述处理单元还用于: 根据所述第一用户 。
8、的画像标签值集合确定所述第一用户的用户画像。 11.根据权利要求9或10所述的设备, 其特征在于, 所述设备还包括发送单元, 所述处理单元还用于对所述第一用户的画像标签值集合中的画像标签值进行差分加 噪处理, 得到差分加噪处理后的画像标签数据; 所述发送单元用于向所述云侧设备发送所述差分加噪处理后的画像标签数据。 12.根据权利要求9-11中任一项所述的设备, 其特征在于, 所述第一用户当前已存在的 标签值属于第一类型标签值, 所述第一用户当前缺失的标签值属于第二类型标签值; 所述第二类型标签值包括下列标签值中的至少一种: 所述第一用户的性别标签值、 所 述第一用户的年龄标签值、 所述第一用户。
9、的位置标签值。 13.一种云侧设备, 其特征在于, 包括: 接收单元, 用于获取画像标签值训练数据, 所述画像标签值训练数据包括多个用户的 画像标签数据; 处理单元, 用于根据所述画像标签值训练数据生成标签值关联关系模型信息, 其中, 所 述标签值关联关系模型信息用于指示用户的标签值关联关系模型, 所述标签值关联关系模 型是根据所述画像标签值训练数据训练得到的, 所述标签值关联关系模型包括所述用户的 不同标签值之间的关联关系; 发送单元, 用于向端侧设备发送所述标签值关联关系模型信息。 14.根据权利要求13所述的设备, 其特征在于, 所述接收单元具体用于: 接收来自多个 端侧设备的画像标签数。
10、据, 以得到所述画像标签值训练数据。 15.根据权利要求13或14所述的设备, 其特征在于, 所述画像标签值训练数据中的画像 标签数据是经过差分加噪处理后的画像标签数据, 所述处理单元具体用于: 对所述画像标签值训练数据中的画像标签数据进行差分降噪处理, 以得到差分降噪处 理后的画像标签数据; 根据所述差分降噪处理后的画像标签数据生成标签值关联关系模型信息。 16.根据权利要求13-15中任一项所述的设备, 其特征在于, 所述第一用户当前已存在 的标签值属于第一类型标签值, 所述第一用户当前缺失的标签值属于第二类型标签值; 所述第二类型标签值包括下列标签值中的至少一种: 所述第一用户的性别标签。
11、值、 所 述第一用户的年龄标签值、 所述第一用户的位置标签值。 17.一种端云协同系统, 其特征在于, 包括如权利要求9至12中任一项所述的端侧设备 与如权利要求13至16中任一项所述的云侧设备。 权利要求书 2/2 页 3 CN 110069706 A 3 数据处理的方法、 端侧设备、 云侧设备和端云协同系统 技术领域 0001 本申请涉及通信领域, 更具体地, 涉及一种数据处理的方法、 端侧设备、 云侧设备 与端云协同系统。 背景技术 0002 随着人工智能(artificial intelligence, AI)的迅速发展, 人们对生活有了更强 烈的智能化需求, 移动终端成为集娱乐、 工。
12、作和学习活动的通用设备, 扮演着个人智能助理 的角色。 AI给终端带来的价值在于入口越来越精准、 便利、 人性化。 理解用户, 主动服务, 终 生学习给用户带来极致的体验, 成为手机终端智慧化的未来。 0003 充分利用终端设备上的各种资源优势, 可以为用户提供精准、 贴心的全方位个性 化服务。 例如, 基于用户画像(user profile, UP)的应用, 即根据用户社会属性、 生活习惯和 消费行为等信息而抽象出的一个标签化的用户模型。 构建用户画像的核心工作即是给用户 贴 “标签” , 而标签是通过对用户信息分析而来的高度精炼的特征标识。 0004 用户画像标签数据作为基本、 核心的数据。
13、, 画像的准确率会对业务形成直接的影 响。 用户标签的准确率和完整性是影响用户画像准确率的主要因素。 同时, 人们对隐私保护 要求越来越高, 因此, 如何在保证用户隐私的同时提高用户画像能力已成为亟待解决的问 题。 发明内容 0005 本申请提供一种数据处理的方法、 端侧设备、 云侧设备和端云协同系统, 可以在保 证用户隐私的同时提高用户画像能力。 0006 第一方面, 提供了一种数据处理的方法, 该方法包括: 端侧设备接收来自云侧设备 发送的标签值关联关系模型信息, 所述标签值关联关系模型信息用于指示用户的标签值关 联关系模型, 所述标签值关联关系模型包括所述用户的不同标签值之间的关联关系;。
14、 端侧 设备根据第一用户当前已存在的标签值和所述标签值关联关系模型, 确定所述第一用户当 前缺失的标签值, 以得到所述第一用户的画像标签值集合。 0007 例如, 标签值关联关系模型中的变量包括用户的第一类标签值、 第二类标签值, 其 中第一类标签值可以是用户的性别标签值、 年龄标签值、 位置标签值, 第二类标签值可以是 端侧设备采集到的用户的多个应用程序APP的标签值, 由于用户对于不同的APP存在不同的 偏好, 因此端侧设备可以根据用户使用该APP的使用时长记录该APP的标签值, 该标签值对 应用户使用APP的时长。 0008 在本申请实施例中, 端侧的用户画像模块在进行用户画像时, 需要。
15、获得用户的性 别信息, 由于用户可以选择不反馈性别、 年龄、 位置等个人隐私信息, 因此用户的性别标签 值可能存在缺失的情况。 例如, 当App#1中的广告推荐算法需要根据用户的画像向用户推荐 某些业务时, 由于该业务与用户的性别标签值存在依赖关系, 当用户的画像标签数据中的 性别标签值缺失时, 根据该画像标签数据计算得到的用户画像难以满足业务的需求。 说明书 1/17 页 4 CN 110069706 A 4 0009 本申请的数据处理方法, 可以根据端侧设备获取到的画像标签数据中存在的画像 标签值和标签值关联关系模型, 确定画像标签数据中缺失的画像标签值, 以得到完整的画 像标签数据, 从。
16、而提高了端侧画像的能力和用户画像的准确率。 0010 结合第一方面, 在第一方面的某些实现方式中, 该方法还包括: 端侧设备根据所述 第一用户的画像标签值集合确定所述第一用户的用户画像。 0011 结合第一方面, 在第一方面的某些实现方式中, 该方法还包括: 端侧设备对所述第 一用户的画像标签值集合中的画像标签值进行差分加噪处理, 得到差分加噪处理后的画像 标签数据; 所述端侧设备向所述云侧设备发送所述差分加噪处理后的画像标签数据。 0012 由于端侧设备对所述用户的画像标签值集合中的画像标签值进行差分加噪处理, 用户的画像标签数据在由端侧上传至云侧的过程中实现了加密保护, 画像标签数据在云侧。
17、 设备经过差分减噪处理保留了画像标签数据的统计学特征, 因此在端云协同系统中实现了 用户的隐私保护。 0013 结合第一方面, 在第一方面的某些实现方式中, 所述第一用户当前缺失的标签值 包括以下至少一项: 所述第一用户的性别标签值、 所述第一用户的年龄标签值、 所述第一用 户的位置标签值。 0014 应理解, 用户可以不主动反馈部分隐私信息, 因此端侧设备采集到的用户画像标 签值集合中存在缺失的画像标签值。 0015 第二方面, 提供了一种数据处理的方法, 该方法包括: 云侧设备获取画像标签值训 练数据, 所述画像标签值训练数据包括多个用户的画像标签数据; 云侧设备根据所述画像 标签值训练数。
18、据生成标签值关联关系模型信息, 其中, 所述标签值关联关系模型信息用于 指示用户的标签值关联关系模型, 所述标签值关联关系模型是根据所述画像标签值训练数 据训练得到的, 所述标签值关联关系模型包括所述用户的不同标签值之间的关联关系; 所 述云侧设备向端侧设备发送所述标签值关联关系模型信息。 0016 在本申请的数据处理方法中, 云侧设备可以根据画像标签数据集训练得到画像标 签数据中的不同类型标签值的关联关系。 由于云侧设备可以采集多个端侧设备对应的用户 的画像标签数据, 因此可以采用机器学习算法计算得到画像标签数据中不同类型标签值的 关联关系。 0017 在本申请实施例中, 云侧设备可以获取1。
19、000万画像标签数据样本, 样本中包括第 一类型标签值、 第二类型标签值, 其中第一类型标签值可以是用户的性别标签值、 年龄标签 值、 位置标签值, 第二类标签值可以是用户的应用程序App的标签值。 云侧设备可以训练得 到用户的性别标签值和不同应用程序App的标签值之间的关联关系。 0018 在一种实现中, 云侧设备计算得到的关联关系模型可以反映第一类型标签值与第 二类型标签值的关联关系, 例如, 该关联关系模型包括Gender标签值Y与用户的App标签值 Xi的关联关系可以记作: 0019 0020 其中, X1, X2, Xi分别对应App1, App2, AppN的标签值, A1, A2。
20、, Ai分别对应X1, X2, Xi 的系数。 0021 在一种实现中, 云侧设备可以采用线性回归算法计算得到Ai, 从而得到上述关联 说明书 2/17 页 5 CN 110069706 A 5 关系模型信息, 由于该关联关系模型信息是根据多个用户画像标签数据训练得到的, 因此 可以反映画像标签数据的统计学特征, 即画像标签数据的群体特征。 0022 相应的, 当端侧设备的用户画像模块存在缺失的画像标签值时, 可以根据用户的 画像标签数据中已有的画像标签值、 管理关系模型计算得到缺失的画像标签值, 从而提高 了端侧用户画像的准确率。 0023 由于云侧设备可以采集大量的画像标签值训练数据, 因。
21、此云侧设备可以计算得到 用户的画像标签关联关系模型, 该关联关系模型包括用户的不同标签值之间的关联关系, 从而端侧设备可以根据用户已有的画像标签值、 该关联关系模型信息确定用户缺失的画像 标签值。 0024 结合第二方面, 在第二方面的某些实现方式中, 所述云侧设备获取画像标签值训 练数据, 包括: 所述云侧设备接收来自多个用户的画像标签数据, 以得到所述画像标签值训 练数据。 0025 结合第二方面, 在第二方面的某些实现方式中, 所述画像标签值训练数据中的画 像标签数据是经过差分加噪处理后的画像标签数据, 所述云侧设备根据所述画像标签值训 练数据生成标签值关联关系模型信息, 包括: 所述云。
22、侧设备对所述画像标签值训练数据中 的画像标签数据进行差分降噪处理, 得到差分降噪处理后的画像标签数据; 所述云侧设备 根据所述差分降噪处理后的画像标签数据生成标签值关联关系模型信息。 0026 结合第二方面, 在第二方面的某些实现方式中, 所述用户当前缺失的标签值包括 下列标签值中的至少一种: 所述用户的性别标签值、 所述用户的年龄标签值、 所述用户的位 置标签值。 0027 第三方面, 提供了一种数据处理的方法, 该方法包括: 端侧设备获取用户的第一类 型标签的标签值; 所述端侧设备根据所述第一类型标签的标签值、 第一关联关系模型确定 所述用户的第二类型标签的标签值, 以得到第一画像标签数据。
23、; 其中, 所述第一关联关系模 型包括所述第一类型标签的标签值、 所述第二类型标签的标签值的关联关系。 0028 例如, 标签值关联关系模型中的变量包括用户的第一类标签值、 第二类标签值, 其 中第一类标签值可以是用户的性别标签值、 年龄标签值、 位置标签值, 第二类标签值可以是 端侧设备采集到的用户的多个应用程序APP的标签值, 由于用户对于不同的APP存在不同的 偏好, 因此端侧设备可以根据用户使用该APP的使用时长记录该APP的标签值, 该标签值对 应用户使用APP的时长。 0029 在本申请实施例中, 端侧的用户画像模块在进行用户画像时, 需要获得用户的性 别信息, 由于用户可以选择不。
24、反馈性别、 年龄、 位置等个人隐私信息, 因此用户的性别标签 值可能存在缺失的情况。 例如, 当App#1中的广告推荐算法需要根据用户的画像向用户推荐 某些业务时, 由于该业务与用户的性别标签值存在依赖关系, 当用户的画像标签数据中的 性别标签值缺失时, 根据该画像标签数据计算得到的用户画像难以满足业务的需求。 0030 本申请的数据处理方法, 可以根据端侧设备获取到的画像标签数据中存在的画像 标签值和标签值关联关系模型, 确定画像标签数据中缺失的画像标签值, 以得到完整的画 像标签数据, 从而提高了端侧画像的能力和用户画像的准确率。 0031 结合第三方面, 在第三方面的某些实现方式中, 用。
25、户的第一业务与所述第二类型 标签的标签值存在依赖关系。 说明书 3/17 页 6 CN 110069706 A 6 0032 结合第三方面, 在第三方面的某些实现方式中, 该方法还包括: 端侧设备确定所述 用户的画像标签数据中的所述第二类型标签的标签值是否存在; 在所述第二类型标签的标 签值不存在时, 所述端侧设备根据所述第一类型标签的标签值、 所述第一关联关系模型确 定所述用户的第二类型标签的标签值。 0033 结合第三方面, 在第三方面的某些实现方式中, 第一画像标签数据用于所述端侧 设备对所述用户进行画像, 所述第一画像标签数据包括所述第一类型标签的标签值、 所述 第二类型标签的标签值。。
26、 0034 结合第三方面, 在第三方面的某些实现方式中, 该方法还包括: 所述端侧设备对所 述第一画像标签数据进行差分加噪处理, 以得到第二画像标签数据; 所述端侧设备向云侧 设备发送所述第二画像标签数据。 0035 结合第三方面, 在第三方面的某些实现方式中, 该第二类型标签的标签值包括以 下至少一项: 所述用户的性别标签值、 所述用户的年龄标签值、 所述用户的位置标签值。 0036 第四方面, 提供了一种数据处理的方法, 该方法包括: 云侧设备根据第一画像标签 数据集中的第一类型标签的标签值、 第二类型标签的标签值对用户的画像标签数据的关联 关系模型进行训练, 以得到第一关联关系模型; 所。
27、述云侧设备向端侧设备发送所述第一关 联关系模型, 所述第一关联关系模型包括所述第一类型标签的标签值、 所述第二类型标签 的标签值的关联关系。 0037 在本申请的数据处理方法中, 云侧设备可以根据画像标签数据集训练得到画像标 签数据中的不同类型标签值的关联关系。 由于云侧设备可以采集多个端侧设备对应的用户 的画像标签数据, 因此可以采用机器学习算法计算得到画像标签数据中不同类型标签值的 关联关系。 0038 例如, 云侧设备获取1000万画像标签数据样本, 样本中包括第一类型标签值、 第二 类型标签值, 其中第一类型标签值可以是用户的性别标签值、 年龄标签值、 位置标签值, 第 二类标签值可以。
28、是用户的应用程序App的标签值。 云侧设备可以训练得到用户的性别标签 值和不同应用程序App的标签值之间的关联关系。 0039 在一种实现中, 云侧设备计算得到的关联关系模型可以反映第一类型标签值与第 二类型标签值的关联关系, 例如, 该关联关系模型包括Gender标签值Y与用户的App标签值 Xi的关联关系可以记作: 0040 0041 其中, X1, X2, Xi分别对应App1, App2, AppN的标签值, A1, A2, Ai分别对应X1, X2, Xi 的系数。 0042 在一种实现中, 云侧设备可以采用线性回归算法计算得到Ai, 从而得到上述关联 关系模型信息, 由于该关联关系。
29、模型信息是根据多个用户画像标签数据训练得到的, 因此 可以反映画像标签数据的统计学特征, 即画像标签数据的群体特征。 0043 相应的, 当端侧设备的用户画像模块存在缺失的画像标签值时, 可以根据用户的 画像标签数据中已有的画像标签值、 管理关系模型计算得到缺失的画像标签值, 从而提高 了端侧用户画像的准确率。 0044 结合第四方面, 在第四方面的某些实现方式中, 该方法还包括: 所述云侧设备获取 说明书 4/17 页 7 CN 110069706 A 7 来所述自端侧设备发送的用户的画像标签数据, 以得到画像标签数据集; 所述云侧设备对 所述画像标签数据集进行差分减噪处理, 以得到所述第一。
30、画像标签数据集。 0045 第五方面, 提供一种端侧设备, 所述端侧设备用于执行第一方面或第三方面中任 一种可能的实现方式中的方法。 0046 具体地, 所述端侧设备可以包括用于执行第一方面或第三方面中任一种可能的实 现方式中的方法的模块。 0047 第六方面, 提供一种云侧设备, 所述云侧设备用于执行第二方面或第四方面中任 一种可能的实现方式中的方法。 0048 具体地, 所述云侧设备可以包括用于执行第二方面或第四方面中任一种可能的实 现方式中的方法的模块。 0049 第七方面, 提供一种端侧设备, 所述端侧设备包括存储器和处理器, 所述存储器用 于存储指令, 所述处理器用于执行该存储器存储。
31、的指令, 并且对所述存储器中存储的指令 的执行使得所述处理器执行第一方面或第三方面中任一种可能的实现方式中的方法。 0050 第八方面, 提供一种云侧设备, 所述云侧设备包括存储器和处理器, 所述存储器用 于存储指令, 所述处理器用于执行该存储器存储的指令, 并且对所述存储器中存储的指令 的执行使得所述处理器执行第二方面或第四方面中任一种可能的实现方式中的方法。 0051 第九方面, 提供了一种计算机可读介质, 所述计算机可读介质存储有计算机程序 (也可以称为代码, 或指令)当其在计算机上运行时, 使得计算机执行上述第一方面至第四 方面中任一种可能实现方式中的方法。 0052 第十方面, 提供。
32、一种端云协同系统, 所述端云协同系统包括第五方面提供的端侧 设备与第六方面提供的云侧设备。 附图说明 0053 图1为本申请实施例提供的端云协同系统的示意性结构图。 0054 图2为本申请实施例提供的数据处理方法的应用场景图。 0055 图3为本申请实施例的一种数据处理方法的示意性交互图。 0056 图4为本申请实施例的另一种数据处理方法的示意性交互图。 0057 图5为本申请实施例的一种数据处理方法的示意性流程图。 0058 图6为本申请实施例的另一种数据处理方法的示意性流程图。 0059 图7为本申请实施例提供的一种端侧设备的示意性结构图。 0060 图8为本申请实施例提供的另一种端侧设备。
33、的示意性结构图。 0061 图9为本申请实施例提供的一种云侧设备的示意性结构图。 0062 图10为本申请实施例提供的另一种云侧设备的示意性结构图。 0063 图11为本申请实施例的一种端云协同系统的示意性框图。 具体实施方式 0064 下面将结合附图, 对本申请中的技术方案进行描述。 0065 人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控 制的机器模拟、 延伸和扩展人的智能, 感知环境、 获取知识并使用知识获得最佳结果的理 说明书 5/17 页 8 CN 110069706 A 8 论、 方法、 技术及应用系统。 人工智能也就是研究各种智能。
34、机器的设计原理与实现方法, 使 机器具有感知、 推理与决策的功能。 人工智能领域的研究包括机器人, 自然语言处理, 计算 机视觉, 决策与推理, 人机交互, 推荐与搜索, AI基础理论等。 0066 本申请实施例中的端侧设备也可称之为用户设备(user equipment, UE)、 移动台 (mobile station, MS), 或移动终端(mobile terminal)等。 端侧设备, 例如, 可以是移动电 话(或称为 “蜂窝” 电话)或者具有移动终端的计算机, 例如, 可以是便携式、 袖珍式、 手持式、 计算机内置的或者车载的移动装置。 本申请实施例中的云侧设备可以是服务器或者是服。
35、务 器集群, 该云侧设备还可以称为计算节点, 或者云侧计算集群。 0067 为了便于理解与描述本申请实施例提供的数据处理的方法, 下面先结合图1描述 本申请实施例提供的端云协同系统100。 端云协同平台区别于传统的云平台, 将提供一定计 算能力的移动终端也加入资源池中, 共同完成计算任务, 达到了对空闲资源的有效利用。 0068 如图1所示, 端云协同系统100包括端侧设备110和云侧设备120。 端侧设备110包括 用户画像平台111和应用程序112(APP1,APP2, , APPN)。 该用户画像平台111包括: 差分隐 私模块111a、 用户画像模块111b、 用户画像库111c; 其。
36、中, 差分隐私模块111a用于对画像标 签数据进行差分加噪处理; 应用程序112运行在端侧设备110上, 用于为用户提供认知计算 功能; 本地画像库111c用于保存画像标签数据。 0069 云侧设备120包括云侧建模模块、 用户画像平台, 其中用户画像平台包括: 云侧分 发模块、 差分隐私模块、 云侧数据库, 其中差分隐私模块用于对画像标签数据进行差分减噪 处理。 0070 用户画像包括: 端侧用户画像、 云侧用户画像, 其中, 端侧用户画像只在端侧采集 和使用用户的标签值, 不将相关数据上传到云侧或第三方。 由于数据的存储和使用范围只 限定在用户手机上, 而用户手机属于个人物品, 因此隐私泄。
37、漏的风险较小。 端侧画像方法只 是在端侧进行画像, 由于端侧的计算能力和标签数据量有限, 因此存在较大的局限性, 导致 用户画像能力不足、 用户画像准确性较低。 0071 其中, 影响端侧画像准确率的因素包括: 端侧用户不一定会按实际情况提交数据, 导致画像标签值存在一定错误率; 端侧用户不一定会提交画像标签数据, 导致一定比例的 画像标签的标签值缺失; 或者, 端侧用户的标签数据量比较小。 0072 对于云侧用户画像, 用户在端侧的行为数据和云侧的打点数据需要上传到云侧, 该方法的用户数据量比较全面, 可以利用机器学习算法, 极大的提升用户画像的准确率。 由 于云侧用户画像所有数据上传到云侧。
38、, 因此用户隐私泄漏的风险较高。 0073 应理解, 数据分析是决策的重要依据, 数据打点作为数据分析的源头, 负责数据采 集, 以达到为数据分析提供数据源的目的; 其中, 打点软件开发工具包(software development kit, SDK)用于在客户端使用过程中, 将采集到的用户操作行为数据发送到指 定服务器。 0074 本申请的用户画像方法和装置, 融合端侧画像和云侧画像的优点, 实现业务对画 像准确率的同时保护用户的隐私。 0075 下面, 对本申请实施例涉及的相关术语进行介绍。 0076 1、 用户画像 0077 用户画像(Persona)是根据用户社会属性、 生活习惯和消。
39、费行为等信息而抽象出 说明书 6/17 页 9 CN 110069706 A 9 的一个标签化的用户模型。 可以根据用户的目标、 行为和观点的差异, 将不同的用户区分为 不同的类型, 然后从每种类型中抽取出典型特征, 赋予名字、 照片等一些人口统计学要素、 场景等描述, 就形成了一个人物原型, 该人物原型即为用户画像。 简而言之, 用户画像为了 让研发团队在产品设计的过程中能够抛开个人喜好, 将焦点关注在目标用户的动机和行为 上进行产品设计。 0078 用户画像作用包括: 1)精准营销, 分析产品潜在用户, 针对特定群体利用短信邮件 等方式进行营销; 2)用户统计; 数据挖掘, 构建智能推荐系。
40、统。 利用关联规则计算, 利用聚类 算法分析; 3)进行效果评估, 完善产品运营, 提升服务质量, 相当于市场调研、 用户调研, 以 提供高水平的服务。 0079 由于用户画像是基于大量的用户数据而建立的, 因此需要收集用户数据, 用户数 据分为: 网络行为数据、 服务内行为数据、 用户内容偏好数据、 用户交易数据等; 在收集到足 够用户数据后进行用户行为建模, 进而为不同用户生成对应的用户画像。 0080 2、 神经网络模型 0081 神经网络模型指的是经过大量有标签的数据训练, 得到的用于执行认知计算的程 序和数据。 神经网络模型包括神经网络架构组件与神经网络参数组件。 其中, 神经网络架。
41、构 组件指的是神经网络模型中与神经网络算法相关的网络及其层次结构, 也就是上述的神经 网络模型中用于执行认知计算的程序。 神经网络参数组件指的是训练神经网络模型时得到 的大量参数, 作为神经网络架构中神经元的值, 也就是上述的神经网络模型中用于执行认 知计算的数据。 在数据挖掘中采用差分隐私保护技术的目的是在提取有价值信息的同时不 泄露敏感隐私信息。 0082 3、 差分隐私算法 0083 差分隐私作为一种新的隐私定义, 与传统的隐私保护方法相比, 有其独特的优势。 差分隐私保护模型假设攻击者拥有最大背景知识, 在这一假设下, 差分隐私保护能应对各 种新型攻击, 无需考虑攻击者所拥有的任何可能。
42、的背景知识。 差分隐私保护有着坚实的数 学基础, 对隐私保护有着严格的定义和可靠的量化评估方法, 使得不同的参数处理下的隐 私保护水平具有可比性。 差分隐私保护在大大降低隐私泄露风险的同时, 极大地保证了数 据的可用性。 0084给定一个随机算法K, 若对于任意的兄弟表T1和T2, 以及任意的输出(K) 满足: PrK(T1)SePrK(T2)S, 即: PrK(T1)S/PrK(T1)Se, 则算法K满 足差分隐私。 0085 其中, 从差分隐私保护的定义可知, 隐私保护预算 用于控制算法M在邻近数据集 上获得相同输出的概率比值, 反映了算法M所的隐私保护水平, 越小, 隐私保护水平越高。 。
43、在极端情况下, 当 取值为0时, 即表示算法M针对D与D 的输出的概率分布完全相同, 由于D 与D 为邻近数据集, 根据数学归纳法可以很显然地得出结论, 即当 0时, 算法M的输出结 果不能反映任何关于数据集的有用的信息。 因此, 从另一方面, 的取值同时也反映了数据 的可用性, 在相同情况下, 越小, 数据可用性越低。 0086 在本申请实施例中, 端侧设备包括端侧设备#1、 端侧设备#2, 端侧设备A1属于用户 A#1、 端侧设备#2属于用户A#2, 其中端侧设备#1采集得到的用户A1的画像标签数据不存在 缺失的画像标签值, 端侧设备#2采集得到的用户A2的画像标签数据存在缺失的画像标签 。
44、说明书 7/17 页 10 CN 110069706 A 10 值。 0087 云侧设备在采集画像标签数据时按照预定义的用户模型采集用户数据, 预定义的 用户模型包括第一类型标签、 第二类型标签, 云侧设备采集得到完整的画像标签数据。 0088 图2示出了本申请提供的数据处理方法的应用场景图。 0089 如图2所示, 端云协同系统包括端侧设备、 云侧设备, 其中, 端侧设备包括端侧用户 画像模块、 端侧差分隐私模块、 端侧存储模块, 端侧用户画像模块用于提供用户画像, 端侧 差分隐私模块用于对画像标签数据进行差分加噪处理, 端侧存储模块用于提供计算规则; 云侧设备包括云侧差分隐私模块、 云侧建。
45、模模块、 云侧分发模块, 云侧差分隐私模块用于对 画像标签数据进行差分减噪处理, 云侧建模模块用于根据计算规则对画像标签数据进行训 练以得到关联关系模型。 0090 作为示例而非限定, 在本申请实施例中, 如表1所示, 用户画像包括9个标签, 其中 标签(Gender)属于第一类型标签、 标签(TOPApp)属于第二类型标签, 第一类型标签属于用 户隐私信息。 0091 表1用户的画像标签 0092 画像标签画像标签的含义 Gender性别 App1用户最常使用的APP名 App2用户第2常用的APP名 App3用户第3常用的APP名 APP4用户第4常用的APP名 APP5用户第5常用的AP。
46、P名 APP6用户第6常用的APP名 APP7用户第7常用的APP名 APP8用户第8常用的APP名 0093 如表1所示用户的画像标签, 端侧设备可以收集用户的APP使用记录, 以得到用户 不同APP的标签值。 Gender标签值依赖用户的反馈, 而用户可以选择不反馈, 当用户选择不 反馈Gender标签值时, 即第二类型标签的标签值不存在, 对应的画像标签值为缺失状态。 0094 当某个业务对该标签值(Gender)存在较大依赖的话, 那么此时该业务就会受到较 大影响。 而用户信息的标签值属于个人隐私, 采用云侧画像需要将用户信息的标签值上传 至云侧, 容易造成用户隐私泄露。 0095 应。
47、理解, 标签是某一种用户特征的符号表示, 标签体系两个视角: 一 “化整为零” , 每个标签都规定了我们观察、 认识和描述用户的一个角度; 二 “化零为整” , 用户画像是一个 整体, 各个维度不孤立, 标签之间有联系, 用户画像就可以用标签的集合来表示。 0096 以下, 对本申请的数据处理的方法进行介绍。 0097 本申请的数据处理的方法、 端侧设备、 云侧设备和端云协同系统, 采用差分隐私算 法、 线性回归算法训练大数据模型, 可以补齐Gender标签的值, 在保护用户隐私的同时实现 提升用户画像能力。 0098 本申请的数据处理的方法, 在端侧采用差分隐私算法对用户画像标签数据进行差 。
48、说明书 8/17 页 11 CN 110069706 A 11 分加噪处理, 即采用差分隐私算法对用户画像标签数据在端云传输进行加密, 在云侧采用 差分隐私算法对用户画像标签数据进行差分降噪处理, 其中, 端侧差加噪处理的用户画像 标签数据在云侧用于计算群体标签关联关系, 云侧采用机器学习算法对差分降噪后的用户 画像标签数据进行训练, 以得到缺失画像标签值与已有画像标签值的关联关系模型。 云侧 向端侧发送该关联关系模型, 该关联关系模型用于端侧根据已有画像标签值计算得到缺失 画像标签值。 0099 图3示出了本申请的数据处理的方法的示意性交互图。 0100 在S301, 云侧设备获取画像标签值。
49、训练数据, 该画像标签值训练数据包括多个用 户的画像标签数据。 0101 例如, 云侧设备采集1000万画像标签数据样本, 以得到画像标签值训练数据, 其 中, 该画像标签数据中包括第一类画像标签值、 第二类画像标签值。 0102 如表2所示, 用户A#1的画像标签数据包括Gender标签的标签值, TOPApp的标签值。 0103 表2用户A#1的画像标签数据 0104 序号画像标签标签值 1Gender5 2App11 3App28 4App315 5APP420 6APP520 7APP620 8APP720 9APP820 0105 在S302, 云侧设备根据标签值训练数据生成标签值关。
50、联关系模型信息, 标签值关 联关系模型信息用于指示用户的标签值关联关系模型。 0106 例如, 用户画像标签数据集可以包括1000万用户画像标签样本, 云侧设备采用线 性回归算法对用户画像标签数据集进行训练, 以得到Gener标签值和TOPApp标签值的标签 值关联关系模型信息。 0107 在本申请实施例中, 云侧设备根据画像标签训练数据计算得到标签值Y与标签值 Xi的关联关系如下: 0108 0109 其中, Xi属于第一类标签值, Y属于第二类标签值, Ai为Xi的权重系数。 0110 如表3所示, 云侧设备根据画像标签数据集中的Xi、 Y计算得到Xi的权重系数Ai, 即 目标变量与Xi的。
- 内容关键字: 数据处理 方法 设备 协同 系统
废弃物焚烧装置.pdf
板框过滤器.pdf
建筑外立面绿化安装架.pdf
防反抽气动快速接头.pdf
适用于线末自动装框的上下料运输系统.pdf
地下水灌溉农业深度节水装置.pdf
耐磨板堆焊冷却平台装置.pdf
晶圆承载装置.pdf
预应力混凝土管桩模具用打磨装置.pdf
煤粉制备系统.pdf
适用不同飞机机型的垂尾维修平台.pdf
散热器侧板的管孔冲压机.pdf
风力输送撒盐系统.pdf
高效率的清废装置及专用吸头组件.pdf
化工污水处理装置.pdf
各向异性微滤膜及其制备方法和应用.pdf
稳定面可调的盾构管片拼装方位检测装置.pdf
异构双模冗余定时器、芯片以及车辆.pdf
静轴肩穿透焊搅拌头.pdf
颈动脉斑块易损性分级方法、装置、电子设备及存储介质.pdf
基于计算机视觉的自动化点云定向方法、设备及存储介质.pdf
婴童奶制品核心营养成分的膜分离重组方法及其应用.pdf
安全生产的双重预防管理方法、系统、设备及存储介质.pdf
用于滤波器的浮点数据处理系统.pdf
易调平的冲压设备工作台及冲压设备.pdf
车辆的相机位姿确定方法、装置、计算机设备和存储介质.pdf
钢厂板坯智能倒垛方法与系统.pdf
纱线捻线机.pdf
用于配电柜的操作机器人的分体式地刀结构.pdf
双核设备的数据处理方法和双核设备.pdf
氮化硼钝化增强的砷化镓基半导体器件及其制备方法.pdf
网络模型的转换方法、装置、终端及计算机可读存储介质.pdf
一种知识产权服务管理系统.pdf
衣服组合方法及衣服组合终端.pdf
日程提醒方法及装置.pdf
基于PERT的项目进度跟踪调整方法及系统.pdf
电力营销线上的无纸化业务办理方法及系统.pdf
一种基于用户银行卡信息的快捷认证支付方法.pdf
一种防止重复支付的方法和装置.pdf
任务处理方法及装置.pdf
一种基于信息的网络支付方法及系统.pdf
一种行政审批系统.pdf
一种移动视频广告假量识别方法和系统.pdf
一种会员制金融服务管理系统.pdf
广告发布系统及方法.pdf
面向网络平台的自动推广方法、系统和计算设备.pdf
实时抽奖活动的中奖概率动态配置及抽奖信息处理的装置.pdf
一种多功能会员卡的实现方法.pdf
一种广告投放控制方法及装置.pdf
通过将用户标签化进行广告投放的方法和系统.pdf
一种移动应用广告投放的质量评分方法.pdf