(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211201936.1
(22)申请日 2022.09.29
(71)申请人 西藏众陶联供应链服 务有限公司
地址 851600 西藏自治区拉萨市林周县鹏
博健康产业园管理委员会1 11B
申请人 佛山众陶联供应链服 务有限公司
林周佳住家网络科技有限公司
林周利利佳供应链服 务有限公司
共青城市众陶联供应链服 务有限公
司
(72)发明人 张铭滔 陈虹斌 何健进 蒙伟铿
吴佳柔
(74)专利代理 机构 佛山市禾才知识产权代理有
限公司 4 4379
专利代理师 梁永健(51)Int.Cl.
G06Q 40/04(2012.01)
G06Q 10/06(2012.01)
G06N 7/00(2006.01)
(54)发明名称
基于产业互联网平台交易数据的交易会员
评分方法及系统
(57)摘要
本发明公开了基于产业互联网平台交易数
据的交易会员评分方法及系统, 该方法包括从产
业互联网平台数据库提取全产业互联网平台会
员的历史交易数据; 建立第一评分维度数据集、
第二评分维度数据集和第三评分维度数据集; 使
用训练集训练得到维度逻辑回归评分卡模型; 使
用测试集对维度逻辑回归评分卡模 型进行测试,
评估模型效果, 并判断模型效果是否为较佳效
果; 根据维度逻辑回归评分卡模型和给定参数,
计算得到评分卡; 根据评分卡中的评分项, 对提
出业务需要的客户进行评分。 本发 明解决了目前
大部分银行采用传统的对生产资料线下核验、 经
营资料等办理贷款方式对接产业互联网平台上
的客户, 缺乏为应用产业互联网交易数据而作的
信用评分应用的问题。
权利要求书3页 说明书9页 附图1页
CN 115423631 A
2022.12.02
CN 115423631 A
1.基于产业互联网平台交易数据的交易会员评分方法, 其特 征在于: 包括以下步骤:
步骤S1: 从产业互联网平台数据库中, 提取全产业互联网平台会员的历史 交易数据;
步骤S2: 对历史交易数据进行数据分析和清空, 并统计历史交易数据中每列数据数值
为空的数量, 计算每列数据的缺 失率; 对于缺 失率大于第一预设值的列数据进 行删除, 对于
数值大于第二预设值的异常数据进行近似替换;
步骤S3: 根据清空后的历史 交易数据, 建立第一评分维度数据集;
步骤S4: 对所述第一评分维度数据集中每个评分维度进行共线性探索, 分别生成一一
对应的散点图, 并排除相关度高的评分维度, 得到第二评分维度数据集;
步骤S5: 对所述第二评分维度数据集进行划分, 划分为训练集、 测试集和验证集;
步骤S6: 对所述第二评分维度数据集 中全部评分维度计算WOE值和IV值, 并排除IV值小
于第三预设值的评分维度, 得到第三评分维度数据集;
步骤S7: 根据所述训练集和所述第三评分维度数据集进行逻辑回归训练, 得到维度逻
辑回归评分卡模型;
步骤S8: 使用所述测试集对维度逻辑回归评分卡模型进行测试, 评估模型效果, 并判断
模型效果是否为较佳效果, 若为较佳效果, 则无需调整 所述维度逻辑回归评 分卡模型, 若不
是较佳效果, 则需调整所述维度逻辑回归评分卡模型;
步骤S9: 根据所述维度逻辑回归评分卡模型和给定参数, 计算得到 评分卡;
步骤S10: 根据所述评分卡中的评分项, 对提出业 务需要的客户进行评分。
2.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法, 其特征
在于: 在步骤S3中, 所述第一评分维度数据集包括所属行业、 交易采购商数、 交易采购商数
增长率、 交易金额占比、 贸易金额增长率、 每年累计贸易额、 企业逾期率、 交易次数、 供应商
品量、 供应商品量增长率、 单宗平均额、 单宗平均额增长率、 平均付款操作时间、 复审不通过
率以及逾期超90日次数。
3.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法, 其特征
在于: 在步骤S6中, 对所述第二评分维度数据集中每个评分维度计算WOE值和IV值, 具体的
计算公式如下:
其中, i为WOE分箱的编号; GoodT为全部WOE分箱 中良性样本的数量; Goodi为每个WOE分
箱中良性样本的数量; BadT为全部WOE分箱中恶性样本的数量; Badi为每个WOE分箱中恶性样
本的数量。
4.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法, 其特征
在于: 在步骤S9中, 所述评分卡中的分值具体是每 个WOE分箱中的得分, 得分公式如下:
offset=score ’ ‑factor*od ds权 利 要 求 书 1/3 页
2
CN 115423631 A
2其中, factor表示WOE分箱的因子分值; offset表示计算WOE分箱中良性样本的参数;
score’表示初始得分, 给定值为720; pdo表示初始因子分值, 给定值为20; o dds表示区分比
率, 给定值为50; scor en表示第n个WOE分箱中的得分; n表示WOE分箱的数量; LR.int ercept_
n表示逻辑回归评分卡模型训练后得出的模型参数; coef_n表示逻辑回归评分卡模型中得
出的每个评分维度的函数值; WOEn表示评分维度数据集中每 个评分维度的WOE值。
5.根据权利要求1所述的基于产业互联网平台交易数据的交易会员评分方法, 其特征
在于: 全产业互联网平台会员的历史交易数据跟随着时间进行更新, 通过对新的历史交易
数据进行维度计算, 得到新数据集, 并将每个评分维度均提取出来进行PSI的比较, 具体包
括:
步骤S51: 使用逻辑回归模型对新数据集进行预测, 得到预测结果后将新数据集拆分成
好客户数据集和坏客户数据集;
步骤S52: 对所述好客户数据集和所述坏客户数据集根据评分结果进行排序, 并将两个
数据集各拆分为若干组;
步骤S53: 将若干组所述好客户数据集和若干组所述坏客户数据集对应的得分转换成
直方图。
6.基于产业互联网平台交易数据的交易会员评分系统, 其特征在于: 使用权利要求1 ‑5
任一项所述基于产业互联网平台交易数据的交易会员评分方法, 所述系统包括:
提取模块, 用于从产业互联网平台数据库中提取全产业互联网平台会员的历史交易数
据;
第一数据处理模块, 用于对历史交易数据进行数据分析和清空, 并统计历史交易数据
中每列数据数值为空的数量, 计算每列数据的缺失率; 对于缺失率大于第一预设值的列数
据进行删除, 对于数值大于第二预设值的异常数据进行近似替换; 并根据清空后的历史交
易数据, 建立第一评分维度数据集;
第二数据处理模块, 用于对所述第一评分维度数据集中每个评分维度进行共线性探
索, 分别生成一 一对应的散点图, 并排除相关度高的评分维度, 得到第二评分维度数据集;
数据划分模块, 用于对所述第 二评分维度 数据集进行划分, 划分为训练集、 测试集和验
证集;
第三数据处理模块, 用于对所述第二评分维度数据集中全部评分维度计算WOE值和IV
值, 并排除IV值小于第三预设值的评分维度, 得到第三评分维度数据集;
模型建立模块, 用于根据所述训练集和所述第三评分维度数据集进行逻辑回归训练,
得到维度逻辑回归评分卡模型;
模型评估模块, 用于使用所述测试集对维度逻辑回归评分卡模型进行测试, 评估模型权 利 要 求 书 2/3 页
3
CN 115423631 A
3
专利 基于产业互联网平台交易数据的交易会员评分方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:43上传分享