说明:收录90万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211203369.3 (22)申请日 2022.09.29 (71)申请人 甘肃新泉风力发电有限公司 地址 735000 甘肃省酒泉市瓜州县渊泉街 141号 申请人 兰州陇能电力科技有限公司 (72)发明人 陈雷 战鹏 张中伟 连亚龙  张凯 赵斌 刘龙龙 曹征  徐启钊 曹雷 张睿骁 张彦琪  张延凯 葛智平 李乔森 陈军  (74)专利代理 机构 青岛致嘉知识产权代理事务 所(普通合伙) 3723 6 专利代理师 王巧丽 (51)Int.Cl. G06F 16/215(2019.01)G06K 9/62(2022.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 50/06(2012.01) (54)发明名称 一种风电功率曲线异常数据剔除方法 (57)摘要 本发明公开了一种基于分区间孤立森林和 均值漂移聚类的风电功率曲线异常数据剔除方 法, 包括以下步骤: (1)采用分区间孤立森林算法 剔除风力曲线中的分散型异常数据和弃风限电 数据; (2)判断风力曲线中是否存在弃风数据, 若 是, 转步骤(3), 否则得到符合风电机组运行规律 的数据样本; (3)采用均值漂移聚类算法对剩余 异常数据进行剔除, 得到 符合风电机组运行规律 的数据样 本。 本发明通过提出分区间孤立森 林和 均值漂移聚类组合算法的数据处理手段, 该算法 不仅对于常规文献着重讨论的风电功率曲线有 效, 对于发生严重弃风现象 的风电机组的功率曲 线也能发挥作用, 从而在一定程度上缓解风电机 组的异常数据问题, 为提高风机预测精度提供了 方案。 权利要求书1页 说明书6页 附图4页 CN 115510043 A 2022.12.23 CN 115510043 A 1.一种基于分区间孤立森林和均值漂移聚类的风电功率曲线异常数据剔除方法, 其特 征在于, 该 方法包括以下步骤: (1)采用分区间孤立森林算法剔除风力曲线中的分散型异常数据和弃风限电数据; (2)判断风力曲线中是否存在弃风数据, 若是, 转步骤(3), 否则得到符合风电机组运行 规律的数据样本; (3)采用均值漂移聚类算法对剩余异常数据进行剔除, 得到符合风电机组运行规律的 数据样本 。 2.如权利要求1所述的方法, 其特征在于, 在步骤(1)中, 所述分区间孤立森林算法剔除 风力曲线中的分散型异常数据和弃风限电数据包括以下步骤: (1‑1)对数据进行预处理, 包括: 剔除风速小于设定切入风速且对应功率大于0的数据, 以及剔除风速高于设定切出风速且 对应功率 为负值的数据; (1‑2)以设定功率取值对风电功率进行功率区间划分, 采用孤立森林算法对每个区间 内的风速 ‑功率数据进行检测, 以进行大部分分散数据和部分偏离正常数据较远的弃风数 据的剔除; (1‑3)获得每个功率区间的异常检测结果后, 将其绘制到图中并观察结果, 判断风电机 组是否存在分散型 数据, 若是, 转 步骤(1‑4), 否则结束 孤立森林算法; (1‑4)对设定风速对风速区间进行划分, 对区间内的风速 ‑功率数据继续采用孤立森林 算法检测异常点以剔除异常数据。 3.如权利 要求2所述的方法, 其特征在于, 在步骤(1 ‑2)中, 在孤立森林算法中构 建每颗 树的子样本数量选择区间样本和25 6中的较小值, 异常比例参数根据情况进行相应调整。 4.如权利要求3所述的方法, 其特征在于, 所述异常比例参数根据情况进行相应调 整具 体为: 当分散型数据较多时异常比例参数设置为0.1, 当分散型数据分布稀疏或正常数据比 例较低时异常比例参数设置为0.0 5。 5.如权利 要求2所述的方法, 其特征在于, 在步骤(1 ‑4)中, 孤立森林算法检测异常点的 过程中, 各区间的异常数据比例参数设置为0.0 5以避免正常数据被剔除。 6.如权利要求1所述的方法, 其特征在于, 在步骤(3)中, 所述采用均值漂移聚类算法对 剩余异常数据进行剔除具体为: 对划分的每 个区间进行聚类处 理, 保留区间上 方数据。 7.如权利要求6所述的方法, 其特征在于, 在均值漂移聚类算法中, 设置各区间的带宽 参数为13 5。权 利 要 求 书 1/1 页 2 CN 115510043 A 2一种风电功率 曲线异常数据剔除方 法 技术领域 [0001]本发明属于新能源大数据分析应用领域, 尤其涉及一种基于分区间孤立森林和均 值漂移聚类的风电功率曲线异常数据剔除方法。 背景技术 [0002]现代社会经济 的迅速发展对电能需求日益增多, 随着化石燃料消耗殆尽、 生态环 境恶化问题凸显, 现有传统的化石燃料发电方式逐渐受 限, 而风能、 光能、 水能等可再生能 源发电进而获得了广泛应用。 由于风电机组通常在较为恶劣的环境下运行, 加之调度人员 为了规避风资源的反调峰特性对电力系统可能带来严重危害, 导致设备监测到的风速 ‑功 率数据中存在大量无用数据, 这些数据不符合风机本身运行规律, 且会对功率预测造成影 响。 [0003]目前, 风电功率曲线的异常数据识别是新能源研究领域的热点。 很多学者已经提 出了算法研究, 但是现有的研究成果大多只考虑了某一类特定的风电功率 曲线, 即正常数 据比例多于异常数据比例且弃风现象并不严重, 鲜有涉及严重弃风数据的风电机组曲线。 由于在现有研究中, 考虑单一类型风电功率 曲线的研究成果较多, 这导致其算法通常只能 针对这一类别的曲线, 难以适应复杂多变的其 他场景, 不具 备良好的工程实用性。 发明内容 [0004]为克服现有技术的缺点和不足, 本发明的目的在于提供一种基于分区间孤立森林 和均值漂移聚类的风电功率曲线异常数据剔除方法。 [0005]本发明是这样实现的, 一种基于分区间孤立森林和均值漂移聚类的风电功率曲线 异常数据剔除方法, 该 方法包括以下步骤: [0006](1)采用分区间孤立森林算法剔除风力曲线中的分散型异常数据和弃风限电数 据; [0007](2)判断风力曲线中是否存在弃风数据, 若是, 转步骤(3), 否则得到符合风电机组 运行规律的数据样本; [0008](3)采用均值漂移聚类算法对剩余异常数据进行剔除, 得到符合风电机组运行规 律的数据样本 。 [0009]优选地, 在步骤(1)中, 所述分区间孤立森林算法剔除风力曲线中的分散型异常数 据和弃风限电数据包括以下步骤: [0010](1‑1)对数据进行预处理, 包括: 剔除风速小于设定切入风速且对应功率大于0的 数据, 以及剔除风速高于设定切出风速且 对应功率 为负值的数据; [0011](1‑2)以设定功率取值对风电功率进行功率区间划分, 采用孤立森林算法对每个 区间内的风速 ‑功率数据进行检测, 以进行大部分分散数据和部分偏离正常数据较远的弃 风数据的剔除; [0012](1‑3)获得每个功率区间的异常检测结果后, 将其绘制到图中并观察结果, 判断风说 明 书 1/6 页 3 CN 115510043 A 3

PDF文档 专利 一种风电功率曲线异常数据剔除方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种风电功率曲线异常数据剔除方法 第 1 页 专利 一种风电功率曲线异常数据剔除方法 第 2 页 专利 一种风电功率曲线异常数据剔除方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:25:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。