数据挖掘之归一化 - Knowing something of everything and everything of something. - ITeye博客

`

jianchen

浏览: 334123 次
性别:
来自: 杭州

最近访客更多访客>>

javalover123

jacky_chen

ffm

pengcong90

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

zy_mensheng：请问一下怎么 js没有解析啊还是钟表图..
调用BIEE提供的web service
安铁辉：师兄你很久没更新博客了
Information Dashboard Design读书笔记
mojunbin：很清晰的文章
秒杀相关知识以及技术
yanchangjun8102：楼主你好，我也最近在研究biee的webservice这块，按 ...
调用BIEE提供的web service
sacredon：不错，楼主我是看着你的这篇文章写代码调用的BIEE的Web ...
调用BIEE提供的web service

数据挖掘之归一化

博客分类：

BI

阅读更多

在阅读数据模型的文章中，经常看到针对特征维度进行归一化处理。

归一化的定义：

一种简化计算的方式，将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量，避免具有不同物理意义和量纲的输入变量不能平等使用。在统计学中，归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1--+1之间是统计的坐标分布。

归一化处理后，神经网络算法可以较好的收敛。

常见的归一化的函数如下

1,线性函数转换，表达式如下：

　　y=(x-MinValue)/(MaxValue-MinValue)　　

说明：x、y分别为转换前、后的值，MaxValue、MinValue分别为样本的最大值和最小值。

2,对数函数转换，表达式如下

y=log10(x)　　说明：以10为底的对数函数转换。

3、反正切函数转换，表达式如下

　　y=atan(x)*2/PI

归一化的具体方法根据你的样本特征，需要选择恰当的方法。

分享到：

timeTunnel的学习 | BIEE 界面DIY

2012-09-24 21:10
浏览 3467
评论(0)
分类:行业应用
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

python数据归一化及三种方法详解: 数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的...

python实现几种归一化方法（Normalization Method）: 数据归一化问题是数据挖掘中特征向量表达时的重要问题，当不同的特征成列在一起的时候，由于特征本身表达方式的原因而导致在绝对数值上的小数据被大数据“吃掉”的情况，这个时候我们需要做的就是对抽取出来的...

基于归一化特征判别的日志模板挖掘算法_双锴1: 摘要:针对传统日志模板挖掘时需要日志聚类数目作为先验信息的问题，提出了一种基于归一化特征判别的日志模板挖掘算法. 首先，对日志数据进行压缩以提高后续处理效率；其

CSCI_4370_Project2:数据挖掘项目2，使用最小-最大归一化实现聚类算法K-Means和Fuzzy C-Means: CSCI_4370_Project2 此仓库探讨了聚类算法以及用Python编写的规范化方法。实施的算法为K均值，模糊C均值，归一化方法为min-max归一化。

机器学习与数据挖掘实验21: 2. 以5分为间隔，画出课程1的成绩直方图 3. 对每门成绩进行z-score归一化，得到归一化的数据矩阵 4. 计算出100x100的相关矩阵，并可视化出混淆

掌握了这个之后，数据挖掘竞赛稳拿top10：利用Sklearn库进行特征工程处理: 特征工程主要分为三部分数据预处理特征选择降维二、数据预处理2.1 无量纲化2.1.1 标准化（也叫Z-score standardization）（对列向量处理）2.1.2 区间缩放（对列向量处理）2.1.3 归一化（对行向量处理）2.3 对定性...

学校择优选择.zip_K._figure61l_sisterxfp_学校择优选择_数据挖掘大作业: 数据挖掘大作业，关于考研学校的择优选择，首先在自己想报选的学校挑选出来，然后根据自己选择学校所要考虑的学校分配权重在进行归一化，k——means 等操作得出择校排名。

Datamining:数据挖掘最终项目2021年Spring: 块1：图像导入和缩放导入数据集将图像缩放到通用分辨率/比率归一化像素值块2：模型构建导入和部署EfficientNetB7模型，包括倒数第二层的输出和预测。设置张量板以记录和可视化模型。块3：相似度向量数据集创建...

bin-means-bin-boundary-techniques-and-min-max-z-score-decimal-scaling-normalization:bin-bins-bin-boundary技术和min-max-z分数小数比例缩放归一化| 数据挖掘: bin-bins-bin边界技术和min-max-z分数小数比例缩放归一化 bin-bins-bin-boundary技术和min-max-z分数小数比例缩放归一化| 数据挖掘

Data-Mining:数据挖掘实验室实践Sem 6: 数据挖掘数据挖掘实验室实践Sem 6实用1- 要使用来规范化给定数据最小最大归一化z分数归一化十进制缩放

国科大数据挖掘课程作业天体光谱分类-基于ResNet18的天体光谱分类方法+源代码+文档说明，本题目基于天池大数据竞赛: 本方案基于ResNet18，对数据进行了数据增强、归一化、黑体辐射拟合等处理，最终在助教提供的项目验收数据集上取得了macro f1 score 0.9741的成绩。因为只是一个课程作业，做得很粗糙，还有很多细节可以打磨，本文是...

k-means聚类算法及matlab代码-DataMining-Experiment:数据挖掘实验: 数据挖掘-实验 . 目录实验内容实验说明文档 :link: 第三方库数据处理模块： | 数据可视化模块： | 仓库文件内容说明文件/目录说明实验一代码实验二代码运行结果实验三代码运行结果源文件实验四代码 ...

机器学习、数据建模、数据挖掘分析特征无量纲化的常见操作方法: 通常采用的方法就是归一化，Normalization之类的方法。 from sklearn.datasets import load_iris #导入IRIS数据集 iris = load_iris() #标准化，返回值为标准化后的数据 from sklearn.preprocessing import ...

boston 房价数据集预测多种回归方法 python 有报告: 三、要求对原始数据进行归一化（也叫标准化），归一化不可使用库函数，必须手动实现。模型算法实现可以调用sklearn库，可尝试对简单的回归算法不调用库函数手动实现，手动实现可获得加分。同时，相关评价指标（如...

大数据背景下数据可视化方法研究.doc: 为了避免负值的出现，常常采用归一化的方法，即将最大值和最小值归为1和0，归一化后的所有得数值都位于[0 ，1]之间[4]。归一化公式为：从上述公式分析，我们可以得出如下结论：（1）维度值越大，那么该投影位置将...

完整的泰坦尼克号乘客生存预测: 数据挖掘流程 (一)数据读取读取数据，并进行展示统计数据各项指标明确数据规模与要完成的任务 (二)特征理解分析单特征分析，逐个变量分析其对结果的影响多变量统计分析，综合考虑多种情况影响统计绘图得出结论...

GeoDMA:地理特征提取和数据挖掘-开源: GeoDMA是TerraView软件的插件，用于地理数据挖掘。使用单个图像，用户可以执行分割，属性提取，归一化和分类。

论文研究-丹顶鹤繁殖地气候数据特征的聚类分析.pdf: 以1981—1990年我国东北地区繁殖的候鸟野生丹顶鹤为例，调查其繁殖地分布区域内的月平均气温、月平均最高温度、月平均最低温度、月平均降水和月平均净辐射五个气候因子数据的基础上，采用分区间统计及基于归一化距离...

最小二乘法matlab代码一元非线性-Classification:分类: **教程，示例，集合以及所有其他类别的内容：模式分类，机器学习和数据挖掘。** 栏目此流程图的[]。机器学习和模式分类简介 [] 预测建模，监督式机器学习和模式分类-大图[] 入口点：数据-使用Python的Sci包为机器...

大数据开发，大数据开发技术路线，核心知识: - 进行数据转换，如标准化、归一化、编码等，以适应后续分析和建模的需求。 - 使用ETL（Extract, Transform, Load）工具或编写脚本进行数据清洗和整合，准备可供分析的数据集。 3. **数据建模与分析**： - 根据...

Global site tag (gtag.js) - Google Analytics