IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。
那么使用IBM SPSS Modeler访问数据库自有算法有什么优势呢?主要是两方面:
1.数据库内的算法常常与数据库服务器紧密集成,这有助于提高性能。
2.在“数据库内”构建和存储的模型不仅由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。
接下来我们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。
IBM SPSS Modeler支持集成下列Analysis Services算法包括:
- 决策树
- 聚类
- 关联规则
- 朴素贝叶斯
- 线性回归
- 神经网络
- Logistic回归
- 时间序列
- 序列聚类
安装与配置:
在您的机器上,必须安装以下模块:
- IBM SPSS Modeler Client
- IBM SPSS Modeler Server
- Microsoft Analysis Services,与相应数据库建立ODBC连接
1. 配置IBM SPSS Modeler:
在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,如下图:
勾上之后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,如下图:
2. 配置 SQL Server
该配置可实现在数据库内进行评分。
在 SQL Server 主机上创建以下注册表键:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP
为该键添加如下 DWORD 键值:
AllowInProcess 1
完成上述更改后,重新启动SQL Server。
3. 配置Microsoft Analysis Services
建立IBM SPSS Modeler 与Microsoft Analysis Services 进行通信。
通过MS SQL Server Management Studio 登录到分析服务器。
访问“属性”对话框,右键单击服务器名称,然后选择属性。
选中显示高级(所有)属性复选框。
更改以下属性:
将 DataMining\AllowAdHocOpenRowsetQueries 的值更改为 True(缺省值为False)。
将 DataMining\AllowProvidersInOpenRowset 的值更改为 [all] (无缺省值)。
4. 为SQL Server 创建 ODBC DSN
通过使用 Microsoft SQL Native Client ODBC 驱动程序,创建一个指向数据挖掘过程中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。
对于此DSN,请确保选中了使用集成的 Windows 认证。
5. 启用 SQL 生成和优化
从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上所有选项内容如下图:
使用Microsoft Analysis Services 算法生成模型
以上内容配置完成后,即可使用数据库内的算法生成模型。如下图:
源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。
介绍到这里,我们就了解了,如何使用数据库内算法进行建模的过程,经常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不同?预测结果当然是会有差异的了。本身决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每个算法计算逻辑就不一样,因此计算得到的结果自然也不一样,前面我们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差异就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来确定决策树分割位置,它可以用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,大家可以综合考虑,结合实际场景和数据预测结果的评估再做选择。
相关推荐
SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。SPSS Modeler 可以...
IBM SPSS Modeler 18.0 数据库内挖掘指南(中文).pdf 官方中文帮助文档,实用权威
IBM SPSS Modeler Source、Process和Output节点(中文).pdf
IBM SPSS Modeler 18.0数据挖掘权威指南全部案例数据及全部源文件 含空间数据分析-地图可视化教程
IBM SPSS Modeler 18简体中文手册, 有软件的基本使用, 数据库的建立, 部署基本操作等。
IBM SPSS Modeler 14.2 License
IBM SPSS Modeler 14.2 模型介绍 中文版 数据挖掘模型包括:决策树、贝叶斯网络、关联规则、聚类、时间序列、支持向量机等; 内容包括模型介绍、模型参数设置、模型应用结果等。
数据挖掘产品 IBM SPSS Modeler 新手使用入门
线性回归模型是一种常用的统计学模型, IBM SPSS Modeler 是一个强大的数据挖掘分析工具,本文将通过建立一个理赔欺诈检测模型的实例来展示如何利用 IBM SPSS Modeler 建立线性回归预测模型以及如何解释及应用该模型...
IBM SPSS Modeler 是一个专门的数据挖掘工具,它是用来建立预测模型和进行其他分析任务的。其可视化界面允许用户利用统计和数据挖掘算法,无需编程。
官方文档适合学习
IBM SPSS Modeler 18.0 中文用户指南.pdf,官方中文帮助文档 实用权威
IBM SPSS Modeler 18.0 程序应用指南(中文),官方中文指南,实用权威
SPSS Modeler数据挖掘方法及应用,本书主要特点: 1)以数据挖掘过程为线索介绍SPSS Modeler软件 2)数据挖掘方法,软件操作、案例分析的有机结合 3)数据挖掘方法讲解通俗,软件操作过程说明详实 主要内容如下: 1...
IBM SPSS Modeler数据与文本挖掘实战----数据和程序
IBM SPSS Modeler 决策树之银行行销预测应用分析 本文将通过 IBM SPSS Modeler 介绍决策树 (Decision tree) 演算法于银行行销领域的应用实例。决策树演算法是一种常用的分类和预测方法,以分类条件对数据进行分类,...
本光盘提供了本书中所有案例涉及到的数据及IBM SPSS Modeler数据流,由于IBM SPSS Modeler数据流一律使用绝对路径来读取和导出数据文件,为了可以重现数据流的运行,请把光盘中的“SPSS案例数据”文件夹直接拷贝到C...
IBM SPSS Modeler is a data mining workbench that enables you to explore data identify important relationships that you can leverage and build predictive models quickly allowing your organization to ...
最新发布的IBMSPSSModeler14.2版本对NetezzaAnalytics进行了集成,可以把SPSSModeler的可视化和易用性...本文通过对一个决策树模型的建立和分析,帮助读者了解如何利用SPSSModeler方便快捷地在IBMNetezza数据库中构建和