2007-05-19

SPSS 10 月份电子期刊

2006年10月


SPSS 15.0 for Windows英文版现已上市

SPSS 15.0 for Windows英文版现已上市!通过SPSS 15.0 用户可以提高数据资料管理能力,报告能力,可扩展的编程能力以及强大的新统计程序。此外,企业用户通过在其组织中更有成效的和更为连贯的运用数据获得新的机会。

Pep Boys运用SPSS为客户提供更好的产品和服务

Pep Boys,美国著名的汽车配件零售商和维修服务商,最近选择SPSS的预测分析软件来发展分类计划模式。因此,每个Pep Boys商店都能够保证最受欢迎产品的持续供应,从而为客户提供更好的服务。Pep Boys拥有593家商店和超过6000个服务站遍布美国36个州以及波多黎各。除了汽车维修和维护之外,公司还提供汽车配件销售,是美国最主要的备用轮 胎销售商之一。

"SPSS预测分析软件可以帮助我们建立一个存储层次需求模型,这个模型可以对配件进行更充分更完善的分类管理,从而为我们的顾客提供更好的库存配置。"Robert Sammons,Pep Boys配件公司的副总裁说。

对此,SPSS总裁兼CEO Jack Noonan说,"我们很自豪Pep Boys选择了SPSS。SPSS软件正在帮助Pep Boys利用对产品更强的洞察力为客户提供更好的服务。这表明了预测分析软件的有效性正在得到提高,同时也表明此类软件有能力为公共和私人部门识别关键的 流程改进。"现今全球20大零售商其中有16家选择了SPSS软件进行客户理解,操作效率以及产品开发等应用。

Consumer Link运用SPSS改进调查研究过程

Consumer Link,新西兰最具有创造力的市场调查数据的收集和处理机构之一,最近选择Dimension产品促进网站的远程访问。

Consumer Link的团队拥有30个管理者,超过500个采访人员,每年大约20万的访问量。

通过Dimension, Consumer Link可以控制和优化每个研究过程:从设计和采访,到对数据进行分析并且在各部门间共享分析结果。

ESPN星空体育选择SPSS软件

ESPN 星空体育(ESPN STAR Sports)运用SPSS 可对亚洲的百万收视率的参数进行迅速的识别,其中包括快速增长的移动电视观众,并且基于SPSS的分析结果发展了其他诸多的娱乐节目。ESPN 星空体育是由世界两大有线与卫星传播机构 - ESPN Inc. 及星空传媒集团(STAR)合资经营,是亚洲规模最大的体育电视网。ESPN拥有观众超过1亿3千9百万;卫视体育台则拥有6千5百万。

通过不断的电子化的收视率测度,使得ESPN星空体育可以覆盖全亚洲的各个市场。但是,对于和观众的完全结合,包括观众的态度和感觉方面,要求一个定制化方式。ESPN 星空体育利用SPSS同样找到了一个根据原来的方法无法测度的方法,这个方法可以获得更多的移动电视观众。

通过SPSS, ESPN 星空体育频道能够同时调查不同地区(无论是家庭用户还是移动用户),不同语言的亚洲观众,从而直接多角度地得知他们的所观赏,所喜爱和参与互动的内容并且能度量他们对于电视频道的喜好程度。

ESPN STAR 体育频道的研究主管 Anand Rego 说:"我们先前一直通过专注于局部水平的群体和量化研究来获得这样的信息。而有了SPSS的企业反馈管理软件后,我们能够连续地和同时地得到不同亚洲地区的连同收视率的各类信息。"
 

SPSS数据挖掘工具--Clementine 产品简介

Clementine作为业内领先的数据挖掘平台,允许企业利用业务专业技能快速开发预测模型,并迅速部署提升决策水平。Clementine能够帮助企业达成以下目标:

• 提升客户获取能力和维持能力
• 提升单位客户的收益和利润
• 最小化成本
• 用更少资源抵制违法

Clementine支持完整的数据挖掘流程,降低了对时间和资源的需求。同时,Clementine是完全按照数据挖掘的行业标准---CRISP-DM而设计。CRISP-DM使得数据挖掘成为了业务流程的一部分,用以解决企业中的实际问题。

Clementine产品线包括以下列出的产品组件:

• Clementine Client and Clementine Server – 客户端是功能完整的产品,安装并运行在用户的桌面机上。客户端产品既能够作为独立的产品在本地运行,也能与Clementine Server一起以分布式方式运行,从而提高大数据集的执行效率。 服务器版本能够与一个或多个客户端以分布式方式安装,它在大数据集时提供了更高的性能,因为服务器方式下有大内存选项,无须将数据下载到客户端上。这里要注意的是,使用服务器版本必须至少有一个客户端。

• Clementine Batch – 批处理模式允许用户执行一些比较耗时,或者优先级较低的作业,绕过用户交互界面,无须用户的干预。Clementine Server产品带有一份Batch, 如果客户需要其他的Batch,也可以单独安装。Clementine Batch提供完整的分析功能,且没有常见的用户交互界面。

• Clementine Solution Publisher – Clementine Solution Publisher是一个扩展的组件,允许用户将Clementine流文件发布到Clementine环境以外。发布的流文件能在Clementine Solution Publisher Runtime环境下运行,该环境可根据用户需求进行部署。

• Clementine Desktop – 该桌面端产品是功能有所限制的客户端产品,不包括的功能有:SQL回馈,服务器访问,批处理模式,Solution Publisher,PMML 模型导出,Cleo 或其他SPSS部署向导,以及Text Mining for Clementine和Web Mining for Clementine。

• Text Mining for Clementine - Text Mining for Clementine是扩展的产品,提供从非结构化信息中提取结构化数据用于分析。此模块需要单独的许可证,允许用户基于上下文从文本中快速获取关键信息。将这些信息再与已有的结构化数据结合,比如人口统计信息等,帮助用户的决策更加准确。

• Web Mining for Clementine – Web Mining for Clementine是扩展的组件,利用NetGenesis Web分析技术,将原始Web数据转化成Web节点以利于分析。

• Cleo – Cleo提供交互式Web部署。Clementine建立预测模型后,通过点击Cleo部署向导创建瘦客户端的Web应用,从而在Web上使用预测模型。

• Clementine Application Template – 针对不同行业、不同应用的模板,通过此模板用户可以迅速开发自己的数据挖掘应用,目前包括Web CAT,Telco CAT,CRM CAT,Microarray CAT四套。

企业应该具有怎么样的数据挖掘系统

 

数据挖掘作为利用企业大量数据发现规律规则并在企业经营活动中应用从而产生商业价值的一个商业应用过程,是由多方面的要素构成的。

一个完整的企业数据挖掘系统包含这样的3个部分:

1、高素质的人员。应该包括以下几方面的人员:

  • 了解数据的人。可能是数据库管理员,要求对数据在企业中的存储位置,存储方式非常了解。


  • 业务人员。需要了解业务,能够及时提出问题,并协助分析员把商业问题转化为数据挖掘问题,理解数据挖掘结果,并能够把数据挖掘结果转化为企业的实际商业行动创造价值。


  • 分析员。需要了解数据挖掘的算法和功能,熟练使用相关数据挖掘软件产品,能够和业务人员一起把商业问题转化为数据挖掘问题并解决数据挖掘问题。

    只有具备了以上三方面的人力资源,数据挖掘才能够在企业中充分发挥作用,为企业创造更多的商业价值。

2、硬件资源。企业需要配备满足数据挖掘系统的必备的计算机和相关存储设备的硬件。

3、软件资源。能够完成相关数据挖掘算法的软件。

具备了以上三个方面的资源,企业就具备了建立高效、完善的数据挖掘系统的必备条件。但是在具体实施数据挖掘项目过程中,企业还需要注意以下几个方面,他们是企业获得高价值数据挖掘结果的重要保证。

  • 良好的数据资源。巧妇难为无米之炊,企业只有在具备了相对优良的数据资源,才可能期望从数据挖掘中得到良好的数据挖掘结果。


  • 组织间的协调配合。数据挖掘往往需要企业各个方面的数据,他们往往不止来源于企业某一部门,这就需要部门间的良好配合和协调行动。


  • 业务人员和数据挖掘人员的良好沟通。在企业中,往往进行数据挖掘的人员和使用数据挖掘结果的人员不是一个人,甚至不是一个部门的人,这就需要他们 之间就需要什么样的数据挖掘结果、怎样把这些结果和具体的业务流程相结合进行充分的研究和探讨。只有这样,数据挖掘结果才能够在企业中得到充分应用。

数据挖掘的商业应用最终是为了能够给企业带来商业价值和利润。所以,一个成功的数据挖掘项目的结果应该是:

  • 数据挖掘产生的结果能够转化为具体的、可操作的商业行动。


  • 经过数据挖掘结果指导制定的商业行动确实能够为企业提高销售收入、降低成本、提高客户满意度等等,数据挖掘的效果应该是真实可见的。


  • 数据挖掘产生的结果能够和实际的业务流程或者业务系统无缝结合并能够为业务人员所广泛知晓和使用。

  • 能够重复进行,易于维护和更新的过程。
如何选择数据挖掘工具

数据挖掘可以帮你做更好的决策,增加收入,提高效率。虽然数据挖掘的承诺非常诱人,但是数据挖掘并不是一个自动的财富生成器,在数据挖掘的过程中存在着各种各样的问题和陷阱,而选择什么样的数据挖掘工具来进行数据挖掘就是其中最关键的一个环节。

CRISP-DM (Cross-Industry Standard Process for Data Mining) 是在各企业中被广泛采用的数据挖掘的标准流程。按照CRISP-DM的标准,数据挖掘包含6个步骤,他们是:商业理解、数据理解、数据准备、模型建立、结 果评估和应用部署。这一流程过程将以数据为中心,整个过程从商业问题开始,归于商业问题的解决。并且该标准流程把数据挖掘理解为需要不断循环调整的环状结 构,在企业进行数据挖掘的过程中,通常需要在几个过程之间往返进行,最终才能拿出优秀的数据挖掘结果,这也更加符合数据挖掘在企业中使用的实际情况。

第一阶段:商业理解

本阶段的任务主要是从业务角度来理解数据挖掘项目的目标和要求,然后将此转化为数据挖掘问题,并制定一个可行的数据挖掘计划。选择数据挖掘工具时,需要考虑以下两个问题:
  • 是否有在其他相关企业成功实施的经验,可用该工具解决广泛的商业问题,包括我们面临的商业问题?


  • 在解决我们行业内的商业问题时,该工具(单独或与我们的应用程序一起)是否有用?是否有该领域的成功案例?

  • 该工具是否在商业问题和数据挖掘技术之间提供了一个桥梁,是如何提供的?

  • 使用该工具中,各操作步骤是否可以被清晰地映射到数据挖掘的商业需求上?该工具是否向商业用户清晰地表述了数据挖掘概念?该工具如何与项目管理或其它计划工具所整合?是否需要编写额外地应用程序来实现数据挖掘技术与商业理解之间的沟通?
第二阶段:数据理解

数据理解阶段包括收集数据和对数据进行探索性分析两个部分。在该阶段中,可以获取不同类型的数据和可视化技术是要着重考虑的。
  • 该工具如何保护我的现有资产的利用?


  • 该工具是否可与现存的数据库兼容?该工具是否支持通用的数据接口标准?是否要求数据转换成另一种格式才能使用(如果需要,我们需要什么样的投资)?

  • 该工具是否可以对数据进行交互式探索分析并用丰富的图形展示数据?

  • 数据挖掘工具是否提供了可视化技术,以便于发现数据中存在的模式?图形是否可以与用户交互,例如随着数据维度的改变,图形是否可以发生改变或者生成新的图形?
第三阶段:数据准备

数据准备阶段的任务包括了从最初获取的数据一直到构建生成可用于分析的最终数据。此阶段要着重考虑数据准备工作的高效性和易用性。
  • 该工具如何准备数据?


  • 该工具在数据准备的所有工作(包括为建模所作的准备或为提高数据挖掘效率所作的准备)是否是交互性的?该工具在进行数据准备工具时,是否以一种易于跟踪的方式?

  • 在数据准备中,该工具是否可自动提取数据?


  • 在提取数据时,是自动完成的,还是需要手工写SQL查询语句,进行数据的合并、汇总、排序和其它数据准备工作?
第四阶段:建立模型

在该阶段,需要选择和应用各种建模技术,设置模型参数。用户往往需要返回到数据准备阶段以使数据适应不同模型的不同要求。由于同一数据挖掘问题可以应用不通模型,故要考虑数据挖掘工具在应用和比较不同分析技术的能力。
  • 该工具是否提高了分析师的工作效率?


  • 该工具是否使分析师能快速生成有效模型?用户比较不同模型以找出最佳解决方案时,该软件的易用性有多好?为适应不同模型要求而进行数据准备工作时,该软件的易用性有多好?

  • 该工具是否提供了足够多的数据挖掘技术?


  • 该工具是否提供了神经网络、关联算法、聚类分析、分类分析、回归分析、图形化的展现等数据挖掘技术?

  • 该工具是否可组合使用不同技术?


  • 不同技术是否可易于组合而生成更佳结果?模型结果是否可整合入数据集以便后续分析?

  • 该工具是否可与现有技术资源(如算法和其它工具)兼容?


  • 该数据挖掘工具是否能与现有的算法工具兼容使用?该数据挖掘工具是否可与其它数据分析工具兼容使用?
第五阶段:模型评估

评估阶段要对模型进行多方面的评估。主要目的是确定重要的商业因素是否被充分考虑?下面列出了有关的重点:商业用户的输入如何被整合跑过模型,结果又如何被传给受众。
  • 该工具的结果是否可以适用于各种情况?


  • 该工具产生的解决方案,是否对所有数据挖掘问题的解决方案都是有效的,还是只对某个数据挖掘问题的解决方案是有用的?结果是否准确地反映了所有的商业问题,是否在检验数据集上进行验证结果也足够好?

  • 该工具产生的结果是否容易理解?


  • 产生的结果是否易为商业用户所理解?如果不能,需要采取什么步骤以使结果便于读懂?该工具是否要求商业专家参与整个数据挖掘过程?
第六阶段:结果发布

数据挖掘过程可能很简单,如只是对商业问题给出一个建议,也可能很复杂,如应用一个应用程序向信息客户提供新知识。无论简单还是复杂,在结果发布阶段,都要用到该过程。结果发布经常要求扩展性的服务,所以下面的问题主要是基于数据挖掘工具在此任务上的帮助能力。
  • 如何发布数据挖掘解决方案(现在和未来)?


  • 数据挖掘解决方案如何才能被整合到操作性的应用程序中?整合的投资回报率是否高?是否需要在时间和财力上对结果发布做额外的投资?解决方案的更新是否容易?如果不容易,需要做些什么工作,投入多少财力和时间?

额外考虑之一:关于成本

除了CRISP-DM过程模型各阶段所要考虑的对数据挖掘工具的要求之外,还需要做一个投资回报分析。

  • 成本是多少?


  • 考虑产品寿命、所提供服务等,将成本量化。将预期的回报也量化。什么时候才会得到一个预期的ROI,此结果是否满足商业目标。

  • 实施时间?


  • 要花多长时间来实施数据挖掘项目?是否需要其它工具或硬件?需要多少培训、咨询、定制开发以得到项目结果?
    用户(现在和未来)能力是否能达到所用工具的要求?
    该工具要求用户具备哪些能力?该工具是定位于技术专家、数据挖掘初学者、还是各种水平的用户?使每个人可使用该软件所需培训成本是多少?不要忘记考虑未来潜在用户的技能。

  • 该工具是否可为用户定制?


  • 该工具是否可为不同用户进行定制?一般过程是否可被保存以便再运用?该工具是否可使任务自动执行?是否可得到自定义界面或提供其它帮助的服务?
额外考虑之二:关于厂商

最后,要考虑数据挖掘工具厂商的实力。从许多方面,购买一个数据挖掘解决方案是对未来的一个投资,在前进的路上有一个可靠的合作伙伴将是有益的。
  • 厂商是否提供其它用于解决相似问题的工具和服务?


  • 厂商是否提供其它数据挖掘或数据分析工具?厂商是否提供咨询、培训、技术支持和其它服务?这些服务是否是全球领域的?

  • 厂商是否是软件升级、其它服务的可靠提供者?


  • 厂商在数据挖掘解决方案领域,是否处于领先地位?厂商是否有能力和资源在未来继续提供高水平服务?
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
订阅本博客:
http://feeds.feedburner.com/woodphone
教育网BT下载博客
http://4renminbi.com/edubt
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

没有评论: