新工科 课程 基于美国北卡罗来纳州犯罪数据的多元统计分析   
课程封面
基于美国北卡罗来纳州犯罪数据的多元统计分析   
大数据
基于 R 语言程序包 Ecdat 中的 Crime 数据集是指 1981 年到 1987 年美国北卡罗莱纳州的犯罪数据,该数据从美国北卡罗莱纳州的 90 个观察地区 (郡) 采集得到的,每年统计一次,每个 观察地区都有七年的观察数据,共计 630 组样本数据。该数据集总共包含了 24 个变量,分别是——观察地区, 年份,犯罪率,逮捕率,定罪率,判刑率,平均时间,人均警察数,人口密度,人均税收,所属区域,是否大城市,少数民族比例,建筑行业平均周薪,通讯行业平均周薪,销售行业平均周薪,金融保险和房地产行业平均周薪,服务行业平均周薪,制造业平均周薪,联邦政府雇员平均周薪,州政府雇员平均周薪,地方政府雇员平均周薪,年轻男性比例,其他指标。
本试验基于上述 630 组包含 24 个变量的样本数据进行多元统计分析,主要是对该数据集进行了以下几种分析: 1) 数据预处理:对样本数据进行整理,异常值处理,缺失值处理,进行正态性分析和相关性分析。2) 主成分分析:对全体样本数据进行主成分分析达到降维的目的,并分析主成分的含义。3) 因子分析:构建因子分析模型,进行因子旋转,分析每个因子的意义以及这些潜在因子与犯罪率的关系。4) 主成分聚类分析:对 90 个观察地区进行主成分聚类,并对各类的特点和差异进行比较分析。5) 对应分析:分别分析地区与经济水平和治安环境之间的对应关系,总结得 出地区经济水平与治安环境之间的关系。
实验列表
  • step1
    实验环境准备
    安装R的基本程序,安装R常用程序包
    查看详情
  • step2
    数据预处理
    对样本数据进行整理,异常值处理,缺失值处理,进行正态 性分析和相关性分析。
    查看详情
  • step3
    主成分分析
    对全体样本数据进行主成分分析达到降维的目的,并分析主成分的含义。
    查看详情
  • step4
    因子分析
    构建因子分析模型,进行因子旋转,分析每个因子的意义以及这些潜在因子与犯罪率的关系。
    查看详情
  • step5
    主成分聚类分析
    对 90 个观察地区进行主成分聚类,并对各类的特点和差 异进行比较分析。
    查看详情
  • step6
    对应分析
    分别分析地区与经济水平和治安环境之间的对应关系,总结得 出地区经济水平与治安环境之间的关系。
    查看详情

如果您想对我们的产品和服务更进一步了解
请用下面的方式和我们联系

电子邮箱:business@yundaxue.org(会在1个工作日之内和您接洽)

联系电话:400-828-1210(周一至周五 9:00-18:00 )