样书申请
* 申请人: | |
* 详细地址: | |
* 数量: | |
* 手机号码: | |
邮箱: | |
1.请在地址处注明您所在单位和职务.2.申请提交后,工作人员稍后和您联系. |
POD订购
* 订购人: | |
* 详细地址: | |
* 数量: | |
* 手机号码: | |
邮箱: | |
- 内容简介
- 目录
- 读者反馈
- 图书推荐
本书面向不同领域的大数据分析研究和从业人员介绍理论前沿,同时将前沿理论应用于解决不同领域的实际问题,最后进行归纳总结,提炼出复杂系统中大数据的应用要点。本书包括三个部分:第一部分(第1章~第5章)介绍复杂系统中的大数据基础理论知识,第二部分(第6章~第13章)介绍不同应用背景下大数据的成功应用案例,第三部分(第14章~第17章)提炼总结复杂系统中大数据的应用要点。本书可以作为各大学计算机科学与工程、
管理科学与工程、系统工程等专业本科生和研究生的教材,也可以作为相关研究机构和企业从事人工智能、数据挖掘以及电子商务等专业研究和工作的相关人员的参考书籍。
目录
第1章 大规模数据云计算设施:当前的紧迫任务 19
1.1 引言 20
1.2 相关工作 21
1.3 云计算概述 22
1.3.1 云计算的基本特征 22
1.3.2 服务模型 23
1.3.3 部署模型 24
1.3.4 云存储设施 26
1.3.5 云存储设施需求 27
1.4 大数据概述 28
1.4.1 大数据的特征 29
1.4.2 大数据对于基础设施的影响 30
1.4.3 大数据对于未来市场的影响 32
1.5 云计算与大数据:不可抗拒的结合 33
1.5.1 优化当前基础设施以处理大数据 34
1.6 使用云服务处理大数据的挑战与困难 35
1.7 讨论 37
1.8 结论 38
参考文献 38
第2章 大数据运动:数据处理的挑战 42
2.1 引言 43
2.2 大数据中的数据处理 45
2.2.1 数据结构 45
2.2.2 NoSQL数据库 46
2.2.3 大数据 48
2.3 数据处理服务中的并行性 51
2.3.1 性能评估 51
2.3.2 可拓展性与Amdahl’s定律 51
2.3.3 任务与数据并行性 52
2.3.4 编程环境 53
2.3.5 编程语言与代码优化 54
2.4 天文学中的大数据崩塌 55
2.4.1 虚拟观测 57
2.4.2 天文信息学 60
2.5 大数据与演化算法:视角与可能性 64
2.6 总结 71
参考文献 72
第3章 基于高维数据的鲁棒性能模型担保 77
3.1 引言 78
3.1.1 问题定义 79
3.2 相关工作 81
3.2.1 挑战与贡献 83
3.3 约束和对比模型性能的原则 86
3.3.1 鲁棒性统计评估 86
3.3.2 数据灵活性 91
3.3.3 数据可拓展性 93
3.3.4 多设置条件下性能担保水平评估 93
3.3.5 多准则集成 94
3.4 结果与讨论 95
3.5 结论及下一步工作 101
参考文献 102
第4章 流聚类算法导读 106
4.1 引言 107
4.2 流聚类算法的体系结构 108
4.3 数据流聚类存在的问题 109
4.3.1 概要表示 109
4.3.2 到达的数据点的高效增量处理 110
4.3.3 处理混合属性 110
4.3.4 获取近期性和数据演化 110
4.3.5 硬聚类和模糊聚类 112
4.3.6 异常值检测 112
4.4 流聚类方法 112
4.4.1 基于距离和基于密度的方法 113
4.4.2 基于网格的方法 117
4.4.3 基于统计法的方法 122
4.4.4 讨论 125
4.5 流聚类算法中概要的功能 128
4.5.1 概要对参数的敏感性 128
4.5.2 概要初始化 129
4.5.3 获取数据中自然结构的能力 129
4.5.4 存储器的使用 130
4.5.5 单点处理时间 130
4.5.6 对数据排序的敏感性 130
4.5.7 管理混合属性 131
4.5.8 处理异常值 131
4.5.9 获取数据演化 131
4.5.10 总结 132
4.6 流聚类的其他问题和挑战 132
4.6.1 弱实验评估 133
4.6.2 可用性 134
4.6.3 改变建模 135
4.7 结论 135
参考文献 136
第5章 大数据中的语言重复交叉检查 141
5.1 引言 142
5.2 重复记录检测概述 145
5.2.1 拼音名字匹配算法 147
5.2.2 重复记录检测技术的质量 147
5.3 相关工作 148
5.4 方法学 150
5.4.1 上述重复记录检测框架 151
5.4.2 预处理:数据清理和标准化 152
5.4.3 语言插件 153
5.4.4 创建基于语音的词典 154
5.4.5 索引/分块 154
5.4.6 记录配对比较 155
5.4.7 分类函数 155
5.4.8 跨语言重复记录检测的质量评估 155
5.4.9 未来展望:大数据趋势 156
5.5 结果和讨论 157
5.5.1 实验1:比较CLDRD和Febrl 158
5.5.2 实验2:比较Febrl和CLDRD中的分块技术 159
5.6 总结 159
参考文献 160
第6章 基于粗糙集和改进和声搜索算法混合的新型蛋白序列分类特征选择算法 163
6.1 引言 164
6.2 相关工作 166
6.3 提议的框架 168
6.3.1 蛋白质一级序列 168
6.3.2 伪氨基酸生成器 170
6.3.3 氨基酸成分 170
6.3.4 K-元组子序列 170
6.3.5 离散化 171
6.3.6 蛋白质分类 171
6.4 粗糙集理论基础 172
6.5 特征提取 173
6.6 特征选择 174
6.6.1 基于粗糙集属性的约简算法 174
6.6.2 粗糙集粒子群最优化算法 175
6.6.3 和声搜索算法 176
6.6.4 基于粗糙集的改进的和声搜索算法(RSIHS) 179
6.7 实验分析 181
6.7.1 数据源 181
6.7.2 结果及讨论 181
6.8 结论及未来工作 185
参考文献 186
第7章 Twitter中新闻演化的自动发现 190
7.1 引言 191
7.2 相关工作 193
7.2.1 大数据:挑战和机遇 193
7.2.2 社交媒体和“大数据" 194
7.3 Twitter网络的背景 196
7.3.1 作为决策支持工具的Twitter 198
7.4 关联规则挖掘概述 198
7.4.1 推文中的关联规则 199
7.4.2 规则相似性和差异性 199
7.4.3 度量相似性 200
7.5 基于事务的规则改变挖掘的演化 200
7.5.1 基于事务的规则改变挖掘规则的定义 201
7.6 使用基于事务的规则改变挖掘规则类型识别(TRCM-RTI),分析推文趋势 202
7.6.1 规则趋势分析 202
7.6.2 推文中正在演化规则的时间帧窗口 203
7.6.3 新闻和主题标签,哪个先出现?——“TwO-NwO"状态 204
7.7 实证评估 205
7.7.1 实验设置 206
7.7.2 实验性的案例研究 207
7.7.3 案例研究 210
7.8 结论 211
7.8.1 未来工作 212
参考文献 212
第8章 基于混合容差粗糙集的社交标签系统智能方法研究 215
8.1 引言 216
8.2 相关工作 218
8.3 社交标签数据聚类的各阶段 221
8.3.1 数据格式化 221
8.3.2 预处理 222
8.3.3 聚类 223
8.4 实验结果 229
8.4.1 无监督快速精简书签选择 229
8.4.2 聚类算法的性能分析 230
8.4.3 比较分析 235
8.5 结果的解释 239
8.6 结论 240
参考文献 240
第9章 为比较胆囊切除术后病患的共病指数开发麻醉和手术护理医疗数据库 243
9.1 引言 244
9.1.1 临床数据库 244
9.1.2 围手术期疗效比较研究 245
9.1.3 大型数据库和围手术期研究 247
9.1.4 基于风险分层的共病重要性 248
9.2 本章目标和结构 250
9.3 方法 250
9.3.1 参与者 250
9.3.2 变量 250
9.3.3 数据分析 251
9.4 结果 251
9.4.1 病患特征 251
9.4.2 粗死亡率 251
9.5 讨论 254
9.5.1 研究的局限性和优势 254
9.5.2 其他应用 254
9.5.3 大数据库的优势 258
9.5.4 大型数据库的有效性 259
9.5.5 注意事项和清单 262
9.6 总结 262
参考文献 263
第10章 采用初级保健服务、医院和职业数据库的病假和记录连接研究 268
10.1 引言 269
10.1.1 电子卫生数据库 269
10.1.2 记录连接 272
10.1.3 初级卫生保健患者的Charlson共病指数和病假 276
10.2 目的和章节结构 278
10.3 方法 278
10.3.1 研究人群 278
10.3.2 数据收集 278
10.3.3 统计分析 279
10.4 结果 280
10.5 讨论 285
10.5.1 病假和CCIPC 285
10.5.2 下一步:通过大数据提高信息的可用性 287
10.6 结论 288
参考文献 289
第11章 基于双射软集合的ECG心律失常的分类 294
11.1 引言 295
11.2 相关工作 296
11.3 材料和方法 299
11.3.1 信号采集 300
11.3.2 信号预处理和特征提取 300
11.3.3 改良双射软集合的提出和应用 302
11.4 Pan-Tompkins算法 304
11.4.1 带通滤波器 304
11.4.2 求导 305
11.4.3 非线性转换 305
11.4.4 移动窗口整合 305
11.4.5 框标 305
11.5 基本概念——软集合和双射软集合 306
11.5.1 软集合理论 306
11.5.2 双射软集合理论 306
11.6 ECG信号相对性分类算法 307
11.6.1 反向传播神经网络 307
11.6.2 朴素贝叶斯分类法 309
11.6.3 决策树——J48 309
11.6.4 决策表算法 310
11.7 实验分析和结果 311
11.8 结论 315
参考文献 316
第12章 地理空间语义:从大数据到数据生态系统 319
12.1 引言 319
12.2 相关工作 321
12.3 地理空间语义 322
12.3.1 语义关系 323
12.3.2 语义属性和剖析 325
12.4 应用 326
12.4.1 地理数据生态系统 326
12.4.2 犯罪地图:分析员和公民 328
12.4.3 地理空间的推理 332
12.5 结论 336
参考文献 336
第13章 常见乳腺癌中DNA甲基化的大数据分析和可视化 340
13.1 引言 341
13.2 背景 342
13.2.1 DNA甲基化 342
13.2.2 乳腺癌亚型的生物学特征 343
13.2.3 统计学背景 345
13.3 实验方法 346
13.3.1 非特异性过滤 347
13.3.2 特异性过滤 348
13.3.3 形式概念分析(FCA) 348
13.4 实验结果与讨论 349
13.5 应用FCA识别乳腺癌亚型 350
13.5.1 形式背景 350
13.5.2 FCA 353
13.6 结论与展望 354
参考文献 355
第14章 大数据的数据质量、分析学和隐私 357
14.1 引言 358
14.2 数据/信息质量和数据集成 359
14.2.1 定义 359
14.2.2 市场概述 359
14.2.3 数据/信息质量管理 361
14.2.4 大数据质量 362
14.3 数据隐私和安全 362
14.3.1 医疗保健大数据 363
14.3.2 医疗保健领域的数据隐私 363
14.3.3 数据安全概述 364
14.3.4 管理和政策 365
14.3.5 大量安全数据 366
14.3.6 安全产品 366
14.4 大数据分析学 370
14.4.1 概述 370
14.4.2 技术 370
14.4.3 商业决策 371
14.5 讨论 372
14.5.1 大数据人才的市场需求 373
14.5.2 大数据解决方案的实施 373
14.5.3 大数据出版物分析 373
14.5.4 大数据安全 376
14.6 结论 377
参考文献 378
第15章 医学领域海量异构数据的检索、分析与可视化对比研究 380
15.1 引言 381
15.2 相关工作 382
15.2.1 数据可视化 382
15.2.2 电子病历的可视化系统 384
15.3 医疗多项目系统 388
15.3.1 M2ICOP系统的结构 389
15.4 实验 396
15.5 M2ICOP系统功能和可用性的评估 397
15.5.1 数据采集和评估过程 398
15.5.2 评估结果 398
15.6 结论 399
参考文献 399
第16章 基于改进软粗糙集的心律失常心电图信号分类方法 403
16.1 引言 404
16.1.1 心电图波形描述 405
16.1.2 心电图的解释 405
16.2 相关工作 406
16.3 研究方法 407
16.3.1 信号采集 408
16.3.2 预处理 408
16.3.3 特征提取 410
16.4 背景 411
16.4.1 粗糙集 411
16.4.2 软集合理论 412
16.4.3 软粗糙集 413
16.5 分类 414
16.5.1 朴素贝叶斯 414
16.5.2 MLP 414
16.5.3 BPN 415
16.5.4 J48 415
16.5.5 JRip 415
16.5.6 决策表 416
16.5.7 MSR 417
16.6 实验分析及结果 418
16.6.1 评价指标 419
16.6.2 性能评估 420
16.6.3 讨论 422
16.7 结论 423
参考文献 423
第17章 一种新型大型分布式数据的描述与操作架构 426
17.1 引言 427
17.2 分布式数据库和大数据 428
17.2.1 集中式架构内大数据的缺点 428
17.2.2 分布式数据库的性能问题 429
17.2.3 关于透明度问题 429
17.3 现有DDBMS概述 430
17.3.1 DDBMS规范 430
17.3.2 在Oracle下的DDB实现示例 430
17.4 目的 434
17.5 描述和操作大型分布式数据的新架构 436
17.5.1 本方法的目标 436
17.5.2 建议的分层架构 436
17.6 智能大型分布式数据 438
17.6.1 研究结果 438
17.6.2 结果评论 447
17.7 结论 448
参考文献 448