大数据分析技术与应用一站式学习(值得收藏)
所谓大数据(Big Data),就是需要处理的数据量非常巨大,已经达到了 TB、PB 甚至 EB、ZB 级别,需要成千上万块硬盘才能存储。传统的技术手段在大数据面前不堪一击,只能探索一套新的解决方案。
这套《大数据技术与应用教程》对大数据处理过程中涉及的各种关键技术做了详细的介绍,包括大数据思维、大数据采集、大数据处理、大数据存储、大数据挖掘、大数据应用等各个环节,帮助初学者规划了一条完整的学习路线。
这套教程只是一本入门指南手册,目的是给初学者指引方向,它虽然讲解了大数据的各种技术,但并不非常深入。对于大数据开发人员,还需要结合其它教程深度学习;对于大数据从业者,这些知识已经足够了。
优质学习资源:数据观(中国大数据分析产业观察)、中国大数据技术与应用联盟、大数据分析学习路线、大数据学习书籍
- 教程目录:
- 1. 大数据是什么?1分钟了解大数据的概念!
- 2. 大数据时代是什么意思?
- 3. 大数据的产生和作用(详细分析)
- 4. 大数据时代的10个重大变化(长篇神文)
- 5. 大数据处理的基本流程:数据抽取与集成+数据分析+数据解释
- 6. 大数据开发涉及到的关键技术有哪些?
- 7. 大数据采集技术概述
- 8. 通过系统日志采集大数据
- 9. 通过网络爬虫采集大数据
- 10. Scrapy网络爬虫简介
- 11. 大数据预处理架构和方法简介
- 12. 大数据预处理之数据清洗
- 13. 大数据预处理之数据集成
- 14. 大数据预处理之数据转换
- 15. 大数据预处理之数据消减
- 16. 离散化和数值概念层次树简介
- 17. 大数据处理技术有哪些?
- 18. GFS、MapReduce和BigTable:Google的三种大数据处理系统
- 19. Hadoop大数据处理框架简介
- 20. Hadoop HDFS分布式文件系统简介
- 21. HDFS基本原理和设计理念
- 22. HDFS架构和实现机制简介
- 23. HDFS读取和写入数据简介
- 24. HDFS两种操作方式:命令行和Java API
- 25. NoSQL非关系型数据库简介
- 26. NoSQL数据库类型简介
- 27. Hadoop HBase数据库简介
- 28. HBase列式数据模型简介
- 29. HBase Shell常用命令和基本操作(附带实例)
- 30. HBase主要运行机制(物理存储和逻辑架构)
- 31. HBase常用Java API
- 32. HBase Java API编程实例
- 33. Hadoop MapReduce简介
- 34. Hadoop MapReduce架构
- 35. Hadoop MapReduce工作流程
- 36. MapReduce实例分析:单词计数
- 37. MapReduce执行流程和Shuffle过程
- 38. MapReduce编程实例:单词计数
- 39. Spark是什么?Spark和Hadoop的区别
- 40. Spark RDD是什么?
- 41. Spark总体架构和运行流程
- 42. Spark生态圈简介
- 43. Spark开发实例(编程实践)
- 44. Spark Streaming简介
- 45. Spark Streaming的系统架构
- 46. Spark Streaming编程模型
- 47. Spark DStream相关操作
- 48. Spark Streaming编程实战(开发实例)
- 49. 数据挖掘是什么?
- 50. Spark MLlib简介
- 51. 数据挖掘之分类和预测简介
- 52. 决策树和朴素贝叶斯算法简介
- 53. 回归分析预测技术简介
- 54. 什么是聚类分析?聚类分析方法的类别
- 55. k-means聚类算法简介
- 56. DBSCAN聚类算法简介
- 57. 数据挖掘之关联规则分析简介
- 58. Apriori算法和FP-Tree算法简介
- 59. 基于大数据的精准营销
- 60. 基于大数据的个性化推荐系统
- 61. 大数据预测(大数据核心应用)
- 62. 大数据的其他应用领域
- 63. 大数据可以应用在哪些行业?
- 64. 大数据在金融行业的应用
- 65. 大数据在互联网行业的应用
- 66. 大数据在物流行业的应用