Go语言网络爬虫
本章将完整地展示一个应用程序的设计、编写和简单试用的全过程,从而把前面讲到的所有 Go 知识贯穿起来。在这个过程中,加深对这些知识的记忆和理解,以及再次说明怎样把它们用到实处。由本章的标题可知,它是一个网络爬虫(或称网络内容爬取程序)的框架。
默认情况下,基于这个框架编写的网络爬虫程序是单机版的,也就是说,它仅会在一台计算机上运行。不过,在框架中留有一些易于扩展的接口,可以很方便地利用它们编写出一个分布式程序。当然,在这之前,需要先搞懂什么是分布式计算。
Go语言的特点是通过内部调度可以最大限度地利用单机的计算能力。然而,在分布式计算方面,它本身其实并没有提供什么现成的东西,还需要使用一些第三方的框架或工具,或者自己编写和搭建。
默认情况下,基于这个框架编写的网络爬虫程序是单机版的,也就是说,它仅会在一台计算机上运行。不过,在框架中留有一些易于扩展的接口,可以很方便地利用它们编写出一个分布式程序。当然,在这之前,需要先搞懂什么是分布式计算。
Go语言的特点是通过内部调度可以最大限度地利用单机的计算能力。然而,在分布式计算方面,它本身其实并没有提供什么现成的东西,还需要使用一些第三方的框架或工具,或者自己编写和搭建。
- 本章内容:
- 1. Go语言网络爬虫概述
- 2. Go语言网络爬虫中的基本数据结构
- 3. Go语言网络爬虫的接口设计
- 4. Go语言网络爬虫缓冲器工具的实现
- 5. Go语言网络爬虫缓冲池工具的实现
- 6. Go语言网络爬虫多重读取器的实现
- 7. Go语言网络爬虫内部基础接口
- 8. Go语言网络爬虫组件注册器
- 9. Go语言网络爬虫下载器接口
- 10. Go语言网络爬虫分析器接口
- 11. Go语言网络爬虫条目处理管道
- 12. Go语言网络爬虫调度器的实现
- 13. Go语言爬取图片小程序