织梦CMS - 轻松建站从此开始!

PDF电子书分享

当前位置: 主页 > 计算机类 >

网络数据采集技术PDF,TXT,epub,mobi,azw3电子书下载

时间:2020-04-07 20:51来源:未知 作者:断桥之上 点击:
网络数据采集技术PDF,TXT,epub,mobi,azw3电子书下载 编辑推荐 《网络数据采集技术:Java网络爬虫实战》是国内上很少见的讲解Java语言(而不是Python语言)网络爬虫的书籍。与Python语言相比,
网络数据采集技术PDF,TXT,epub,mobi,azw3电子书下载
编辑推荐

《网络数据采集技术:Java网络爬虫实战》是国内上很少见的讲解Java语言(而不是Python语言)网络爬虫的书籍。与Python语言相比,使用Java语言进行网络数据采集,具有采集效率更高、框架性能更好、敏捷易用等优点,而且针对大型搜索引擎系统的数据采集工作更多使用Java语言,故本书值得读者学习。编程语言的初学者也可通过本书进一步掌握Java语言的高级编程技能。

内容简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的大学生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。

作者简介

钱洋合肥工业大学管理科学与工程系博士、CSDN博客专家。曾作为技术人员参与多个横向、纵向学术课题,负责数据采集系统的设计与开发工作。曾在CSDN上撰写多篇关于数据采集、自然语言处理、编程语言等领域的原创博客。姜元春合肥工业大学教授、博士生导师。长期从事电子商务、商务智能、数据采集与挖掘等方面的理论研究与教学工作。先后主持过国家自然科学基金优秀青年科学基金项目、国家自然科学基金重大研究计划培育项目、国家自然科学基金青年科学基金项目、教育部人文社科青年基金项目、阿里巴巴青年学者支持计划、CCF-腾讯犀牛鸟基金项目等课题的研究工作。

目  录
目录 
第1 章 网络爬虫概述与原理 ............................................................................ 1 
1.1 网络爬虫简介 ............................................................................................. 1 
1.2 网络爬虫分类 ............................................................................................. 2 
1.3 网络爬虫流程 ............................................................................................. 4 
1.4 网络爬虫的采集策略 ................................................................................. 5 
1.5 学习网络爬虫的建议 ................................................................................. 5 
1.6 本章小结 ..................................................................................................... 6 
第2 章 网络爬虫涉及的Java 基础知识 ........................................................... 7 
2.1 开发环境的搭建 ......................................................................................... 7 
2.1.1 JDK 的安装及环境变量配置 .......................................................... 7 
2.1.2 Eclipse 的下载 .................................................................................. 9 
2.2 基本数据类型 ........................................................................................... 10 
2.3 数组 ........................................................................................................... 11
前  言
前言
近几年,网络空间大数据(Big Data)已成为各领域研究的热门话题。在企业应用方面,天猫利用海量的用户数据挖掘年轻消费者偏好,并将用户偏好反馈给手机研发部门,将其用于手机设计;汽车之家利用平台中用户生成的大数据对用户进行画像,在此基础上开展个性化营销。在学术界,很多领域的学者针对大数据衍生出的新问题开展学术研究,如大数据驱动的客户洞察、大数据驱动的个性化推荐、大数据驱动的管理决策等。
在网络大数据环境下,数据采集尤为重要。因此,很多企业都提供了(高级)数据采集工程师的职位。对于很多在校大学生而言,尤其是硕士生和博士生,网络数据采集是一项必备的技能。
点击版本下载:   下载地址 (责任编辑:admin)
------分隔线----------------------------