贺州学院学报

2019, v.35;No.119(03) 151-156

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

Python语言中re库的使用技巧与目标网络数据的抓取
The Application of Re-Database in Python Language and Acquisition of Target Network Data

沈承放;莫达隆;

摘要(Abstract):

在大数据的时代背景下,为了能够准确有效的获取网络数据,定向抓取相关网页数据的网络爬虫应运而生。python是网络爬虫首选的程序设计语言,它拥有着丰富且强大的库,能够简洁有、效的实现目标网络数据的获取,其中re库是一个用来提取目标数据的优秀的python库。为了深入学习re库的使用方法,首先了解正则表达式的概念和语法,从而更好地理解python语言的re库,深入探究re库的使用技巧,包括使用原理、功能函数等。介绍目标网络爬虫原理、网络数据抓取的一般流程,以及re库在获取目标网络数据中的应用。最后以某某劳动力市场为例实现目标网络数据的获取。

关键词(KeyWords): python;re库;网络数据获取;网络爬虫

Abstract:

Keywords:

基金项目(Foundation): 2018年国家社会科学基金西部项目“基于数据挖掘的农村居民人均可支配收入数据质量评价体系的构建”(18XTJ002);; 2019年广西研究生教育创新计划项目“精准扶贫形势下农民收入调查研究”(XYCSZ2019088)

作者(Author): 沈承放;莫达隆;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享