python:无线密码跑字典破密

import pywifiimport sysimport timefrom pywifi import constwifi = pywifi.PyWiFi()  # 创建一个无线对象iface = wifi.interfaces()[0] 
阅读全文

【斗图网爬虫】多线程高效率下载表情

#encoding:utf-8import requestsimport urllibfrom bs4 import BeautifulSoupimport osimport threading# 整合#构建页面urlBASE_PAGE_URL = 'http
阅读全文

【斗图网爬虫】下载表情

#encoding:utf-8import requestsimport urllibfrom bs4 import BeautifulSoupimport os#构建页面url# BASE_PAGE_URL = 'http://www.doutula.com/photo/li
阅读全文

Python:异步多线程运行

#encoding:utf-8import threadingimport timedef greet(index):print('hello world-%d' % index)time.sleep(1)def line_run():for x in r
阅读全文

python网络爬虫一般用到的库

requests:用来请求网络数据,可以认为是一个浏览器。pip install requestsbeautifulsoup4:用来解析html文档,然后过滤我们需要的数据pip install bs4
阅读全文

python2.7如何安装requests

首先,python安装模块使用pip命令安装步骤:打开命令行。win+r打开运行,输入cmd点确定。切换到python安装目录的script目录下。执行命令,pip install requests,安装完成,验证。进行python命令行,输入import requests,如不报错则说明安装成功。
阅读全文

用python爬取并下载花瓣网美女图片

核心代码如下:import urllib2import jsonimport threading class myThread(threading.Thread):    def __init__(self, imgurl, filename): 
阅读全文

Python:编辑器的安装配置和使用

下载网址:https://code.visualstudio.com/docs/?dv=win 编辑器网盘地址:链接:https://pan.baidu.com/s/1_teOkGChH5PsA9e4ytvH-Q 提取码:0u8b安装扩展:图标扩展设置字体:文件下的首选项设置中文简体:首先按F1快捷键或者Ctrl + Shift + P,切入到命令行模式。输入“Configure Lan
阅读全文

爬虫的分类

1.通用爬虫:搜索引擎用的爬虫系统。-1目标:就是尽可能把互联网上所有的网页下载下来,放到本地服务器里形成备份,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。-2抓取流程:a) 首选选取一部分已有的URL,把这些URL放到待爬取队列。b) 从队列里取出这些URL,然后解析DNS得到主机IP,然后去这个IP对应的服务器里下载HTML页面,保存到搜索引擎的本地服务器。之后把
阅读全文

爬虫介绍

二、什么是爬虫?爬虫:就是抓取网页数据的程序。三、爬虫怎么抓取网页数据:网页三大特征:-1. 网页都有自己唯一的URL(统一资源定位符)来进行定位-2. 网页都使用HTML (超文本标记语言)来描述页面信息。-3. 网页都使用HTTP/HTTPS(超文本传输协议)协议来传输HTML数据。爬虫的设计思路:-1. 首先确定需要爬取的网页URL地址。-2. 通过HTTP/HTTP协议来获取对应的HTML
阅读全文