Skip to content

Instantly share code, notes, and snippets.

@lize240810
lize240810 / Ubuntu 上解压浏览器上下载的软件
Created September 20, 2019 02:11
熟悉解压命令 安装命令
- 目标: [下载Navicat](https://www.navicat.com.cn/download/navicat-premium)
- 操作:
- 解压
```
sudo tar -zxvf navicat120_premium_cs_x64.tar.gz
```
- 启动
```
./start_navicat
```
@lize240810
lize240810 / Ubuntu 安装使用mysql
Created September 19, 2019 09:18
Ubuntu上安装使用mysql 教程 修改初始密码
# 安装mysql
```
sudo apt install mysql-server
```
# ubuntu18.04 首次登录mysql未设置密码或忘记密码解决方法
1.首先输入以下指令:
```shell
sudo cat /etc/mysql/debian.cnf
```
2.输入显示的帐号与密码
@lize240810
lize240810 / Ubuntu python虚拟环境
Created September 19, 2019 09:09
最近升级使用了一下Ubuntu18.04才刚使用,Ubuntu中推荐使用虚拟环境来操作python 下面是一份虚拟环境配置
# 开发Python
### 虚拟环境配置教程
- 使用虚拟环境是比不可少的,特奉上一个配置虚拟环境的教程
- 记得需要先安装`aptpthon3-pip`
- 两个虚拟必备库
```
pip3 install virtualenv
pip3 install virtualenvwrapper
```
- 查看安装目录(为环境变量准备)
# 初识Python爬虫
## 环境搭建
1. 下载[Python](https://repo.anaconda.com/archive/Anaconda3-2019.03-MacOSX-x86_64.pkg)
2. 下载[chrome浏览器](https://www.google.cn/chrome/browser/desktop/index.html )
- [chrome插件](https://www.zhihu.com/question/20054116)
3. 下载[PyCharm编译器](http://www.jetbrains.com/pycharm/download/#section=windows )
## 创建一个爬虫
1. 安装包
@lize240810
lize240810 / 一、什么是爬虫?
Created June 20, 2019 01:37
什么是爬虫?爬虫有什么用?以及爬虫是如何实现的?从这三点来全面剖析爬虫这一工具。
# 什么是爬虫?
## 爬虫的定义:
> 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
## 爬虫有什么用:
> **市场分析**:电商分析、商圈分析、一二级市场分析等
> **市场监控**:电商、新闻、房源监控等
@lize240810
lize240810 / Python-Web应用部署步骤
Last active May 10, 2019 09:47
python的web项目 flask,django都部署
1.先把项目传到服务器上
文件上传
1、把本机的文件传给目的服务器
```
scp 文件 [email protected]:/目录
```
2、在本机上执行scp,把远端的服务器文件拷贝到本机上:
```
scp [email protected]:目录 /
@lize240810
lize240810 / 生成https证书
Created May 10, 2019 09:30
在服务器上运行项目以后让项目绑定域名并且生成https证书
1.安装必要库
```
apt-get -y install git bc
```
2.下载生成ssl证书的项目
```
git clone https://github.com/letsencrypt/letsencrypt /opt/letsencrypt
```
3.继续生成证书必须要先停止现在的nginx
```
@lize240810
lize240810 / 请求头
Last active February 13, 2019 13:28
HTTP的头域包括通用头、请求头、响应头和实体头四部分。
**Accept**:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
**含义**:告诉浏览器我们接受MIME的类型
---
**Accept-Encoding**:gzip, deflate, br
**含义**:如果有这个字段,则代表客户端支持压缩将内容编码,去掉后会支持任意编码。
@lize240810
lize240810 / 请求行
Created February 13, 2019 13:21
<GET>是HTTP的请求方式之一,HTTP/1.1协议中共定义了8种方法与服务器交互,有 GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT,其中比较常用的是<GET>和<POST>方法了。
**HEAD**:从服务器得到除了请求体与GET请求一样的响应
**GET**:通过URL获取查询资源信息(爬虫特定URL爬取)
**POST**:提交表单(爬虫中的模拟登录)
**PUT**:上传文件(浏览器不支持)
**DELETE**:删除
**OPTIONS**:返回服务器对特定资源支持的HTTP请求方法
**TRACE**:返回服务器收到的请求,用于测试或诊断
**CONNECT**:预留给管道连接方式的代理服务
![微信图片_20190213212012.jpg](
@lize240810
lize240810 / HTTP请求会返回响应状态码
Created February 13, 2019 13:09
根据状态码可以知道返回信息的状态。状态码规定如下
### 1xx: 信息响应类,表示接收到请求并且继续处理
100——必须继续发出请求
101——要求服务器根据请求转换HTTP协议版本
### 2xx: 处理成功响应类,表示动作被成功接收、理解和接受
200——交易成功
201——提示知道新文件的URL
202——接受和处理、但处理未完成
203——返回信息不确定或不完整
204——请求收到,但返回信息为空
205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件