python最近几年蛮火的,占据了各个技术论坛的很多篇幅,闲来没事自己下载安装搞搞,python的下载安装大家可以自己百度自己安装一下,python2和python3的语法等还是有很大的区别的比如请求组件urllib request和输出print需要带括号等,我的版本是3.6python的安装目录看了一下里面还是有很多工具啊组件啊DLL拓展啥的还是蛮丰富的,安装完成后去 命令 python
我的开发工具是 JetBrains PyCharm Community Edition 2018.2.1 x64
下载安装大家可以去自己搞一下;
python 可以做很多东西:web开发;爬虫;大数据(数据分析);人工智能(机器学习,这个我不太懂太高大上了);
那下面我就简单介绍一下python的爬虫,我也我抄袭网上别人的,自己练练手(基础语法基本都练习过了);
1.先来个最简单的 抓取网页的源代码
#coding:utf-8 #import urllib # 多行注释 获取页面源代码 import urllib.request page = urllib.request.urlopen('http://www.baidu.com')#打开网页 htmlcode = page.read()#读取页面源码 print(htmlcode) #在控制台输出
里面的用到的类库及函数等,请大家自行百度一下,编辑工具里运行结果是:
D:\python>python test5.py
2. 再来一个稍微稍微高级一丁点的:抓取贴吧里的图片并保存至本机D盘Temp目录下, 代码如下
#抓取网页 图片并保存 import re import urllib.request # ------ 获取网页源代码的方法 --- def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html # ------ getHtml()内输入任意帖子的URL ------ html = getHtml("https://tieba.baidu.com/p/5352556650") # ------ 修改html对象内的字符编码为UTF-8 ------ html = html.decode('UTF-8') # ------ 获取帖子内所有图片地址的方法 ------ def getImg(html): # ------ 利用正则表达式匹配网页内容找到图片地址 ------ reg = r'src="([.*\S]*\.jpg)"' imgre = re.compile(reg); imglist = re.findall(imgre, html) return imglist imgList = getImg(html) imgName = 0 for imgPath in imgList: # ------ 这里最好使用异常处理及多线程编程方式 ------ try: f = open('D:\\Temp\\'+ str(imgName)+".jpg", 'wb') f.write((urllib.request.urlopen(imgPath)).read()) print(imgPath) f.close() except Exception as e: print(imgPath+" error") imgName += 1 print("All Done!")
运行结果如下:
D盘的Temp目录下: 多出了几十张照片
代码里面还有涉及到 正则匹配和循环等
---- python 还是蛮有意思的的吧-------
3. 再来个简单的 计算长方形的面积
def area(width,height): return width * height def print_welcome(name): print("welcome",name) print_welcome("Runoob") w = 4 h = 5 print("width =", w, " height =", h, " area =", area(w, h))
D:\python>python test4.py 运行结果如下:
4. 最后一个 让python链接Mysql 数据库,这个我们需要安装pymysql组件,大家可以自己下载安装;开启mysql服务
# 链接mysql数据库 # !/usr/bin/python3 import pymysql # 打开数据库连接 db = pymysql.connect("localhost", "root", "", "test") # 使用 cursor() 方法创建一个游标对象 cursor cursor = db.cursor() # 使用 execute() 方法执行 SQL 查询 cursor.execute("SELECT VERSION()") # 使用 fetchone() 方法获取单条数据. data = cursor.fetchone() print ("Database version : %s " % data) # 关闭数据库连接 db.close()
运行结果:数据库版本是
// 创建一张表
#!/usr/bin/python3
import pymysql # 创建数据表 # 打开数据库连接 db = pymysql.connect("localhost", "root", "", "test") # 使用 cursor() 方法创建一个游标对象 cursor cursor = db.cursor() # 使用 execute() 方法执行 SQL,如果表存在则删除 cursor.execute("DROP TABLE IF EXISTS EMPLOYEE1") # 使用预处理语句创建表 sql = """CREATE TABLE EMPLOYEE1 ( FIRST_NAME CHAR(20) NOT NULL, LAST_NAME CHAR(20), AGE INT, SEX CHAR(1), INCOME FLOAT )""" cursor.execute(sql) # 关闭数据库连接 db.close()
// 今天先到这里,大家可以下载安装一下玩玩,蛮有意思的风格个PHP很像,很喜欢!
相关推荐
python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础python爬虫基础...
Python爬虫数据可视化分析大作业,python爬取猫眼评论数据,并做可视化分析。 python爬虫数据可视化分析大作业 python爬虫,并将数据进行可视化分析,数据可视化包含饼图、柱状图、漏斗图、词云、另附源代码和报告书...
讲诉python爬虫的20个案例 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
python爬虫内容概要: 本套面试题涵盖了Python爬虫的基本原理、反爬虫策略、常用库(如BeautifulSoup、Scrapy、Selenium)的使用、代理IP的应用、Ajax爬取、多线程/多进程提高效率、分布式爬虫的实现等核心技术点。...
81个Python爬虫源代码,内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
全新顶级Python爬虫核心项目与框架实战教学,课程目的就是带领同学们做项目,做没有赘述的Python精华核心项目。课程分为了5个大的节点,分别是Python网络爬虫前奏阶段,主要是进行课程的预热以及概要和说明。第二...
最新版的python爬虫知识,其中还介绍了Android开发的基础知识。 目录: 网络协议&爬虫简介;爬虫请求模块;正则表达式;xpath;Beautiful Soup库;selenium;多线程;Scrapy框架;CrawSpider使用和settings文件讲解...
本书共8章,涵盖的内容有Python语言的基本语法、Python常用IDE的使用、Python第三方模块的导入使用、Python爬虫常用模块、Scrapy爬虫、Beautiful Soup爬虫、Mechanize模拟浏览器和Selenium模拟浏览器。
python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫python爬虫,拉勾网爬虫...
Python爬虫课件(完整版).pptx
python爬虫开发工程师应届生个人简历模板(Word可以直接使用).docxpython爬虫开发工程师应届生个人简历模板(Word可以直接使用).docxpython爬虫开发工程师应届生个人简历模板(Word可以直接使用).docxpython爬虫开发...
精通Python爬虫框架Scrapy.pdf
Python爬虫开发:从入门到实战(微课版) 读书笔记模板 Python爬虫开发:从入门到实战(微课版)全文共33页,当前为第1页。 01 思维导图 读书笔记 目录分析 内容摘要 精彩摘录 作者介绍 目录 03 05 02 04 06 Python...
Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程Python爬虫入门教程...
81个Python爬虫源代码+九款开源爬虫工具,81个Python爬虫源代码,内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
内容概要:该资源是一份Python爬虫实战指南,内容涵盖数据采集、处理和分析的全过程。通过该资源,读者可以了解Python爬虫的基本原理、常用库和工具,学习如何使用Python编写爬虫程序并采集数据,同时还能学习如何...
老男孩最新周末班Python开发与Python爬虫实战视频教程,较以往的Python全栈开发课程来看,更为干练和精准一些。课程将开发教学的目标放在了Python的开发流程和和爬虫的重点教学之上,更好的适用于同学们的快速学习和...
python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python爬虫淘宝京东拼多多python...
Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事 Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事