2016.12.27
在学习Python之前就闻Python在爬虫方面有着很好作用。下面来说说什么是爬虫?
网络爬虫是一种程序,主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站,样子像一只大蜘蛛。
1.JSON是什么?
JSON指的是JavaScript对象表示法(JavaScript Object Notation)
JSON是存储和交换文本信息的语法,类似XML
JJSON比xml更小,更快,更易理解。
JSON是轻量级的文本数据交换格式
JJSON独立于语言。
JSON具有自我描述性,更易理解。
2.两种常见的HTTP方法是:GET和POST
什么是HTTP?
超文本传输协议(HTTP)的设计目的是保证客户端与服务器之间的通信,HTTP的工作方式是客户端与服务器之间的请求-应答协议。
GET-从指定的资源请求数据
POST-向指定的资源提交要被处理的数据。
下面是一段关于Python的代码,结果是能够翻译你输入的类容。
import urllib.request import urllib.parse import json content = input("请输入需要翻译的内容:") url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/" data = {} data['type'] = 'AUTO' data['i'] = content data['doctype'] = 'json' data['xmlVersion'] = '1.6' data['keyfrom'] = 'fanyi.web' data['ue'] = 'UTF-8' data['typoResult'] = 'true' data = urllib.parse.urlencode(data).encode('utf-8') response = urllib.request.urlopen(url, data) html = response.read().decode('utf-8') target = json.loads(html) print("翻译结果:%s" % (target['translateResult'][0][0]['tgt']))
获取状态码的两种方式:
第一种是用urllib模块。下面是咧示代码:
import request.urllib status=request.urllib.urlopen("http://www.jb51.net").get_code print status
第二种是用requests模块,下面是列示代码:
import requests code=requests.get("http://www.jb51.net").status_code print(code)
相关推荐
可执行源码python爬虫实例——基于python实现有道云翻译接口
多线程爬虫有道翻译;知识点:使用requests模块 发送POST请求;GET请求与POST请求;GET请求与POST请求;Requests库发送POST请求;Requests库发送POST请求;爬虫技术基础;谢谢观看
使用python爬虫爬取有道翻译,进行翻译。
一个基于Python爬虫的有道翻译接口 用法 a=Search_words() #初始化对象 b=a.Simple_search(“Hello”) #进行搜索,支持中译英/英译中,返回一个字典 字典内数据 返回的数据可能含有换行符或、标记以及空格,请自行...
主要介绍了Python爬虫实现简单的爬取有道翻译功能,结合实例形式分析了Python基于urllib库实现的爬虫爬取有道翻译相关定义与数据交互功能操作技巧,需要的朋友可以参考下
爬取有道翻译API,自制翻译工具——Python爬虫。有道翻译提供即时免费的中文、英语、日语、韩语、法语、德语、俄语、西班牙语、葡萄牙语、越南语、印尼语、意大利语全文翻译、网页翻译、文档翻译服务。
python做的有道翻译程序,重新做了对应的反扒代码GUI应用。大家下载后请评价截止XXXX年XX月XX日能用。 截止2017年10月21 日可用。
Python代码,伪装成浏览器去利用有道的资源,然后做成的翻译器,可以连续输入词条翻译
用python制作有道翻译可直接进行翻译内容,源码上传,下载可直接运行
有道翻译_python翻译_python爬虫_源码.zip
使用json解析的python爬虫实例,注释详细
Python爬虫、有道翻译、GUI、保姆级备注
自带简易界面的翻译小程序代码,利用有道翻译达到翻译效果,对于爬虫的学习可以起到借鉴作用。需要者请自行下载。
scrapy框架爬虫,爬取百度翻译、有道翻译、谷歌翻译、爱词霸翻译、必应翻译,包括防爬虫破解,使用方式just文件夹下python run.py “想要翻译的内容”
Python利用爬虫技术调用有道翻译。可翻译一个段落。演示了requests库的用法。
最近在学习python 爬虫方面的知识,网上有一博客专栏专门写爬虫方面的,看到用urllib请求有道翻译接口获取翻译结果。发现接口变化很大,用md5加了密,于是自己开始破解。加上网上的其他文章找源码方式并不是通用的,...
获取有道翻译的链接url 需要发送的参数在form data里 示例 import urllib.request import urllib.parse url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule' data = {} data['i'] =...
基于python的有道爬虫系列,可以在线爬取数据分析,然后在线翻译。
python爬虫,有道翻译
有道翻译官网:http://fanyi.youdao.com/ 分析网站 打开网页,F12找到translate这个XHR文件中存在主要信息,找到最后的From Data(数据的来源,如何获取的,最后调用翻译) 对于这两组数据,不知道是什么?(虽然bv...