南开21春学期17092103《网络爬虫与信息提取》在线作业答案Word文档下载推荐.docx
- 文档编号:15716834
- 上传时间:2022-11-15
- 格式:DOCX
- 页数:13
- 大小:17.86KB
南开21春学期17092103《网络爬虫与信息提取》在线作业答案Word文档下载推荐.docx
《南开21春学期17092103《网络爬虫与信息提取》在线作业答案Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《南开21春学期17092103《网络爬虫与信息提取》在线作业答案Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
C.集合
D.文档
C
3.使用UIAutomator获滚动屏幕的操作是得到相应控件后使用命令()
A.scroll
B.scroll_up
C.scroll_forword
D.scroll_back
4.下面Python代码输出为():
defdefault_para_without_trap(para=[],value=0):
ifnotpara:
para=[]para.append(value)returnparaprint('
第一步:
{}'
.format(default_para_trap(value=100)))print('
第二步:
.format(default_para_trap(value=50)))
A.第一步:
[100]第二步:
[100,50]
B.第一步:
[50]
C.第一步:
[]
D.第一步:
[100]
B
5.MongoDB中可以将()数据结构插入集合中
6.Python中跳过本次循环应用关键字()
A.break
B.continue
C.exit
D.return
7.可以通过()绕过网站登录。
A.session
B.cookies
C.moonpies
D.localstorage
8.Python中把列表转换为集合需要使用##函数
A.set
B.list
C.convert
D.change
9.下列关于mitmproxy的安装说法错误的是()
A.对于MacOS系统,使用Homebrew安装mitmproxy,命令为:
brewinstallmitmproxy
B.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本
C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D.UBUNTU中执行命令sudopip3installmitmproxy进行安装
10.启动MongoDB使用命令mongod--()usr/local/etc/mongod.conf
A.config
B.install
C.start
D.begin
11.在Linux中哪个命令是添加权限的()
A.chmod
B.sudo
C.cp
D.mkdir
12.PyMongo中逻辑查询表示小于的符号是()
A.$gt
B.$lt
C.$gte$$lte
13.Python中退出循环应用关键字()
14.HTTP常用状态码表明服务器正忙的是()
A.500
B.503
C.403
D.404
15.Redis中往集合中读数据,使用关键字()
A.pop
B.spop
C.lpop
D.range
16.Redis是一个开源的使用()语言编写
A.ANSIC
B.C++
C.JAVA
D.Python
17.使用xpath方法的返回类型是()
18.Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()
A.Device
B.Devices
C.Jobs
D.Job
19.采用以下()技术可以实现异步加载
A.HTML
B.AJAX
C.CSS
D.HTTP
20.HTTP常用状态码表明服务器内部资源出故障了的是()
二、多选题(共10道试题,共20分)
21.PyMongo删除操作有()
A.delete
B.delete_all
C.delete_one
D.delete_many
CD
22.在配置ios使用Charles的操作中,正确的有()
A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
ABCD
23.常用的会话跟踪技术是
AB
24.MongoDB中获取名字为db的库的语句为()
A.client.db
B.client('
db'
)
C.client['
]
D.client{'
}
AC
25.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A.非法侵入计算机系统罪
B.非法获取计算机信息系统数据罪
C.非法获取计算机数据罪
D.非法获取系统罪
26.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
A.服务器日志
B.数据库日志记录
C.程序日志记录
D.服务器监控
27.以下HTTP状态码表示服务器本身发生错误的是
A.400
C.302
D.500
BD
28.使用BeautifulSoup对象后可以使用()来查找内容
A.find_all
B.find
C.search
D.search_all
29.Redis中的值可以支持()
B.哈希
D.有序集合
30.以下哪些方法属于Python写CSV文件的方法()
A.writeheaders
B.writeheader
C.writerrows
D.writerow
ACD
三、判断题(共20道试题,共40分)
31.使用异步加载技术的网站,被加载的内容可以在源代码中找到
[以上叙述是否正确?
A.正确
B.错误
错误
32.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-server
33.通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
正确
34.process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用
35.chrome开发者工具没法对数据进行搜索。
如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
36.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
37.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
38.自己能查看的数据,允许擅自拿给第三方查看
39.引用中间件时后面的数字代表的是中间件的执行顺序,例如'
AdvanceSpider.middlewares.ProxyM
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络爬虫与信息提取 南开 21 学期 17092103 网络 爬虫 信息 提取 在线 作业 答案