-
数据采集与融合技术_实验四
码云链接:欧翔实验四 1.作业①: **要求:**熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 **候选网站:**http://search.dangdang.com/?key=python& -
数据采集与融合技术第四次实验
作业1 1) 1、实验题目 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://search.dangdang.com/?key=python&act=input 关键 -
数据采集 第四次大作业
#作业① 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://search.dangdang.com/?key=python&act=input 关键词:学生可自由选择 -
数据采集第四次大作业
作业一 作业①:要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据候选网站:http://search.dangdang.com/?key=python&act=input关键词:学生可自由选 -
10组-Beta冲刺-1/5
一、基本情况 队名:要有格局才队 组长博客 Github链接 小组人数:10 二、冲刺概况汇报 姓名:苏伟煌(组长) 过去两天完成了哪些任务: 文字描述: 1.规划部署成员工作 2.问题整合,与各小组串接 3.可视化图制作 展示GitHub当日代码/文档签入记录: 接下来的计划 1.工作部署安排 2 -
10组-Beta冲刺-1/5
一、基本情况 队名:要有格局才队 组长博客 Github链接 小组人数:10 二、冲刺概况汇报 姓名:苏伟煌(组长) 过去两天完成了哪些任务: 文字描述: 1.规划部署成员工作 2.问题整合,与各小组串接 3.可视化图制作 展示GitHub当日代码/文档签入记录: 接下来的计划 1.工作部署安排 2 -
10组-Beta冲刺-1/5
一、基本情况 队名:要有格局才队 组长博客 Github链接 小组人数:10 二、冲刺概况汇报 姓名:苏伟煌(组长) 过去两天完成了哪些任务: 文字描述: 1.规划部署成员工作 2.问题整合,与各小组串接 3.可视化图制作 展示GitHub当日代码/文档签入记录: 接下来的计划 1.工作部署安排 2 -
10组-Beta冲刺-1/5
一、基本情况 队名:要有格局才队 组长博客 Github链接 小组人数:10 二、冲刺概况汇报 姓名:苏伟煌(组长) 过去两天完成了哪些任务: 文字描述: 1.规划部署成员工作 2.问题整合,与各小组串接 3.可视化图制作 展示GitHub当日代码/文档签入记录: 接下来的计划 1.工作部署安排 2 -
[数据采集与融合技术]第四次大作业
作业 作业① 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://search.dangdang.com/?key=python&act=input 关键词:学生可自由 -
10组-alpha冲刺总结
组长博客链接 一、基本情况 现场答辩总结 项目总体进展充分 应该更深度地去挖掘爬取下来的大量数据潜在的含义 在柯老师的建议下、降低数据清洗的数量的同时提高清洗质量并且更进一步挖掘爬取到的数据的内在含义。对待数据分析结果的呈现应该更加谨慎。 经同学建议、可能会采取更前沿的数据分析方法、具体枚举如下: