-
第四次作业
第一个问题: (1)选点问题的典型场景是:给定多个区间,选择最少的点,使得每个区间至少包含一个点。 (2)贪心策略:将所有区间按右端点升序排列后,选择第一个区间的右端点作为第一个点,遍历后续区间:若当前区间不包含已选点,则选择当前区间的右端点作为新点。 (3)贪心选择性质是指:“每一步的局部最优选择 -
102302109-胡贝贝-作业4
作业①: (1)实验内容及结果 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 核心代码: class StockDataSpi -
数据采集与融合技术实践作业四
作业一: 代码: import requests import pymysql import time import json DB_HOST = 'localhost' DB_USER = 'root' DB_PASSWORD = '123456' # 【请在这里修改你的数据库密码】 DB_NAM -
数据采集_4
目录第一题:爬取股票信息关键步骤一:构造请求 URL:按板块分页抓取关键步骤二:解析 JSONP 数据关键步骤三:从diff里取出核心指标爬取结果:心得体会:第二题:爬取mooc课程整体思路简述关键步骤一:自动登录(iframe 中的账号密码登录)关键步骤二:解析课程信息爬取结果:心得体会:第三题: -
数据采集技术 - 第四次作业
作业①:东方财富网股票数据爬取 作业要求: 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。 使用 Selenium 框架 + MySQL 数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财 -
102302106-陈昭颖-第四次作业
作业1 实验一:爬取3个板块的股票信息 要求 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 思路 之前的实验中有爬取过东方财富 -
数据采集第四次作业
作业1 要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://quote.eastmone -
102302145 黄加鸿 数据采集与融合技术作业4
作业4 目录作业4作业①1)代码与结果2)心得体会3)Gitee链接作业②1)代码与结果2)心得体会3)Gitee链接作业③1)代码与结果2)心得体会 作业① 1)代码与结果 目标:使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据 -
102302126_李坤铭_作业4
作业①: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 1)代码: 点击查看代码 import sqlite3 import -
作业4
数据采集与融合技术作业4 作业①: 要求:熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容。 使用 Selenium 框架+ MySQL 数据库存储技术路线爬取“沪深 A 股”、“上证 A 股”、“深证 A 股”3 个板块的股票数据信息。 候选网 -
作业4
1.熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 实验内容 网页结构 在table中的tr为每行元素,td为单个属性 核心代码 点 -
数据采集与融合技术实践4
数据采集与融合技术实践4 任务一 任务要求 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。 候选网站:东方财富网:http://quote.eastmoney.com/center/gridlist.html#hs_a_b