- selenium模拟浏览器获取漫画搜索图片链接
定义一个从章节内获取每页图片信息的函数其接受参数为函数get_chapter_list返回值列表中的字典。
经过上面的分析我们已确定该处要采用selenium进行图爿链接获取,因此在函数定义之前,还需要初始化selenium,并设置不加载图片不开启可视化的选项,提高效率
在此之前,你除了pip安装好所需模块外还需要安装对应谷歌浏览器版本的chromedriver,64位向下兼容所以下载32位的是没问题的。下载地址输入y或者Y都将正确return漫画搜索的链接,达箌预期要求
现只需将之前代码中的start_url由指定链接变更为该函数即可,即:
当需要下载漫画搜索时只需改变参数CARTOON_NAME即可,后续的检索下载、目录命名、数据库表名称都不用操心将会自动完成更改创建。
到此基本的检索模块也完成了。坑位三: 限制级漫画搜索处理