找回密码
 注册VIP尊享专业服务
查看: 6|回复: 0

八爪鱼采集器采集微信公众号历史文章的操作方法

[复制链接]

2275

主题

0

回帖

7236

积分

版主

积分
7236
发表于 2024-11-16 16:24:37 | 显示全部楼层 |阅读模式
[color=var(--md-box-samantha-normal-text-color)  !important]以下是使用八爪鱼采集器采集微信公众号历史文章的操作方法:

  • 准备工作
    • 下载并安装八爪鱼采集器软件。你可以从八爪鱼官方网站下载适合你操作系统的版本6
    • 由于微信公众号的内容属于互联网公开数据,八爪鱼需要从网页采集入手,这里我们借助搜狗微信来获取公众号文章12
  • 创建采集任务1
    • 打开八爪鱼采集器,进入主界面,选择 “自定义模式”。
    • 在网站输入框中复制粘贴搜狗微信的网址(http://weixin.sogou.com/),然后点击 “保存网址”。
  • 设置搜索关键词
    • 打开右上角的 “流程”。点击页面中的文章搜索框,在右侧的操作提示框中,选择 “输入文字”。
    • 输入你要搜索的微信公众号名称(比如 “速写男装”),输入完成后点击 “确定” 按钮。该公众号会自动填充到搜索框,接着点击 “搜文章” 按钮。
  • 创建翻页循环
    • 页面中出现该公众号的文章搜索结果后,将结果页面下拉到底部,点击 “下一页” 按钮,在右侧的操作提示框中,选择 “循环点击下一页”。你可以根据自己的需求设置翻页的次数或循环条件,以便采集更多的文章页面。
  • 创建列表循环并提取数据
    • 移动鼠标,选中页面里第一篇文章的区块。系统会识别此区块中的子元素,在操作提示框中,选择 “选中子元素”。
    • 继续选中页面中第二篇文章的区块,系统会自动选中第二篇文章中的子元素,并识别出页面中的其他同类元素,在操作提示框中,选择 “选中全部”。此时,页面中文章区块里的所有元素均会被选中,变为绿色。
    • 右侧操作提示框中会出现字段预览表,将鼠标移到表头,点击垃圾桶图标,可删除不需要的字段。字段选择完成后,选择 “采集以下数据”。如果你还想要采集每篇文章的 URL,点击第一篇文章的链接,再点击第二篇文章的链接,系统会自动选中页面中的一组文章链接,在右侧操作提示框中选择 “采集以下链接地址”。
    • 选中相应的字段,可以进行字段的自定义命名,以便后续识别和整理数据。
  • 数据采集及导出
    • 完成以上设置后,点击左上角的 “保存并启动”,选择 “启动本地采集”,八爪鱼采集器就会开始按照设置的规则采集微信公众号文章的数据。
    • 采集完成后,会跳出提示,选择 “导出数据”,并选择合适的导出方式(如 Excel、TXT 等),将采集好的数据导出到本地电脑上。


回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies |上传

本版积分规则

QQ|中关村在线|IT之家|太平洋手机|移动|华为官网|vivo手机|华军软件园|手机版|苏四哥综合网 ( 桂ICP备2022004686号|桂ICP备2022004686号 )

GMT+8, 2024-11-25 02:22 , Processed in 1.091033 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表