任务详情
一、项目简介
我这边在做一套内部用的舆情采集系统 BN,底层技术栈是 Node.js + Playwright + PostgreSQL,需要找一位有真实平台采集经验的工程师合作完成阶段一。
二、阶段一要做什么(1–2 周)
用 Node.js + Playwright 写可稳定运行的采集脚本;
目标平台:
抖音:指定视频下评论列表(昵称、内容、点赞数、时间);
微博:话题搜索结果 + 热门评论;
公众号:文章标题 + 正文;
需要处理基本反爬:登录 / cookie 注入 / UA 与 headers 模拟 / 简单滑块处理 / 错误重试;
把采集结果写入 PostgreSQL(我这边提供表结构);
提供:可运行 demo + 核心代码 + 简要说明文档。
三、期望你具备
做过任意一种真实平台采集(抖音 / 快手 / 微博 / 公众号 / 小红书等);
熟悉 Playwright 或 Puppeteer(Node 方向);
有账号登录、cookie 注入、反爬处理经验;
能独立开发并远程交付 demo。
四、合作方式
周期:约 1–2 周;
预算:¥10k–14k(按阶段验收,可细聊);
形式:远程合作,按项目结算,有长期合作可能(后续会扩展 n8n 节点、舆情分析与可视化)。
五、简单筛选问题(私信时请一起回复)
你做过的真实采集项目有哪些?(平台 + 简要说明)
你最熟的是哪个平台?(例如抖音 / 微博 / 公众号…)
是否方便提供一小段可以公开的 Playwright / Puppeteer 代码片段(可打码)?
从接需求到交付第一个 demo,大概需要多久?
只找做过真实平台采集的同学,没做过抖音/微博/公众号这类平台的就先不用投啦,谢谢。
给泼冷水下,playwright 方案行不通,然后 0-1 做过舆情软件