三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

小红书采集神器

Spider_XHS 是一个在 GitHub 上已获得超过 3000 Star 的小红书数据采集与运营工具。它不仅仅是一个爬虫,更提供了一套完整的小红书全域运营解决方案。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该项目支持多维度数据抓取,可将结果保存为 Excel 表格或直接下载多媒体文件。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

采集用户所有笔记至本地

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该工具能够自动下载用户的所有笔记,并按统一格式保存到本地文件夹。每个笔记文件夹会自动提取并下载高清无水印图片,同时保存笔记链接、标题、点赞、收藏等数据。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
除了数据采集,它还集成了创作者平台接口,支持笔记的自动化上传,极大提升了运营效率。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

使用该项目需要基础的 Python 和 Node.js 环境。

第一步:克隆项目与安装依赖

“`bash

下载项目

git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

安装 Python 依赖

pip install -r requirements.txt

安装 Node.js 依赖(用于加密参数生成)

npm install
“`

第二步:配置 Cookie

这是最关键的一步。你需要在项目根目录的 .env 文件中填入你的小红书 Cookie。

  1. 在浏览器中登录小红书网页版。
  2. 按 F12 打开开发者工具,切换到 “Network” (网络) 选项卡。
  3. 刷新页面,点击任意一个请求,在 “Request Headers” 中找到 cookie 字段。
  4. 复制完整的 Cookie 值,粘贴到 .env 文件中。

第三步:运行爬虫

项目入口是 main.py。你可以根据需求修改代码中的调用逻辑,然后直接运行:

bash
python main.py

运行后,控制台会显示采集进度,所有数据和媒体文件将自动保存到指定文件夹。

开源地址:https://github.com/cv-cat/Spider_XHS


PPT Agent

PPTAgent 是中科院计算所开源的项目。它不仅能根据一句话生成 PPT,还能解析长文档(如论文、报告),自动提炼重点并生成幻灯片。

与简单的文本转换工具不同,PPTAgent 采用多智能体 (Multi-Agent) 架构,模拟人类制作 PPT 的完整思考流程。

示例:生成介绍小米 SU7 外观与价格的 PPT

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

生成的 PPT 可适配不同商务或学术风格,并能根据每页内容自动搜索并插入相关图片。

示例:生成高中课堂课件

主题为“解码立法过程:理解其对国际关系的影响”:
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

PPTAgent 支持上传本地文档,并利用 RAG 技术从中提取关键信息,确保生成内容的准确性与详实性。

该项目直接输出原生的 .pptx 文件,可在 PowerPoint 中直接打开并进行任意修改、拖拽和美化,不存在兼容性问题。

开源地址:https://github.com/icip-cas/PPTAgent


Code2Video

Code2Video 是一个通过编写代码来生成高质量教学视频的开源框架。它不直接生成像素,而是利用 Manim(数学动画引擎)代码来创建视频,确保了视频逻辑严密、清晰度极高,且每一帧都可精准编辑。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

简单来说,Code2Video 是一个由 AI 智能体驱动的框架。其灵感来源于使用 Manim 引擎制作科普视频的 3Blue1Brown。Code2Video 相当于一个自动编写 Manim 代码的 AI 助手。

该项目由新加坡国立大学团队开发。以下是其生成效果与 Veo3 等 AI 视频的对比示例:

开源地址:https://github.com/showlab/Code2Video


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/15803

(0)
上一篇 2025年11月30日 下午1:15
下一篇 2025年12月1日 上午7:52

相关推荐

  • 解锁自动化新境界:n8n与飞书多维表格的完美融合,打造高效工作流

    解锁自动化新境界:n8n与飞书多维表格的完美融合,打造高效工作流 在利用开源工作流工具 n8n 构建自动化流程时,数据的归档与存储是关键环节。飞书多维表格为此提供了一个优秀的解决方案。它不仅可作为结构化数据的中转站,更能借助其「字段捷径」功能,与 AI 处理或后续自动化流程无缝衔接,实现效率的倍增。 值得一提的是,飞书多维表格现已支持网页端直接访问(base…

    2025年11月7日
    59800
  • 6款AI驱动的开源CLI工具:让终端开发更智能高效

    如果你大部分时间都在终端里工作,你一定知道一个得心应手的命令能省下数小时的工夫。如今,新一代的 CLI 工具正在改变游戏规则——它们将 AI、自动化与简洁性融为一体,让开发工作重新变得高效而有趣。 这里推荐六款我正在使用且非常喜欢的开源 CLI 工具。它们不花哨,但都是能解决实际问题的利器。 1. Qodo Command Qodo Command 就像是终…

    2026年1月2日
    25100
  • DeepSeek-Math-V2震撼开源:685B巨无霸模型登顶数学推理巅峰,IMO金牌水平+Putnam近乎满分

    刚刚,DeepSeek 开源了最新的数学推理模型 DeepSeek-Math-V2。 这不仅仅是一次普通的模型迭代,根据在国际数学奥林匹克和普特南数学竞赛上的表现来看,这可能是开源模型在数学推理领域的一个里程碑时刻。 数学推理新王登基了。 如果说上一代 DeepSeek-Math 让我们看到了开源模型在数学领域的潜力,那么这一次 V2 版本交出了一份令人咋舌…

    2025年11月28日
    18700
  • 十大AI Agent开发平台深度解析:从AutoGPT到LangChain,构建下一代智能应用

    AutoGPT AutoGPT 是 AI Agent 领域的开创性项目,在 GitHub 上已获得超过 18 万星标。 与传统的聊天机器人不同,AutoGPT 能够自主地将一个宏观目标拆解为一系列子任务,并通过调用互联网搜索、读写本地文件等工具来逐步实现目标。 AutoGPT 具备强大的工具调用与环境交互能力。它能够访问互联网以获取最新信息、管理本地文件、执…

    2025年12月29日
    74100
  • GitHub四大热门开源项目盘点:自适应爬虫、AI上下文工程、远程代码助手与Hugging Face技能包

    01 自适应爬虫:告别网站改版带来的维护噩梦 对于爬虫开发者而言,网站结构更新是常见的痛点,往往导致精心编写的选择器失效,需要耗费大量时间重新调试。Scrapling 项目正是为解决这一问题而生。它是一个自适应的 Python 爬虫库,能够在网站结构变化后,自动重新定位目标元素,显著降低维护成本。 该项目在 GitHub 上已获得 13.7K Star,备受…

    2026年2月27日
    28800