三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

小红书采集神器

Spider_XHS 是一个在 GitHub 上已获得超过 3000 Star 的小红书数据采集与运营工具。它不仅仅是一个爬虫,更提供了一套完整的小红书全域运营解决方案。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该项目支持多维度数据抓取,可将结果保存为 Excel 表格或直接下载多媒体文件。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

采集用户所有笔记至本地

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该工具能够自动下载用户的所有笔记,并按统一格式保存到本地文件夹。每个笔记文件夹会自动提取并下载高清无水印图片,同时保存笔记链接、标题、点赞、收藏等数据。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
除了数据采集,它还集成了创作者平台接口,支持笔记的自动化上传,极大提升了运营效率。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

使用该项目需要基础的 Python 和 Node.js 环境。

第一步:克隆项目与安装依赖

“`bash

下载项目

git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

安装 Python 依赖

pip install -r requirements.txt

安装 Node.js 依赖(用于加密参数生成)

npm install
“`

第二步:配置 Cookie

这是最关键的一步。你需要在项目根目录的 .env 文件中填入你的小红书 Cookie。

  1. 在浏览器中登录小红书网页版。
  2. 按 F12 打开开发者工具,切换到 “Network” (网络) 选项卡。
  3. 刷新页面,点击任意一个请求,在 “Request Headers” 中找到 cookie 字段。
  4. 复制完整的 Cookie 值,粘贴到 .env 文件中。

第三步:运行爬虫

项目入口是 main.py。你可以根据需求修改代码中的调用逻辑,然后直接运行:

bash
python main.py

运行后,控制台会显示采集进度,所有数据和媒体文件将自动保存到指定文件夹。

开源地址:https://github.com/cv-cat/Spider_XHS


PPT Agent

PPTAgent 是中科院计算所开源的项目。它不仅能根据一句话生成 PPT,还能解析长文档(如论文、报告),自动提炼重点并生成幻灯片。

与简单的文本转换工具不同,PPTAgent 采用多智能体 (Multi-Agent) 架构,模拟人类制作 PPT 的完整思考流程。

示例:生成介绍小米 SU7 外观与价格的 PPT

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

生成的 PPT 可适配不同商务或学术风格,并能根据每页内容自动搜索并插入相关图片。

示例:生成高中课堂课件

主题为“解码立法过程:理解其对国际关系的影响”:
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

PPTAgent 支持上传本地文档,并利用 RAG 技术从中提取关键信息,确保生成内容的准确性与详实性。

该项目直接输出原生的 .pptx 文件,可在 PowerPoint 中直接打开并进行任意修改、拖拽和美化,不存在兼容性问题。

开源地址:https://github.com/icip-cas/PPTAgent


Code2Video

Code2Video 是一个通过编写代码来生成高质量教学视频的开源框架。它不直接生成像素,而是利用 Manim(数学动画引擎)代码来创建视频,确保了视频逻辑严密、清晰度极高,且每一帧都可精准编辑。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

简单来说,Code2Video 是一个由 AI 智能体驱动的框架。其灵感来源于使用 Manim 引擎制作科普视频的 3Blue1Brown。Code2Video 相当于一个自动编写 Manim 代码的 AI 助手。

该项目由新加坡国立大学团队开发。以下是其生成效果与 Veo3 等 AI 视频的对比示例:

开源地址:https://github.com/showlab/Code2Video


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/15803

(0)
上一篇 2025年11月30日 下午1:15
下一篇 2025年12月1日 上午7:52

相关推荐

  • Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

    Karpathy开源autoresearch:630行代码实现AI自主科研进化 AI领域知名研究者Karpathy近日开源新项目 autoresearch,这是一个能够自主进化的AI科研循环系统。其核心目标是让智能体完全自主地进行科研探索:用户只需在Markdown文档中设定研究指令,后续的代码修改、实验运行、结果评估与决策优化等流程将全部由AI自动完成。 …

    2026年3月9日
    93700
  • 五大前沿AI开源项目盘点:从PPT生成到金融强化学习,赋能未来工作流

    Nano Banana PPT Banana-slides 是基于 Nano Banana Pro 模型开源的 AI PPT 生成应用,旨在解决传统 AI PPT 工具模板僵化、设计感差和素材质量低的问题。 一句话生成 PPT:用户只需输入一个简单的想法,即可快速获得完整的大纲、页面描述以及最终的 PPT 文稿。 该工具支持上传参考风格图片或示例 PPT 模…

    2025年12月11日
    61800
  • 2026年重塑工作流自动化:n8n的15大开源AI应用场景解析

    如果你还在手动在应用之间复制数据、为每个集成编写自定义脚本,或为 Zapier 支付高昂费用——你将很快明白为什么有超过 7,264+ 个 workflow 模板 和 55,000+ 名社区成员 选择用 n8n 来搭建他们的自动化流程。 n8n(读作“n-eight-n”)不只是另一个自动化工具。它是一个开源、可自托管的 workflow 平台,在无代码的易…

    2026年1月9日
    2.4K00
  • 本周GitHub热门精选:腾讯AI知识库、智能流程图生成器与AI编程新标准

    腾讯开源的知识库 该项目是腾讯微信团队开源的一款基于AI大模型的文档深度理解与语义检索框架,目前在GitHub上已获得8.4K星标。 它并非一个简单的RAG工具,而是一个企业级、模块化的全流程解决方案,旨在解决复杂异构文档的知识提取与精确问答难题。 WeKnora能够将PDF、Word、图片等内容转化为高质量的智能知识库。它尤其擅长处理复杂的图文混排文档,不…

    2025年12月13日
    1.0K00
  • Caveman开源项目:让Claude模仿原始人说话,节省65% token的AI省钱方案

    Caveman 是一个近期在开发者社区引发关注的开源项目。其核心思路颇具巧思:通过让 Claude 模型模仿原始人说话的方式,强制其输出高度精简的内容,从而显著降低 token 消耗。 项目实测可节省约 65% 的输出 token,同时保持技术信息的准确率不受影响。 项目简介 Caveman 是 Claude Code 的一个 Skill 插件,由开发者 J…

    2026年4月14日
    79000