三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

小红书采集神器

Spider_XHS 是一个在 GitHub 上已获得超过 3000 Star 的小红书数据采集与运营工具。它不仅仅是一个爬虫,更提供了一套完整的小红书全域运营解决方案。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该项目支持多维度数据抓取,可将结果保存为 Excel 表格或直接下载多媒体文件。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

采集用户所有笔记至本地

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
该工具能够自动下载用户的所有笔记,并按统一格式保存到本地文件夹。每个笔记文件夹会自动提取并下载高清无水印图片,同时保存笔记链接、标题、点赞、收藏等数据。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
除了数据采集,它还集成了创作者平台接口,支持笔记的自动化上传,极大提升了运营效率。
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

使用该项目需要基础的 Python 和 Node.js 环境。

第一步:克隆项目与安装依赖

“`bash

下载项目

git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

安装 Python 依赖

pip install -r requirements.txt

安装 Node.js 依赖(用于加密参数生成)

npm install
“`

第二步:配置 Cookie

这是最关键的一步。你需要在项目根目录的 .env 文件中填入你的小红书 Cookie。

  1. 在浏览器中登录小红书网页版。
  2. 按 F12 打开开发者工具,切换到 “Network” (网络) 选项卡。
  3. 刷新页面,点击任意一个请求,在 “Request Headers” 中找到 cookie 字段。
  4. 复制完整的 Cookie 值,粘贴到 .env 文件中。

第三步:运行爬虫

项目入口是 main.py。你可以根据需求修改代码中的调用逻辑,然后直接运行:

bash
python main.py

运行后,控制台会显示采集进度,所有数据和媒体文件将自动保存到指定文件夹。

开源地址:https://github.com/cv-cat/Spider_XHS


PPT Agent

PPTAgent 是中科院计算所开源的项目。它不仅能根据一句话生成 PPT,还能解析长文档(如论文、报告),自动提炼重点并生成幻灯片。

与简单的文本转换工具不同,PPTAgent 采用多智能体 (Multi-Agent) 架构,模拟人类制作 PPT 的完整思考流程。

示例:生成介绍小米 SU7 外观与价格的 PPT

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

生成的 PPT 可适配不同商务或学术风格,并能根据每页内容自动搜索并插入相关图片。

示例:生成高中课堂课件

主题为“解码立法过程:理解其对国际关系的影响”:
三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

PPTAgent 支持上传本地文档,并利用 RAG 技术从中提取关键信息,确保生成内容的准确性与详实性。

该项目直接输出原生的 .pptx 文件,可在 PowerPoint 中直接打开并进行任意修改、拖拽和美化,不存在兼容性问题。

开源地址:https://github.com/icip-cas/PPTAgent


Code2Video

Code2Video 是一个通过编写代码来生成高质量教学视频的开源框架。它不直接生成像素,而是利用 Manim(数学动画引擎)代码来创建视频,确保了视频逻辑严密、清晰度极高,且每一帧都可精准编辑。

三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

简单来说,Code2Video 是一个由 AI 智能体驱动的框架。其灵感来源于使用 Manim 引擎制作科普视频的 3Blue1Brown。Code2Video 相当于一个自动编写 Manim 代码的 AI 助手。

该项目由新加坡国立大学团队开发。以下是其生成效果与 Veo3 等 AI 视频的对比示例:

开源地址:https://github.com/showlab/Code2Video


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/15803

(0)
上一篇 2025年11月30日 下午1:15
下一篇 2025年12月1日 上午7:52

相关推荐

  • 五大AI开源神器:从GLM-4.7编程突破到手机集群推理,重塑开发新范式

    智谱开源 GLM-4.7 智谱 GLM-4.7 正式发布并官宣即将开源。 在 LiveCodeBench 和 Code Arena 等多个权威榜单中,它取得了国产第一、开源第一的成绩。其综合编程能力已直逼甚至在某些维度超越了 Claude 4.5 Sonnet。 近期,智谱已向港交所递交招股书,冲击全球大模型第一股。这表明国产大模型在编程这一核心赛道上,已具…

    2025年12月24日
    17700
  • Superpowers:为Claude Code注入资深工程师思维,终结AI编程的“瞎写”时代

    你是否曾在用AI写代码时,经历过这样的崩溃时刻? 满怀期待地向AI提出需求,它确实反应迅速,顷刻间生成大段代码。然而,一旦运行,却是满屏报错,业务逻辑也常常残缺不全。更令人无奈的是,它今天写的代码,可能明天自己都无法理解。 究其根源,当前多数AI编程工具的症结在于“过于顺从”。它们缺乏停顿与思考,只是机械地堆砌代码片段。 有趣的是,今天GitHub Tren…

    2026年1月15日
    6600
  • 五大前沿AI开源项目盘点:从PPT生成到金融强化学习,赋能未来工作流

    Nano Banana PPT Banana-slides 是基于 Nano Banana Pro 模型开源的 AI PPT 生成应用,旨在解决传统 AI PPT 工具模板僵化、设计感差和素材质量低的问题。 一句话生成 PPT:用户只需输入一个简单的想法,即可快速获得完整的大纲、页面描述以及最终的 PPT 文稿。 该工具支持上传参考风格图片或示例 PPT 模…

    2025年12月11日
    12300
  • GitHub三大AI信息聚合利器:告别信息碎片化,智能聚合全网优质内容

    GitHub三大AI信息聚合利器:告别信息碎片化,智能聚合全网优质内容 在信息爆炸的时代,优质内容往往散落在X、播客、博客、视频等多个平台。手动追踪不仅耗时,还容易遗漏。借助GitHub上基于AI的开源工具,我们可以实现信息的智能聚合与高效筛选,将碎片化信息整合为结构化、高价值的内容流。 01 AI 内容聚合平台 BestBlogs 是一个能够聚合X、小宇宙…

    2025年11月10日
    7300
  • Kimi K2 Thinking开源引爆AI界:超越GPT-5的300步工具调用模型实战指南

    Kimi 最近开源了其思考模型:Kimi K2 Thinking。根据官方介绍,该模型具备“边思考,边使用工具”的能力,能够自主执行高达 300 步的工具调用流程,以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中,其表现超越了 GPT-5,达到了当前的最先进水平。 若想在 Kimi 官网体验此能力,可直接在 kimi.com 开启“长思考…

    2025年11月17日
    6300