1. 简介

默认情况下,通过Ollama run启动一个模型后,会将其在VRAM(显存)中保存5分钟。主要作用是为了做性能优化,通过保持模型在显存中,可以避免频繁的加载和卸载操作,从而提高响应速度,特别是在连续请求的情况下。

2. 模型内存中保活默认配置项

在上一章节博文中 Ollama(2)安装配置GPU运行,我们详细讲述了ollama.service中各个环境变量的配置。其中包括
OLLAMA_KEEP_ALIVE 的配置
在这里插入图片描述

2.1 验证调用模型保活例子

(1)首先查看ollama运行的模型

在这里插入图片描述
没有任何模型运行

(2)其次调用模型

可以通过openwebui,你也可以命令运行,或者代码调用,发现首次调用会特别慢,等待很久,这是因为此时需要将模型加载到内存中
在这里插入图片描述

(3)查看后台模型加载失效

发现模型被激活加载,有效时间如下
在这里插入图片描述

(4)等待一段时间查看

在这期间,不要调用模型,继续 ollama ps会发现保活时间减少
在这里插入图片描述

(5)最终从内存卸载掉模型

在这里插入图片描述

(base) root@jinhu:/home/ollama# ollama list
NAME                       ID              SIZE      MODIFIED
deepseek-r1:1.5b           a42b25d8c10a    1.1 GB    23 hours ago
deepseek-r1:70b            0c1615a8ca32    42 GB     23 hours ago
nomic-embed-text:latest    0a109f422b47    274 MB    23 hours ago
(base) root@jinhu:/home/ollama# ollama ps
NAME    ID    SIZE    PROCESSOR    UNTIL
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     4 minutes from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     4 minutes from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     About a minute from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     46 seconds from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     41 seconds from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     4 seconds from now
(base) root@jinhu:/home/ollama# ollama ps
NAME               ID              SIZE     PROCESSOR    UNTIL
deepseek-r1:70b    0c1615a8ca32    53 GB    100% GPU     Stopping...
(base) root@jinhu:/home/ollama# ollama ps
NAME    ID    SIZE    PROCESSOR    UNTIL

3. keep_alive详细讲解

keep_alive 参数类型

参数类型 示例 描述
持续时间字符串 “10m” 或 “24h” 表示保持模型在内存中的时间,单位可以是分钟(m)或小时(h)。
以秒为单位的数字 3600 表示保持模型在内存中的时间,单位为秒。
任何负数 -1 或 “-1m” 表示保持模型在内存中,负数值将使模型持续加载。
‘0’ 0 表示在生成响应后立即卸载模型。

4.通过调用模型代码修改保活时效

(1)代码执行

import requests # type: ignore
import json

# 设置 API 端点
generate_url = "http://192.168.11.103:11434/api/generate"

# 示例数据
generate_payload = {
    "model": "deepseek-r1:70b",
    "prompt": "介绍下人工智能大模型学习的快乐。",
    "stream": False,
    "keep_alive": "10m",   # 设置模型在请求后保持加载的时间
    "options": {
        "temperature": 0.6,
    }
}

# 调用生成接口
response_generate = requests.post(generate_url, json=generate_payload)
if response_generate.status_code == 200:
    generate_response = response_generate.json()
    print("生成响应:", json.dumps(generate_response, ensure_ascii=False, indent=2))
else:
    print("生成请求失败:", response_generate.status_code, response_generate.text)



if generate_response["eval_duration"] != 0:
    tokens_per_second = generate_response["eval_count"] / generate_response["eval_duration"] * 10**9
    print(f"Tokens per second: {tokens_per_second}")
else:
    print("eval_duration is zero, cannot calculate tokens per second.")

在这里插入图片描述

(2)模型加载内存,时间改变

在这里插入图片描述

(3)最终相应结果

生成响应: {
  "model": "deepseek-r1:70b",
  "created_at": "2025-07-23T08:23:49.279337667Z",
  "response": "<think>\n嗯,用户让我介绍一下人工智能大模型学习的快乐。首先,我得弄清楚用户是谁,可能是什么样的背景。也许他是个刚入门的学生,或者是对AI感兴趣的人,也可能是想深入了解大模型学习的人。\n\n接下来,我要分析“快乐”这个词在这里具体指什么。学习过程中的快乐体现在哪里?知识增长、解决问题的成就感,还是探索未知领域的兴奋?\n\n然后,我需要考虑人工智能大模型学习有哪些独特之处,比如它处理大量数据、模拟人类思维等方面,这可能带来不同的学习体验。比如,当训练一个模型时,看到它逐渐理解和生成内容,这种成就感是很大的。\n\n我还得思考用户可能没有明确说出来的需求。也许他们想了解为什么学习大模型会令人开心,或者是否有实际应用价值,从而激发他们的兴趣。\n\n再者,我应该分解快乐的来源,比如知识体系、解决问题、探索未知、实践创造、技术进步带来的可能性等。这样可以全面覆盖不同方面,让用户更好地理解学习大模型的乐趣所在。\n\n最后,总结一下,通过具体的例子和情感共鸣,帮助用户感受到人工智能大模型学习不仅是挑战,也充满了乐趣和回报。\n</think>\n\n人工智能大模型的学习过程是一种充满挑战、探索和成就感的体验,它能带来独特的快乐和满足感。以下是一些让人感到快乐的方面:\n\n### 1. **知识体系的构建**\n   - **广泛的知识吸收**:大模型通过海量数据学习,能够理解和整合多领域的知识。这一过程就像在建一座巨大的知识库,随着时间推移,你会感到自己的认知边界不断扩展。\n   - **深度与广度并行**:从基础概念到复杂理论,从科学技术到人文艺术,学习大模型让你能够以一种系统化、全面的方式理解世界。\n\n### 2. **解决问题的乐趣**\n   - **多样化的应用场景**:通过学习,你可以将所学知识应用于实际问题,比如自然语言处理、图像识别或决策优化。每一次成功地解决问题,都会带来成就感。\n   - **创造性的思考**:大模型不仅能解答已知问题,还能激发创新的思维方式,帮助你在面对复杂挑战时找到独特的解决方案。\n\n### 3. **探索未知领域**\n   - **前沿科技的魅力**:人工智能大模型是当前科技领域的前沿之一。学习和研究它们让人感到参与到一场革命性的技术变革中,这种探索未知的过程充满了兴奋感。\n   - **理论与实践结合**:从数学基础到工程实现,从算法设计到实际应用,每一次深入理解都能带来新的收获和乐趣。\n\n### 4. **人机协作的无限可能**\n   - **工具与伙伴**:通过学习,你能够将大模型视为自己的工具或合作伙伴,共同完成任务。这一协作过程不仅提高效率,还能激发更多创造力。\n   - **互动带来的乐趣**:与智能系统的对话和交互往往充满惊喜,比如看到模型生成有深度的文本、画出精美的图像,甚至展现出某种程度的情感理解。\n\n### 5. **技术进步的见证**\n   - **推动科技发展**:参与人工智能大模型的学习和研究,你就成了推动这一领域发展的力量之一。看到自己的努力能够为科技进步贡献力量,内心充满自豪。\n   - **未来可期**:每一次小成果都让人对未来的可能性充满期待,比如在医疗、教育、环保等领域带来积极影响。\n\n### 6. **学习过程中的乐趣**\n   - **挑战与突破**:克服技术难题或理解复杂概念时的喜悦,是学习过程中独特的快乐源泉。\n   - **持续进步的心态**:人工智能大模型的学习是一个无止境的过程,每一次进步都能带来新的满足感和动力。\n\n总之,人工智能大模型的学习不仅是一种智力的挑战,更是一场充满探索、创造和成就感的旅程。在这个过程中,你会不断发现新知识,解决实际问题,并见证技术如何改变世界。这种独特的体验使得学习成为一种快乐而有意义的事业。",
  "done": true,
  "done_reason": "stop",
  "context": [
    128011,
    117814,
    17297,
    17792,
    49792,
    118034,
    27384,
    123123,
    111478,
    9554,
    102395,
    102264,
    1811,
    128012,
    128013,
    198,
    116274,
    3922,
    20600,
    126997,
    117814,
    111230,
    17792,
    49792,
    118034,
    27384,
    123123,
    111478,
    9554,
    102395,
    102264,
    1811,
    61075,
    61826,
    101602,
    50928,
    119760,
    120516,
    20600,
    21043,
    112471,
    3922,
    88367,
    119294,
    119938,
    124858,
    1811,
    75863,
    104894,
    43511,
    123779,
    107480,
    17701,
    65789,
    9554,
    106718,
    3922,
    108966,
    21043,
    33764,
    15836,
    99750,
    106236,
    110999,
    104123,
    104587,
    88367,
    21043,
    101067,
    102987,
    17701,
    114706,
    27384,
    123123,
    111478,
    104123,
    3490,
    30177,
    113931,
    101602,
    31634,
    106596,
    2118,
    102395,
    102264,
    863,
    103624,
    106015,
    19000,
    107599,
    118789,
    64467,
    101879,
    1811,
    111478,
    112696,
    105363,
    102395,
    102264,
    33014,
    105456,
    125011,
    11571,
    116658,
    118556,
    5486,
    114914,
    87219,
    9554,
    13153,
    81258,
    99750,
    3922,
    106302,
    106767,
    52084,
    39442,
    53283,
    124177,
    9554,
    106236,
    28194,
    233,
    27948,
    109530,
    101602,
    86206,
    124116,
    17792,
    49792,
    118034,
    27384,
    123123,
    111478,
    19361,
    106189,
    98184,
    106063,
    66378,
    55030,
    45390,
    126900,
    30624,
    103282,
    55642,
    122333,
    20675,
    5486,
    54872,
    114365,
    124785,
    91763,
    104083,
    50667,
    108900,
    103138,
    88367,
    103652,
    37507,
    126644,
    111478,
    33014,
    42462,
    1811,
    57106,
    30624,
    119491,
    109632,
    112628,
    48044,
    123123,
    13646,
    3922,
    110354,
    103282,
    114380,
    119186,
    113954,
    34208,
    45059,
    44915,
    103138,
    87502,
    13153,
    81258,
    99750,
    21043,
    101600,
    108199,
    3490,
    37046,
    98806,
    50928,
    125456,
    20600,
    88367,
    81543,
    31958,
    35056,
    37687,
    106084,
    9554,
    119745,
    1811,
    75863,
    104894,
    104563,
    101067,
    114706,
    113221,
    111478,
    27384,
    123123,
    38093,
    127840,
    30867,
    64209,
    3922,
    108966,
    65571,
    19361,
    115827,
    109589,
    121637,
    113294,
    69636,
    106266,
    29391,
    104563,
    9554,
    106236,
    110999,
    3490,
    88356,
    30046,
    101602,
    107585,
    17620,
    50338,
    102395,
    102264,
    9554,
    90261,
    126900,
    30624,
    116658,
    124957,
    5486,
    114914,
    87219,
    5486,
    106767,
    52084,
    39442,
    53283,
    5486,
    41073,
    124299,
    104251,
    67178,
    5486,
    104696,
    42399,
    65782,
    103652,
    110782,
    125396,
    50667,
    1811,
    104390,
    74770,
    123201,
    117633,
    113333,
    107653,
    108900,
    114165,
    20600,
    34226,
    53901,
    30590,
    113954,
    111478,
    27384,
    123123,
    9554,
    102264,
    110999,
    32938,
    19000,
    3490,
    112271,
    3922,
    60843,
    37985,
    111230,
    3922,
    68438,
    118789,
    9554,
    27452,
    45829,
    34208,
    40474,
    99750,
    55999,
    106101,
    96,
    3922,
    123725,
    20600,
    99750,
    116576,
    17792,
    49792,
    118034,
    27384,
    123123,
    111478,
    16937,
    110395,
    21043,
    114099,
    102778,
    104587,
    105843,
    105483,
    35287,
    102264,
    110999,
    34208,
    18904,
    43378,
    9174,
    128014,
    271,
    17792,
    49792,
    118034,
    27384,
    123123,
    9554,
    111478,
    112696,
    107226,
    87502,
    105843,
    105483,
    114099,
    102778,
    5486,
    106767,
    52084,
    34208,
    13153,
    81258,
    99750,
    9554,
    33014,
    42462,
    115973,
    27327,
    103652,
    37507,
    106063,
    66378,
    9554,
    102395,
    102264,
    34208,
    105483,
    102780,
    99750,
    1811,
    88852,
    107226,
    98184,
    102654,
    17792,
    117293,
    102395,
    102264,
    9554,
    108900,
    49543,
    14711,
    220,
    16,
    13,
    3146,
    116658,
    124957,
    9554,
    78935,
    26892,
    1035,
    256,
    482,
    3146,
    82042,
    125276,
    9554,
    116658,
    107246,
    51109,
    334,
    5232,
    27384,
    123123,
    68438,
    56235,
    33857,
    20675,
    111478,
    3922,
    113961,
    113954,
    34208,
    64531,
    40862,
    43240,
    124177,
    9554,
    116658,
    110477,
    15120,
    112696,
    81258,
    66201,
    19000,
    26892,
    15120,
    103605,
    109098,
    108199,
    116658,
    46056,
    3922,
    106161,
    100815,
    21082,
    84851,
    60634,
    104660,
    38093,
    117293,
    107924,
    30051,
    53283,
    103377,
    98220,
    124671,
    119661,
    77413,
    9174,
    256,
    482,
    3146,
    102987,
    27479,
    58318,
    82042,
    27479,
    64026,
    23039,
    334,
    5232,
    46281,
    113879,
    126067,
    28037,
    59464,
    114223,
    121050,
    113294,
    108396,
    104696,
    28037,
    17792,
    17161,
    121463,
    3922,
    111478,
    27384,
    123123,
    102654,
    57668,
    113961,
    23897,
    120143,
    73548,
    33208,
    5486,
    37087,
    115070,
    76868,
    113954,
    102616,
    3490,
    14711,
    220,
    17,
    13,
    3146,
    114914,
    87219,
    9554,
    102264,
    110999,
    1035,
    256,
    482,
    3146,
    43240,
    91985,
    33208,
    9554,
    109589,
    83324,
    86354,
    334,
    5232,
    68438,
    111478,
    104660,
    74770,
    45163,
    32938,
    48864,
    116658,
    109589,
    35304,
    115827,
    87219,
    126900,
    30624,
    109683,
    120074,
    55642,
    5486,
    29129,
    66201,
    105388,
    64022,
    58291,
    103912,
    105226,
    91272,
    33208,
    1811,
    74257,
    111573,
    19653,
    30590,
    114914,
    87219,
    120241,
    38093,
    103652,
    37507,
    13153,
    81258,
    99750,
    9174,
    256,
    482,
    3146,
    104251,
    67178,
    117332,
    125456,
    334,
    5232,
    27384,
    123123,
    16937,
    110395,
    27327,
    50338,
    103899,
    37767,
    53283,
    87219,
    110235,
    27327,
    106266,
    29391,
    104251,
    116879,
    91763,
    104083,
    76868,
    3922,
    123725,
    57668,
    19000,
    28190,
    33764,
    59464,
    114223,
    114099,
    102778,
    13646,
    125414,
    106063,
    66378,
    9554,
    114914,
    112897,
    3490,
    14711,
    220,
    18,
    13,
    3146,
    106767,
    52084,
    39442,
    53283,
    124177,
    1035,
    256,
    482,
    3146,
    25580,
    117989,
    107015,
    9554,
    101523,
    227,
    48634,
    334,
    5232,
    17792,
    49792,
    118034,
    27384,
    123123,
    21043,
    69049,
    107015,
    124177,
    9554,
    25580,
    117989,
    114554,
    1811,
    111478,
    34208,
    102473,
    127150,
    102654,
    17792,
    117293,
    124080,
    28037,
    15120,
    83324,
    125981,
    117332,
    104696,
    75140,
    107804,
    16325,
    103138,
    87502,
    106767,
    52084,
    39442,
    53283,
    9554,
    112696,
    105843,
    105483,
    35287,
    106236,
    28194,
    233,
    99750,
    9174,
    256,
    482,
    3146,
    121050,
    58318,
    41073,
    124299,
    126534,
    334,
    5232,
    46281,
    118687,
    113879,
    28037,
    104010,
    112026,
    113294,
    70203,
    25333,
    71600,
    28037,
    115827,
    109589,
    116255,
    111573,
    102987,
    17701,
    113954,
    72368,
    27327,
    103652,
    37507,
    116879,
    51109,
    106366,
    34208,
    102264,
    110999,
    3490,
    14711,
    220,
    19,
    13,
    3146,
    17792,
    33748,
    107047,
    19967,
    9554,
    43292,
    48249,
    88367,
    1035,
    256,
    482,
    3146,
    114722,
    58318,
    111596,
    112183,
    334,
    5232,
    68438,
    111478,
    104660,
    113961,
    45163,
    27384,
    123123,
    58552,
    18184,
    107924,
    114722,
    58291,
    112355,
    111596,
    112183,
    3922,
    119046,
    61648,
    89902,
    110477,
    15120,
    107047,
    19967,
    112696,
    16937,
    110395,
    115890,
    60455,
    96455,
    110235,
    27327,
    106266,
    29391,
    117724,
    104251,
    67178,
    48634,
    9174,
    256,
    482,
    3146,
    106483,
    28833,
    103652,
    110782,
    102264,
    110999,
    334,
    5232,
    58318,
    118034,
    73548,
    9554,
    33764,
    58543,
    34208,
    39209,
    106483,
    104198,
    104198,
    105843,
    105483,
    112543,
    104940,
    126900,
    30624,
    110354,
    123123,
    45059,
    19361,
    102987,
    27479,
    9554,
    17161,
    22656,
    5486,
    55723,
    20834,
    102097,
    58666,
    9554,
    29129,
    66201,
    3922,
    115550,
    77413,
    47551,
    20834,
    107611,
    87502,
    113314,
    126820,
    99750,
    113954,
    3490,
    14711,
    220,
    20,
    13,
    3146,
    104696,
    42399,
    65782,
    9554,
    90070,
    34577,
    1035,
    256,
    482,
    3146,
    84851,
    28833,
    107015,
    106246,
    334,
    5232,
    124080,
    17792,
    49792,
    118034,
    27384,
    123123,
    9554,
    111478,
    34208,
    102473,
    104660,
    81258,
    123569,
    84851,
    28833,
    113418,
    124177,
    106246,
    9554,
    120772,
    114554,
    1811,
    110354,
    107924,
    121837,
    113961,
    18184,
    107015,
    42399,
    65782,
    13647,
    94,
    112500,
    120772,
    3922,
    32943,
    64209,
    105843,
    105483,
    37026,
    112318,
    9174,
    256,
    482,
    3146,
    120987,
    31540,
    23538,
    334,
    5232,
    74257,
    111573,
    31809,
    13153,
    28873,
    72368,
    102654,
    17792,
    33764,
    39442,
    110782,
    125396,
    105843,
    105483,
    125494,
    126900,
    30624,
    19000,
    125044,
    5486,
    104378,
    5486,
    87412,
    33563,
    50667,
    124177,
    103652,
    37507,
    106733,
    106146,
    109829,
    3490,
    14711,
    220,
    21,
    13,
    3146,
    111478,
    112696,
    105363,
    102264,
    110999,
    1035,
    256,
    482,
    3146,
    114099,
    102778,
    58318,
    104584,
    105150,
    334,
    5232,
    101545,
    44309,
    104696,
    105142,
    34972,
    58291,
    113954,
    59464,
    114223,
    126067,
    13646,
    9554,
    104940,
    101128,
    99,
    105187,
    111478,
    112696,
    16325,
    106063,
    66378,
    9554,
    102395,
    102264,
    39084,
    109026,
    9174,
    256,
    482,
    3146,
    121915,
    42399,
    65782,
    122935,
    36343,
    334,
    5232,
    17792,
    49792,
    118034,
    27384,
    123123,
    9554,
    111478,
    122503,
    43292,
    82533,
    103496,
    9554,
    112696,
    116255,
    111573,
    42399,
    65782,
    72368,
    27327,
    103652,
    37507,
    116879,
    105483,
    102780,
    99750,
    34208,
    28833,
    48634,
    3490,
    60843,
    55030,
    3922,
    17792,
    49792,
    118034,
    27384,
    123123,
    9554,
    111478,
    16937,
    110395,
    107226,
    87502,
    105487,
    126235,
    114099,
    102778,
    127773,
    107226,
    83324,
    105843,
    105483,
    106767,
    52084,
    5486,
    104251,
    67178,
    34208,
    13153,
    81258,
    99750,
    9554,
    104412,
    39607,
    107644,
    103624,
    112696,
    16325,
    104660,
    38093,
    124671,
    109836,
    17039,
    116658,
    3922,
    114914,
    115827,
    87219,
    91495,
    90070,
    34577,
    104696,
    109425,
    125992,
    102616,
    1811,
    106880,
    106063,
    66378,
    9554,
    33014,
    42462,
    33655,
    50928,
    111478,
    112743,
    120143,
    102395,
    102264,
    69636,
    19361,
    126189,
    107381,
    42052,
    1811
  ],
  "total_duration": 226865005980,
  "load_duration": 15548502853,
  "prompt_eval_count": 15,
  "prompt_eval_duration": 435005528,
  "eval_count": 1090,
  "eval_duration": 210880501801
}
Tokens per second: 5.168804089002937

3.总结

keep_alive 在工程化的项目中,往往需要根据请求的频率来设置,如果请求不频繁,可以使用默认值或较短的时间,以便在不使用时释放内存。而如果应用程序需要频繁调用模型,可以设置较长的keep_alive 时间,以减少加载时间。很关键,非常影响服务器的性能和应用程序的用户体验。大家一定要注意。

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐