微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > Python教程 > 正文

使用预训练权重在本地运行法学硕士有哪些选择？

WBOY

发布： 2024-02-22 12:34:09

转载

729人浏览过

使用预训练权重在本地运行法学硕士有哪些选择？

问题内容

我有一个集群，虽然有一种可用的权重存储库，但未连接到互联网。我需要对其运行 LLM 推理。

到目前为止，我发现的唯一选择是使用 transformers 和 langchain 模块的组合，但我不想调整模型的超参数。我遇到了 ollama 软件，但我无法在集群上安装任何东西，除了 python 库之外。所以，我自然想知道，运行 LLM 推理有哪些选择？还有一些问题。

我可以只安装 ollama-python 软件包而不安装他们的 Linux 软件吗？或者我需要两者来运行我的推理吗？
如果我设法在此集群上安装 ollama，如何为模型提供预训练权重？如果有帮助，它们存储在（有时多个）.bin 文件中

正确答案

您实际上不必安装 ollama。相反，您可以直接本地运行 llm，例如 mistral 模型

析稿Ai写作

析稿Ai写作

科研人的高效工具：AI论文自动生成，十分钟万字，无限大纲规划写作思路。

析稿Ai写作

142

析稿Ai写作

llm = gpt4all(
    model="/home/jeff/.cache/huggingface/hub/gpt4all/mistral-7b-openorca.q4_0.gguf",
    device='gpu', n_threads=8,
    callbacks=callbacks, verbose=true)

登录后复制

或者对于 falcon

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

model_id = "tiiuae/falcon-7b-instruct"
tokenizer = AutoTokenizer.from_pretrained(model_id)
pipeline = pipeline(
    "text-generation",
    model=model_id,
    tokenizer=tokenizer,
    torch_dtype=torch.bfloat16,
    # trust_remote_code=True,
    device_map="auto",
    max_new_tokens=100,
    # max_length=200,
)


from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline
llm = HuggingFacePipeline(pipeline=pipeline)

登录后复制

我的笔记本电脑上安装了 16g 内存 nvidia 4090，可以支持上述 2 个型号本地运行。

以上就是使用预训练权重在本地运行法学硕士有哪些选择？的详细内容，更多请关注php中文网其它相关文章！

相关标签：

Python linux langchain

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：stackoverflow网

上一篇：无法使用架构验证 XML，但可以通过从中读取写入的文件来工作下一篇：Django项目初始化：利用命令行工具快速创建一个全新的项目

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

提升效率的夸克浏览器AI搜索_夸克AI搜索高效使用秘籍

2025-10-17 16:12:05
夸克浏览器AI搜索功能详解_几个实用的夸克AI搜索技巧分享

2025-10-17 17:20:02
手机版夸克浏览器AI搜索设置_移动端夸克AI搜索使用全攻略

2025-10-17 23:58:01
夸克浏览器AI搜索深度体验_夸克AI搜索与其他AI的对比

2025-10-18 22:34:01
夸克浏览器AI搜索入口在哪_一文读懂夸克AI搜索如何激活

2025-10-19 09:25:01
夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02:02
夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42:01
玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50:01
夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48:02
夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12:01

最新问题

python检测给定的路径是否存在的方法答案：推荐使用pathlib.Path.exists()检测路径存在。通过os.path.exists()和pathlib.Path.exists()可检查路径是否存在，前者为传统方法，后者自Python3.4起成为官方推荐，语法更清晰且支持is_file()、is_dir()等细粒度判断，建议新项目使用pathlib并注意路径字符串转义问题。

2025-11-21 16:57:06

342

python中如何配置Logging处理器首先使用basicConfig快速配置日志，或手动创建Logger、Handler、Formatter实现灵活控制；通过FileHandler、StreamHandler等设置输出目标与级别，避免重复日志需检查addHandler调用及propagate设置。

2025-11-21 16:39:43

983

Python IDE之Thonny的介绍 Thonny适合初学者：它自带Python解释器，界面简洁，支持变量可视化、单步调试和函数调用栈查看，内置pip管理器，可连接micro:bit，特别适用于零基础学习者和教学场景。

2025-11-21 16:34:03

901

python中如何实现信息增益和信息增益率信息增益和信息增益率用于决策树特征选择，基于信息熵计算。1.信息熵衡量数据混乱程度，公式为H(S)=-Σ(p_ilog2(p_i))，Python用entropy函数实现。2.信息增益IG(S,A)=H(S)-Σ(|S_v|/|S|H(S_v))，表示划分后熵的减少，通过information_gain函数计算特征对标签的分类能力。3.信息增益率GR(S,A)=IG(S,A)/IV(A)，其中IV(A)为特征A的固有值，用于抑制多取值特征偏差，由intrinsic_value函数计算。4.示例中

2025-11-21 16:21:50

254

Python 将字符串写入文件的正确姿势使用withopen()可安全写入字符串，需指定encoding=‘utf-8’防止乱码，选‘w’覆盖、‘a’追加、‘x’防覆盖，多行用writelines()并手动加\n，避免不关文件和路径错误。

2025-11-21 16:16:05

299

python中Fearturetools三个基本概念理解实体、实体集和深度特征合成是使用Featuretools进行自动化特征工程的核心：实体是数据表的抽象，如用户或订单表；实体集是管理多个关联实体及其关系的容器，支持跨表特征生成；深度特征合成通过聚合与变换操作，沿实体间关系路径自动生成高阶特征，如用户平均订单金额或上次登录时间差。正确设置索引、时间戳及实体关系至关重要。

2025-11-21 15:59:43

230

NumPy二维数组的位异或归约：解决浮点数类型错误本文详细阐述了在NumPy中对二维数组进行位异或（XOR）归约操作的方法。针对常见的TypeError，即当数组元素为浮点数时无法直接执行位异或的问题，提供了核心解决方案：在执行归约前，务必将数组元素转换为合适的整数类型。教程将通过示例代码演示从浮点数到整数的转换过程，并成功实现位异或归约，同时强调了类型转换的关键注意事项。

2025-11-21 15:48:18

776

Python多目标优化：智能排座与资源分配策略本文深入探讨如何利用Python解决涉及多方偏好和动态变化的复杂资源分配与排座问题。我们将介绍多目标优化、启发式算法等核心概念，并指导读者如何构建一个系统来自动寻找满足多重条件的理想解决方案。文章将特别提及进化算法如NSGA-II及其在DEAP库中的实现，帮助读者应对实际场景中的挑战，如突发情况下的重新调度。

2025-11-21 15:47:01

230

Pandas中从对象类型列提取数值并进行描述性统计分析本文将指导如何在PandasDataFrame中处理包含数值信息但被错误识别为object数据类型的列。通过详细的迭代处理和字符串解析方法，我们将演示如何从这些混合数据列中准确提取数值、进行单位标准化，并最终计算出正确的描述性统计量，从而为后续的数据分析奠定坚实基础。

2025-11-21 15:44:49

893

NumPy数组形状深度解析：理解维度与创建多维数组本文深入探讨NumPy数组的维度与形状，重点解析一维数组(N,)与二维数组(1,N)之间的关键区别，并通过代码示例演示如何基于输入结构准确创建不同维度的数组。同时，文章还将介绍两种实用的数组形状转换技巧，帮助读者更灵活地处理数据维度。

2025-11-21 15:43:02

821

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部