最近想在本地部属个 qwenpaw 用用。设备是 mac m4 64g 。想知道这个能部署哪个本地大模型 不太懂 纯请教
可以看看这个项目 https://github.com/Andyyyy64/whichllm
—————— 下面来自 HelloGitHub 122 期
whichllm:帮你找到本地能跑的最佳大模型。该项目能够自动检测本机 GPU/CPU/RAM 配置,并从 HuggingFace 中筛选出适合当前硬件的大模型。它基于 LiveBench 、Chatbot Arena ELO 等综合评分排名,而非单纯按参数量排序,支持模拟指定 GPU 、查找运行目标模型所需显卡、一键启动对话和生成 Python 代码片段等功能。
whichllm 我测了下不太准,top1 并非最佳选择。它提到的模型权重,你得细看不同量化,还要考虑 kv cache 预留一些空间。
登录后可发帖和回复
可以看看这个项目 https://github.com/Andyyyy64/whichllm
—————— 下面来自 HelloGitHub 122 期
whichllm:帮你找到本地能跑的最佳大模型。该项目能够自动检测本机 GPU/CPU/RAM 配置,并从 HuggingFace 中筛选出适合当前硬件的大模型。它基于 LiveBench 、Chatbot Arena ELO 等综合评分排名,而非单纯按参数量排序,支持模拟指定 GPU 、查找运行目标模型所需显卡、一键启动对话和生成 Python 代码片段等功能。