详细内容或原文请订阅后点击阅览
Vibe-SysAdmining:当天的笑声
其中前沿 LLM 模型告诉我配置一个新的聊天机器人以使用模型“/anthropic/claude-sonint-4-6”;是的,这仅意味着训练数据中的某个地方有一些可怜的 SOB 输错了......
来源:Brad DeLong其中前沿 LLM 模型告诉我配置一个新的聊天机器人以使用模型“/anthropic/claude-sonint-4-6”;是的,这仅意味着在训练数据中的某个地方,一些可怜的 SOB 将“sonint”错误地输入为“sonnet”;但是,即使是任何可以称为“agi”的东西的火花,也不会在温度=0.1时让这个打字错误通过,不是吗?
我不是一个足够优秀的程序员,无法成功地对任何东西进行振动编码,除了抓取、索引、总结和归档脚本之外。我可能擅长的是成功地对餐厅边桌下的机器进行振动系统管理。为什么?因为这台机器是免费的,而且在我看来,考虑到可能的数据中心成本,即使机器是新的且昂贵,它也会在一年内收回成本。省点钱。看看公司会通过出售数据中心的服务发财的想法是否是徒劳的,用户的明显路径是否真的是用开源模型以及现有程序员和系统管理员的时间来点亮自己的黑硅。
到目前为止,我猜进展顺利?:
分享
团体订阅可享受 75% 的折扣
当前已加载并准备三个模型:
alibaba/ollama/qwen3:32b-q4-128k:28GB Qwen3-32B 模型量化为 q4,最大上下文长度为 128k 个标记,并且打开“推理”。
google/gemma4:26b-a4b-it-q4_K_M:23GB Gemma4-26B 模型,量化为 q4_K_M,最大上下文长度为 256k 个标记。
alibaba/ollama/qwen3:8b:8.8 GB Qwen3-8B 模型,也量化为 q4_K_M,最大上下文长度为 40k 个标记。
希望是:
其中第三个将是轻量、快速的调用工具并运行抓取、归档、索引、总结、模拟和计算 python 任务;
第二个将是主力;和
第一个将在非结构化数据库上进行更繁重的工作——主要是大量文本文档和文本文档集合,加上它自己的代码和安装。
/model claude-sonint-4-6 --provider anthropic
