大模型

GitHub 大模型

Ollama是一个开源的项目，设计用于简化大模型（LLM）的部署和使用流程。它允许用户下载并本地运行像 Llama 3、Code Llama、Gemma、Mistral 等大模型，并支持自定义和创建自己的大模型。 Ollama支持 macOS 、Linux 操作系统和 Windows preview。此外 Ollama还提供了官方的 Docker 镜像，使得使用 Docker 容器部署大模型变得更加简单。Ollama 支持 GPU 加速，并提供了简单的命令行界面（CLI）以及用于与应用程序交互的 RES

开源 AI、大模型和许可证

AI 大模型

在前不久举行的 FOSDEM 2024 会议上，有多场演讲探讨了开源 AI、许可证中的伦理限制和开源数据集。训练大模型需要投入大量的算力和资金，企业如 OpenAI 既没有公开模型也没有发布数据集，但这没有阻止各类企业和组织发布开源大模型，这些开源模型使用了不同的许可证，有着不同的限制。以 Meta 的 Llama 2 大模型为例，它禁止将大模型用于暴力或恐怖活动，以及“任何其他犯罪活动”。欧洲自由软件基金会（FSFE）的项目经理 Niharika Singhal 认为，为了维护 AI 的“开放性”，A

大模型是如何工作的至今仍然是个迷

大模型 AI

两年前，总部位于旧金山的OpenAI公司的研究人员尤里·布尔达（Yuri Burda）和哈里·爱德华兹（Harri Edwards）试图找出如何才能让语言模型进行基本的算术运算。他们想知道模型需要看到多少个将两个数字相加的示例，然后才能将他们给出的任何两个数字相加。起初，事情进展得不太顺利。模型记住了他们看到的总和，但未能解决新的总和。出乎意料的是，布尔达和爱德华兹让他们的一些实验运行的时间比他们想要的要长得多——几天而不是几小时。这些模型一遍又一遍地向模型显示示例总和，远远超过了研究人员本来会称之为

最接近GPT-4的国产大模型诞生了

AI OpenAI 大模型

2024 年，国产大模型的第一个重磅消息，来自智谱 AI。在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上，智谱 AI 正式发布新一代基座大模型「GLM-4」。经历了三个月的技术迭代，GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升，直接逼近 GPT-4。一方面，GLM-4 支持更长的上下文、更强的多模态能力；另一方面，GLM-4 支持更快的推理、更多并发，大大降低了推理成本。同时，GLM-4 也增强了智能体能力，智谱 AI 正

应用开发者的疑问：大模型是真正的银弹吗？

ChatGPT 大模型

应用开发者的疑问：大模型是真正的银弹吗？ ▶ 被当成银弹的大模型 ChatGPT 火了之后，大模型似乎被当成了真正的银弹，所有的体验问题都想通过大模型解决：能不能和大模型对话订机票？自然语言生成 SQL，简化报表分析工作？大模型帮老年人操作软件？能不能用于识别敏感信息？ ...... 似乎大模型成了自然语言工程领域的真正银弹。但是我依稀记得《人月神话》作者 Fred Brooks 所说的 “软件工程没有银弹”；以及华尔街投资大师们说的 “当所有人都在谈论一件事情的时候，说明这件事情已经出现了