关闭广告

随着数据主权和计算能力成为企业采用人工智能的战略因素,对私有本地人工智能基础设施的需求日益增长。为了应对这一趋势,计算、网络和存储解决方案领域的领先创新者 QNAP® Systems, Inc. 今日推出了…… QAI-h1290FX,一款新一代边缘 AI 存储服务器,旨在支持大规模语言模型 (LLM)、检索增强生成 (RAG) 引擎和生成式 AI 应用的私有部署。

QAI-h1290FX 基于 AMD EPYC™ 服务器处理器,支持 NVIDIA® RTX™ GPU 加速,并提供 12 个 U.2 NVMe/SATA SSD 插槽,为需要低延迟推理、全面数据保护和运营控制的组织提供高性能的本地 AI 基础架构,而无需依赖外部资源。 cloudu.

动力 QuTS hero 操作系统基于 ZFS。 QNAP 的 QAI-h1290FX 提供企业级数据完整性、近乎无限的快照和在线重复数据删除功能。它支持通过 Container Station 在容器中原生访问 GPU,并通过 Virtualization Station 为虚拟机提供 GPU 直通。IT 团队、开发人员和研究团队可以高效运行推理模型、生成式 AI 应用和 RAG 流水线(数据流),并完全掌控性能和资源分配。

QAI-h1290FX 预装了一系列精心挑选的 AI 工具,例如 AnythingLLM、OpenWebUI 和 Ollama,可快速部署私有 LLM 工作流程。此外,Stable Diffusion、ComfyUI、n8n 和 vLLM 等其他 AI 应用也将逐步集成,以扩展其功能。这使得用户能够在安全、可扩展且完全可控的环境中快速构建本地 AI 平台并实现工作流程自动化。

QNAP 产品经理 Oliver Lam 表示:“QAI-h1290FX 满足了日益增长的本地 AI 基础设施需求。我们希望消除构建 GPU 工作站、安装工具和配置复杂环境的障碍。借助 QAI-h1290FX,用户可以开箱即用地部署和运行 AI 模型,完全掌控数据,且无需依赖任何外部资源。” cloud在。”

QAI-h1290FX 的主要特点

  • 全闪存存储: 十二个 U.2 NVMe/SATA SSD 插槽允许 ultra快速 I/O,实现高频 AI 模型执行和数据流传输。
  • AMD EPYC™ 7302P 16核处理器: 它提供 32 个线程的服务器计算能力——非常适合人工智能推理、虚拟化和高要求的并行工作负载。
  • 支持GPU的架构: 支持可选的 NVIDIA RTX PRO™ 6000 Blackwell GPU 工作站显卡 Max-Q 拥有高达 96GB 的 GPU 内存,并支持 CUDA®、TensorRT™ 和 Transformer Engine 加速 – 显著提高了 LLM 局部推理、图像生成和深度学习工作负载的性能。
  • 容器化AI环境和GPU资源管理: 支持 Docker 和 LXD,并提供直观的 GPU 分配功能。用户可以通过集成的 AI 应用中心快速启动 AI 工具,并通过命令行无需配置即可分配 GPU 资源。
  • 完全本地部署,无需任何依赖 cloudu: 运行 AI chat完全在本地构建您自己的 AI 助手、文档搜索引擎或知识库。在加速 AI 工作流程的同时,将敏感数据保留在公司内部。
  • 高速网络和可扩展架构: 它配备两个 25GbE 端口和两个 2,5GbE 端口。PCIe 插槽支持可选的 100GbE 扩展。兼容 QNAP JBOD 扩展硬盘,可用于大规模 AI 数据存储。

用例概述

  • 内部人工智能助手/本地 chat欢呼应用
    部署对话式人工智能界面,用于知识检索、员工培训和公司政策查询——所有操作均在您的完全控制之下。
  • RAG 企业搜索
    使用私有 RAG 管道在合同、报告和内部文档中进行快速上下文搜索。
  • 为创意团队生成图像
    运行 Stable Diffusion 或 ComfyUI,实现 AI 驱动的设计工作流程和视觉内容生成。
  • 人工智能驱动的IT自动化
    使用 n8n 实现推理任务、内容生成或警报的自动化——轻松将 AI 集成到业务流程中。

QNAP 的 QAI-h1290FX 提供了一种实用而强大的途径,可在企业范围内部署生成式 AI。无论是在法务、人力资源、创意还是 IT 运营部门,它都能帮助团队更快地工作、遵守法规,并在网络边缘全面掌控 AI 战略。

更多信息mac您可以在以下网址找到完整的 QNAP 产品系列: www.qnap.com.

今日阅读最多的

.