Name: AIMA — AI Inference Managed by AI
Author: 关嘉伟

为什么做 AIMA

部署一个 AI 模型不应该需要三天调研和一周踩坑。

今天，把模型跑起来意味着：查硬件兼容性、选推理引擎、调显存分配、写 Docker 配置、处理驱动冲突……每换一台机器，一切从头来过。这个过程阻碍了 AI 从实验室走向真正的生产环境。

AIMA 的答案是：让 AI 自己管理 AI 推理。 你只需要告诉它"跑这个模型"，剩下的一切——硬件检测、引擎选择、配置优化、容器编排——全部自动完成。

产品定位

AIMA 是一个 AI 推理基础设施自动化平台，面向需要在异构硬件上快速部署和管理 AI 模型的团队。

一个 Go 二进制，零依赖。放到任何机器上运行，它会自动发现 GPU（NVIDIA、AMD、华为昇腾、海光 DCU、Apple Silicon）、识别最优配置、部署推理引擎。不需要你懂 CUDA 版本，不需要你写 Dockerfile。

传统方案为每种引擎、每种硬件写专门的适配代码。AIMA 用 YAML 知识库取代了这些代码分支——新增硬件或引擎只需要添加一份描述文件，而不是改代码。这让系统能快速跟进 AI 硬件的爆发式增长。

AIMA 暴露 56 个 MCP 工具接口，AI Agent 可以像人类运维一样完整操控硬件、模型、引擎、部署和集群。这不只是自动化，而是让机器学会自主运维。

所有核心功能零网络依赖。无论是工厂车间的边缘设备，还是无法连接外网的政企机房，AIMA 都能完整工作。网络只是增强，不是前提。