亚马逊AWS官方博客

Category: Artificial Intelligence

Amazon Inf2 上的 DeepSeek-R1 蒸馏模型:监控与评估实践

客户部署自己的大模型时,常常会遇到如何评估模型部署的性能和如何调优的问题, 本篇主要针对如何评估性能进行讨论。 基于 vllm 部署的模型, 通过 Prometheus 和 Grafana 如何取得模型推理的性能参数,以及如何解读这些参数进行讨论。 本文采用 inferentia2 作为测试环境, 因为本篇的目的主要是解读性能参数, 在这篇里不会讨论 inferentia2 的规格和运行配置进行优化。

使用 SageMaker InferenceComponent 和 LiteLLM 构建自己的 MaaS 平台

通过 liteLLM,Sagemaker Inference Component 推理端点,构建一个统一的 MaaS 中台,客户不仅能够集成多种模型,还能充分利用高性能硬件,实现资源的高效管理。这种灵活且高效的架构,将为客户在人工智能领域的应用打下坚实的基础,助力其在竞争中脱颖而出。

企业级 AI 平台建设思路

这篇文章探讨了构建企业级AI平台的重要性和方法。它提出了四步法:识别关键业务流程、评估所需 AI 能力、设计灵活可扩展的技术架构、培养人才并整合团队。文章详细介绍了一个七层架构框架,从基础设施到应用层。同时,提供了实施路线图,建议采用案例驱动、迭代式方法,逐步建立全面的 AI 生态系统,同时确保法律合规和风险管理。

利用 Amazon Bedrock Data Automation(BDA)对视频数据进行自动化处理与检索

本文主要介绍了利用 Amazon Bedrock Data Automation (BDA) 对视频数据进行自动化处理和检索的解决方案。BDA 为视频搜索提供了源数据,无服务器的架构为整体的设计提供了低成本的计算资源,后续的数据的存储选用 DocumentDB 也是希望可以用灵活地手段做 Json 数据处理。在 AI 模型的加持下,希望本文能够为 AI 与视频搜索提供了一种新思路。​