Большинство людей видят только фронтенд ИИ.
Мало кто понимает, какой айсберг скрывается под ним.
Именно это делает полный стек агентного ИИ (Agentic AI) таким захватывающим: это скрытая архитектура, которая превращает простого чат-бота в систему, способную рассуждать и обладающую памятью.
Вот как работают уровни этого стека сверху вниз:
1. Фронтенд (Пользовательский интерфейс)
Создается с помощью таких фреймворков, как Azure App Service, React, Next.js или Streamlit.
Это место взаимодействия пользователей — видимая вершина айсберга.
2. Прием документов (Document Ingestion)
Точка входа для ваших данных. Такие инструменты, как Microsoft Fabric, Azure AI OCR (распознавание текста), LangChain и Apache Tika, анализируют и структурируют сырые документы.
3. Разделение на фрагменты и предобработка (Chunking & Preprocessing)
Перед подачей данных в ИИ они очищаются, токенизируются и разбиваются на фрагменты (чанки) с использованием таких инструментов, как spaCy, LangChain или Hugging Face.
4. Эмбеддинги (Векторные представления)
Текст преобразуется в числовые векторы — формат, который могут «понять» языковые модели (LLM).
За этот уровень отвечают такие платформы, как Azure OpenAI, OpenAI и Cohere.
5. Векторная база данных (Vector Database)
Хранит эмбеддинги для последующего поиска. К ним относятся Azure AI Search, Cosmos DB, PostgreSQL, FAISS или Milvus.
6. Уровень извлечения (Retrieval Layer)
При поступлении запроса этот уровень извлекает соответствующий контекст из векторной базы данных с помощью LangChain, LlamaIndex или Haystack.
7. Инженерия промптов (Prompt Engineering)
Объединяет извлеченный контекст с запросом пользователя для формирования осмысленного промпта (подсказки). Такие инструменты, как Promptify, LangChain и DSPy, тонко настраивают то, как ИИ интерпретирует инструкции.
8. LLM (Большая языковая модель)
В самом сердце системы такие модели, как Azure OpenAI, LLaMA или Mistral, генерируют логические цепочки, аналитику или творческие ответы.
9. Наблюдаемость и оценка (Observability & Evaluation)
Мониторинг с помощью Azure Foundry, OpenTelemetry или Grafana гарантирует правильную и безопасную работу системы.
10. Инфраструктура / Развертывание (Infrastructure / Deployment)
Всё это работает на масштабируемых платформах — Azure Container Apps, AKS, Docker или Kubernetes, — обеспечивая бесперебойную работу ИИ-сервисов в режиме реального времени.
Комментарии (1)