Як гібридні архітектури ШІ послідовно керують мільйонами атрибутів продукту

Відкладена проблема масштабування електронної комерції

Більшість говорять про розподілений пошук і системи рекомендацій, коли йдеться про масштабування в електронній комерції. Але під поверхнею ховається більш уперта, часто недооцінена проблема: управління атрибутами в каталогах товарів. При понад 3 мільйонах SKU це швидко стає системною проблемою.

Значення атрибутів — це фундамент відкриття продукту. Вони керують фільтрами, порівняннями і рейтингами пошуку. Але на практиці вони фрагментовані: «XL», «Small», «12cm» і «Large» змішані в одному полі. Або кольори, такі як «RAL 3020», «Crimson», «Red» і «Dark Red», без послідовної структури. Помножте ці несумісності на десятки атрибутів для кожного продукту — і проблема зростає експоненційно.

Фільтри поводяться непередбачувано, пошук втрачає релевантність, а навігація клієнтів стає фруструючою. Водночас продавці тонуть у ручній очистці даних.

Відповідь: Інтелектуальні гібридні конвеєри з контрольними механізмами

Замість чорної скриньки AI, яка довільно сортує дані, з’явилася архітектура з трьох опор:

  • Пояснюваність: кожне рішення є зрозумілим
  • Передбачуваність: система поводиться послідовно
  • Людський контроль: мерчандайзери можуть вручну встановлювати критичні атрибути

Результатом стала гібридна конвеєрна система, яка поєднує інтелект LLM з чіткими правилами і збереженням даних. Вона діє розумно, але залишається керованою — AI з кермовими обмеженнями, а не неконтрольованим.

Офлайн-обробка замість потокових систем у реальному часі

Ключовим рішенням було вибрати фонові задачі замість систем у реальному часі. Це здається компромісом, але було стратегічно виправдано:

Обробка у реальному часі означала б:

  • Непередбачувану затримку
  • Хрупкі залежності систем
  • Витратні піки обчислень
  • Операційні ускладнення

Фонові задачі забезпечували:

  • Величезний пропуск без впливу на клієнтів
  • Надійність: збої ніколи не торкалися живих систем
  • Контроль витрат через планову обробку
  • Ізоляцію від затримок LLM
  • Атомарні, передбачувані оновлення

Розділення систем, орієнтованих на клієнтів, і систем обробки даних — ключове для мільйонів SKU.

Архітектура з збереженням і послідовністю

Вся збереження даних здійснювалася через MongoDB як центральне операційне сховище:

  • Видобуток атрибутів: перша задача витягала сирі значення і контекст категорії
  • Сервіс AI: LLM отримував очищені дані і контекстну інформацію (Breadcrumbs категорії, метадані)
  • Детерміновані резерви: числові діапазони і прості множини автоматично розпізнавалися і сортувалися за правилами
  • Збереження: відсортовані значення, уточнені імена атрибутів і теги сортування зберігалися в MongoDB
  • Інтеграція пошуку: оновлені дані подавалися до Elasticsearch (Ключове слово пошуку) і Vespa (семантичний пошук)

Ця структура збереження дозволяла легко перевіряти, перезаписувати і ресинхронізувати з іншими системами.

Гібридне управління: AI і рішення продавця

Не кожен атрибут потребує AI. Тому кожна категорія могла мати позначки:

  • LLM_SORT: модель приймає рішення про сортування
  • MANUAL_SORT: продавець визначає порядок вручну

Ця двонаправлена система тегів створювала довіру. Люди зберігали контроль над критичними атрибутами, тоді як AI автоматизував рутинну роботу — і без перерв у конвеєрі.

Очистка даних — основа

Перед застосуванням AI відбувався важливий попередній етап обробки:

  • Обрізання пробілів
  • Видалення порожніх значень
  • Дедуплікація
  • Стандартизація контексту категорії

Ця, здавалося б, проста очистка значно покращувала точність LLM. Чисті вхідні дані давали послідовні результати — основний принцип у масштабі.

Практична трансформація

Конвеєр перетворював хаотичні сирі дані у структуровані виходи:

Атрибут Сирі значення Відсортовані дані
Розмір XL, Small, 12cm, Large, M, S Small, M, Large, XL, 12cm
Колір RAL 3020, Crimson, Red, Dark Red Red, Dark Red, Crimson, Red (RAL 3020)
Матеріал Steel, Carbon Steel, Stainless, Stainless Steel Steel, Stainless Steel, Carbon Steel
Числові 5cm, 12cm, 2cm, 20cm 2cm, 5cm, 12cm, 20cm

Бізнес-наслідки

Результати були значущими:

  • Послідовне сортування атрибутів для понад 3М+ SKU
  • Передбачуване числове сортування за детермінованою логікою
  • Покращена релевантність пошуку
  • Інтуїтивні фільтри на сторінках товарів
  • Збільшена довіра клієнтів і конверсія

Це був не лише технічний успіх — це був крок вперед у досвіді користувача і доходах.

Основні висновки

  • Гібрид краще чистого AI: кермові обмеження важливі у масштабі
  • Контекст — король: кращий контекст = значно кращі результати LLM
  • Офлайн-архітектура створює надійність: фонові задачі — основа пропускної здатності
  • Збереження без втрати контролю: механізми ручного перезапису формують довіру
  • Чисті дані — надійні результати: якість даних визначає успіх AI

Висновок

Сортування значень атрибутів здається тривіальним, але стає реальною проблемою при мільйонах товарів. Поєднання інтелекту LLM, явних правил, збереження і контролю продавця створює систему, яка елегантно вирішує складні, приховані виклики. Це нагадує, що найбільші успіхи часто виникають із вирішення нудних, недооцінених проблем — тих, що впливають на кожну сторінку товару.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити