Перейти к содержанию

ML-матчинг номенклатур

Автоматически сопоставляет позиции тендера с позициями прайс-листов поставщиков.

Текущие метрики

Метрика Значение Цель
Recall@1 0.28 0.70
Размер датасета 70 пар 150–175 пар

Следующий этап

После 200+ operator-пар — запуск полноценного baseline + теневое дообучение из пайплайна.

Пороги матчинга

Similarity Действие
≥ 0.85 Авто-матч
0.55 – 0.85 Запрос оператору
< 0.55 Спросить поставщика

Разметка (label_batch)

Сначала — стоп агента

sudo systemctl stop tender-agent-claude
# Убедиться что нет запущенных экземпляров
pkill -f label_batch_runner.py

# Запуск
python -u scripts/label_batch_runner.py --conf /opt/tender_agent_claude/agent.conf

Один экземпляр

Только один label_batch одновременно. Агент и разметка не работают параллельно.

После разметки — скилл /агент для рестарта агента.

Лесенка резильентности LLM

1. Anthropic (Sonnet в проде — entity_extract)
2. DeepSeek / Qwen / GLM (fallback при недоступности)
3. Локальный Qwen на V100 (last resort)

Датасет

  • Таблица: ml_training_candidates
  • Стратегия: разметка через цену (overlap + price combo)
  • TODO: теневое дообучение из пайплайна (после 200+ пар)