Монитор парсеров
Операционный экран: какие сайты парсим, сколько уже собрано, когда был последний парсинг и что новое появилось в последний заход.
Сортировка: Последний парсинг ↓Сбросить фильтры
| Сайт | Статус | Всего ↕ | Новое ↕ | Последний ↓ | Ошибки ↕ | Действия |
|---|---|---|---|---|---|---|
| LCB Affiliate Programs lcb.org | Запланировано | 0 | 0 | — | 0 | новое·исходные |
| G2 manual/API g2.com | Запланировано | 0 | 0 | — | 0 | новое·исходные |
| Capterra manual/export capterra.com | Запланировано | 0 | 0 | — | 0 | новое·исходные |
| SiGMA manual/export sigma.world | Запланировано | 0 | 0 | — | 0 | новое·исходные |
| AskGamblers manual askgamblers.com | Запланировано | 0 | 0 | — | 0 | новое·исходные |
5 rows
LLM-пайплайн Nekocode
Безопасный режим: LLM помогает разметить новые данные, но не пишет напрямую в исходный слой.
- Парсер скачал новые карточки
- Система сравнила их с прошлым snapshot
- Новые/изменённые записи ушли в Nekocode
- LLM классифицировал тип, мусор, контакты, подозрительные поля и дубли
- Результат попадает в review/unified/contact слой и не перезаписывает raw