Сообщение Gate News, 17 апреля — Agile Soda представила Agentic OCR, платформу автоматизации документов на базе ИИ, которая не требует предварительного обучения и может быть развернута сразу. Платформа, созданная на больших языковых моделях (LLM) и моделях зрительно-языкового взаимодействия (VLM), нацелена на преобразование традиционного рынка OCR за счет устранения необходимости в повторном обучении моделей, специфичных для типа документов.
В отличие от традиционных систем OCR, которым для новых типов документов требуется от нескольких недель до нескольких месяцев повторного обучения, Agentic OCR позволяет пользователям задавать поля извлечения — например, имя, дату договора и сумму — а ИИ автоматически распознает, классифицирует и извлекает информацию. Пользователи могут загружать образцы документов, чтобы автоматически генерировать шаблоны классификации и извлечения; развертывание в тот же день не требует ни кода, ни обучающих данных. В валидационных тестах по 20 типам документов платформа достигла 98% точности классификации и более 95% точности извлечения информации.
Платформа включает активное обучение, повышая производительность по мере использования. Когда пользователи исправляют ошибки извлечения, система автоматически включает эти исправления, непрерывно улучшая точность без дополнительного обучения — что дает прирост производительности на 5–15%. Agile Soda завершила проверку производительности с крупными отечественными банками, страховыми компаниями и эмитентами карт и в настоящее время ведет развертывание. В будущих планах — расширение до чат-ботов на основе RAG, анализ сравнения документов и автоматизация рабочих процессов в качестве комплексной платформы документного агента.
Related News