Скачайте демо
|||
Синтетический датасет для США
Мы продолжаем генерировать синтетические номера и тестировать их на нашей DATA Factory. Только для одного теста был собран синтетический датасет порядка 2 млн номеров США (более 2 тыс. различных шаблонов).
Тестирование заняло всего лишь около 2 часов.
Что мы получили? Высокая точность распознавания по каждому шаблону номера всех 50 штатов с учетом их особенностей. Впереди тестирование остальных шаблонов номеров США, их более 4 тыс.
Чем удобен инструмент? Он позволяет генерировать синтетические номера и проводить тесты, собирать большие датасеты по всему миру в короткий срок и без особых затрат.
А большие датасеты создают для алгоритма распознавания условия, в которых он ошибается или делает погрешности.
Анализ таких узких мест дает возможность улучшить алгоритм с наименьшими временными и ресурсными затратами. Проще говоря, мы автоматизировали процесс поиска проблем.
PS: Синтетические данные должны быть максимально релевантны реальности. Как это сделать, мы расскажем в других наших обновлениях!
Хотите узнать больше? Следите за нашими обновлениями.
Related Posts