Ocr free web

Penter

Ищу помощь в данной теме.
Есть соображение:
расширение ocr для chrome , например эти 2 copyfish и naptha они могут выделенные изображения на страницы переводить в текст (аля ABBYY FineReaderr).
Была уже создана тема Как посмотреть исходный код любого расширения в браузере .
Собственно как имея исходный код , подправить его для бас : берем капчу и переводим её в текст.Капча простая, однотонный фон и на нем 2 цифры. Пробывал закидывать картинку на google doc , 95 из 100 капч распознавала верно, это и натолкнуло на версию с web ocr .
Может есть вариант как слать капчу на google doc ? Какая там ocr ?Буду благодарен за помощь.

out

@Penter не считаю что нужно что-то там выколупывать из расширений этих.
можно просто загуглить онлайн сервисы https://www.google.com/search?q=online+ocr без капч и прочего, что норм распознают и отправлять им.

можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

можно использовать консольные утилиты ocr https://www.google.com/search?q=ocr+windows+console Чтобы баз вызывал командную строку запускал команду с нужными аргументами и получал output из консоли (ответ, результат работы утилиты).
Этот считается вроде как самым лучшим среди free https://github.com/tesseract-ocr/tesseract
Только тут нужно уточнять момент у @support может ли бас получать доступ к потоку вывода консоли. Скорее всего да,
alt text
но самому еще доводилось использовать.

wodopad

У меня был один проект из двух скриптов, первый выполнял основные задачи и когда нарывался на капчу делал скрин (из кэша не получалось вытащить, не помню по какой причине) и делал текстовую запись в файл 1.txt (например), второй скрипт в это время мониторил каждые 5 сек. этот файл, как только получал команду к старту из файла - брал скрин и грузил его на to-textточкаnet (там ребята из Литовского, кажется, университета, разработали очень хороший OCR), обрабатывал, получал результат, записывал его в файл 2.txt, который в это время мониторил первый скрипт, он получал результат вводил его и в зависимости от того правильно решена капча или нет - делал соответствующую запись в 1.txt.

Если фейл - команда на повторение цикла, если вин - второй скрипт падает в ожидание, первый продолжает работу...

...потом я понял, что занимаюсь ерундой, а в это время старею! Купил Монстра, обучил его, погрохал те скрипты и зажил счастливо.) (только СолвеМедиа аудио для Монстра не хватает в BAS)

Если хотите продолжить работу в том же направлении советую испытать сайт, у меня были очень хорошие результаты разгадывания.

P.S. - С Tesseract-OCR приемлемых результатов мне добиться не удалось, слишком много ошибок было.

Penter

@wodopad Capmonster demo, я с чего подумал что он настолько же ущербно урезан и как и постер, но к счастью это не так. Ограницения мне с головой хватает. Теперь другая запара, как натренеровать модуль для решения капчи. Порыл гугл нашел умельцев что уже это сделалали, но один с концами пропал, второго буду связь искать.

Penter

@out

@out said

@Penter не считаю что нужно что-то там выколупывать из расширений этих.
можно просто загуглить онлайн сервисы https://www.google.com/search?q=online+ocr без капч и прочего, что норм распознают и отправлять им.

можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

можно использовать консольные утилиты ocr https://www.google.com/search?q=ocr+windows+console Чтобы баз вызывал командную строку запускал команду с нужными аргументами и получал output из консоли (ответ, результат работы утилиты).
Этот считается вроде как самым лучшим среди free https://github.com/tesseract-ocr/tesseract
Только тут нужно уточнять момент у @support может ли бас получать доступ к потоку вывода консоли. Скорее всего да,

но самому еще доводилось использовать.

пробывал этотвариант, одни минусы, да и знание не полны по вопросу, capmonster решает все на раз два

Penter

@out

можно эти расширения просто проснифать, и посмотреть куда они отправляют изображения, тоже самое сделать и самому ,без расширений.

Вот тут бы поподробнее

out

@Penter http://www.telerik.com/fiddler сниффер, анализор трафика.

out

@Penter ох не знаю.. использовать капмонстр для OCR капч не совсем правильно. Он разрабатывался для более сложных каптч. А не таких, что ровные буквы, одинаковые да еще и на одном чистом фоне.

Penter

@out так задача выполняется с успехоп 100п роцентов, я еще его использую на audio recaptcha2 + recaptcha

wodopad

@Penter said in Ocr free web:

Теперь другая запара, как натренеровать модуль для решения капчи. Порыл гугл нашел умельцев что уже это сделалали, но один с концами пропал, второго буду связь искать.

У разработчиков, отличные видеоинструкции по обучению модулей. В первые разы придётся повозиться, конечно, потом быстрее будет получаться.

Важно, что нужно подготовить большое количество изображений капчи (я стараюсь использовать не менее 200), но когда у нас есть BAS - собрать их не проблема. ;)

Если нужно, напишите в личку, подкину исходник бота (накидал когда проверял подойдёт ли мне монстр) решающего задачку которая выскакивает каждые 10 минут в демке, чтоб не париться с этим вручную.

@out said in Ocr free web:

@Penter ох не знаю.. использовать капмонстр для OCR капч не совсем правильно. Он разрабатывался для более сложных каптч. А не таких, что ровные буквы, одинаковые да еще и на одном чистом фоне.

Если это эффективно - почему нет?