Telegram Group & Telegram Channel
This media is not supported in your browser
VIEW IN TELEGRAM
В одном проекте по автоматизации была задача: забирать PDF‑сканы из сетевого хранилища NAS, распознавать их и переводить в JSON для дальнейшей обработки. Но есть нюанс: нельзя отправлять их на внешние серверы LLM’ок, всё нужно делать локально.

Уже начал вайбкодить своё решение, но тут наткнулся на DocStrange. Это бесплатное open‑source‑решение, которое превращает PDF, отсканированные документы в структурированные данные (Markdown, CSV, HTML, JSON и т. п.) с поддержкой таблиц, полей, OCR и прочего. Можно запускать локально или в облаке (в облаке дают до 10 000 документов в месяц бесплатно).

Так что, если вы ищете решение для извлечения данных из бухгалтерских и других документов, присмотритесь.
Github: https://github.com/NanoNets/docstrange
79🔥40👍15🙏103❤‍🔥2🦄2



group-telegram.com/prompt_design/1641
Create:
Last Update:

В одном проекте по автоматизации была задача: забирать PDF‑сканы из сетевого хранилища NAS, распознавать их и переводить в JSON для дальнейшей обработки. Но есть нюанс: нельзя отправлять их на внешние серверы LLM’ок, всё нужно делать локально.

Уже начал вайбкодить своё решение, но тут наткнулся на DocStrange. Это бесплатное open‑source‑решение, которое превращает PDF, отсканированные документы в структурированные данные (Markdown, CSV, HTML, JSON и т. п.) с поддержкой таблиц, полей, OCR и прочего. Можно запускать локально или в облаке (в облаке дают до 10 000 документов в месяц бесплатно).

Так что, если вы ищете решение для извлечения данных из бухгалтерских и других документов, присмотритесь.
Github: https://github.com/NanoNets/docstrange

BY Силиконовый Мешок


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/prompt_design/1641

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

He said that since his platform does not have the capacity to check all channels, it may restrict some in Russia and Ukraine "for the duration of the conflict," but then reversed course hours later after many users complained that Telegram was an important source of information. Some people used the platform to organize ahead of the storming of the U.S. Capitol in January 2021, and last month Senator Mark Warner sent a letter to Durov urging him to curb Russian information operations on Telegram. A Russian Telegram channel with over 700,000 followers is spreading disinformation about Russia's invasion of Ukraine under the guise of providing "objective information" and fact-checking fake news. Its influence extends beyond the platform, with major Russian publications, government officials, and journalists citing the page's posts. The Russian invasion of Ukraine has been a driving force in markets for the past few weeks. On December 23rd, 2020, Pavel Durov posted to his channel that the company would need to start generating revenue. In early 2021, he added that any advertising on the platform would not use user data for targeting, and that it would be focused on “large one-to-many channels.” He pledged that ads would be “non-intrusive” and that most users would simply not notice any change.
from id


Telegram Силиконовый Мешок
FROM American