Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Скайдом - пожалуй, самая красочная и интересная головоломка с действительно уникальными режимами игры!

Скайдом

Три в ряд, Головоломки, Казуальные

Играть

Топ прошлой недели

  • Rahlkan Rahlkan 1 пост
  • Tannhauser9 Tannhauser9 4 поста
  • alex.carrier alex.carrier 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
0
Neurosonya
Neurosonya
2 месяца назад
Искусственный интеллект
Серия Полезность

Помощники для ChatGPT и других LLM, а так же для ИИ-агентов⁠⁠

Сегодня необычные сервисы, а помощники для LLM и ИИ-агентов, чтобы они анализировали ваши файлы без галлюцинаций и ошибок. Обычные ИИ плохо справляются с PDF и картиками: путают колонки, не понимают таблицы и заголовки. Следующие инструменты читают документы как человек — учитывают структуру, формат, сноски, даже логику. Эти же инструменты превращают документ в качественно распознанный и разбитый по структуре текст, который уже  можно загрузить в Большие Языковые модели (LLM) для дальнейшего взаимодействия без галлюцинаций. Этакие парсеры документов.

Проще, зачем они нужны? Для создания:

• систем поиска по внутренним документам (вопрос-ответ по внутренним документам)

• интеллектуального анализа юридических, медицинских, технических файлов

• создания базы знаний из PDF/HTML/DOCX, изображений и тд

Вот два таких сервиса:

1) LlamaParse

Помощники для ChatGPT и других LLM, а так же для ИИ-агентов Искусственный интеллект, Нейронные сети, Программирование, Парсинг, Парсер, Pdf, Бесплатно, Технологии, Чат-бот, Digital, Полезное, Информация, Таблица, Картинки, Картинка с текстом, Microsoft Excel, Документы, Разработка, Бизнес, Видео, Без звука, Короткие видео, Длиннопост

LlamaParse — умный парсер документов и файлов от LlamaIndex. Очень круто извлекает сложные таблицы. Можно интегрировать через API в приложения. Бесплатно можно обработать до 1 000 страниц в день.

LlamaParse поддерживает:

• Документы: PDF, DOC, DOCX, RTF, TXT, EPUB, XML, HTML, Pages, Keynote и др.

• Презентации: PPT, PPTX, ODP

• Таблицы: XLS, XLSX, CSV, ODS, TSV

• Изображения: JPEG, PNG, GIF, BMP, SVG, TIFF, WebP

• Аудио: MP3, MP4, WAV, M4A и др. (до 20 МБ)

Полный список доступен в официальной документации Supported Document Types

Например: Вы загружаете инструкцию по продукту, договор или научную статью → LlamaParse анализирует структуру и разбивает по логике → вы используете это в GPT-боте, который теперь может грамотно отвечать на вопросы по документу.

Больше проверенной информации и пользы в моем телеграм канале.

2) Contextual

Contextual - тоже самое, вы загружаете документ со сложными таблицами, рисунками и диаграммами, сервис так же преобразовывает это в текстовый файл с метаданными, понятный для любой LLM. Бесплатно можно обработать до 500 страниц.

Contextual AI поддерживает:

• Документы: PDF, DOC, DOCX, PPT, PPTX, HTML-файлы

Можно использовать документы Microsoft Office напрямую в системах Contextual AI, без необходимости предварительно конвертировать их в PDF.

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Хотите больше полезных сервисов для работы, учебы и бизнеса, видеоуроков, обратную связь и сильное окружение - Добро пожаловать в:

Показать полностью 1 1
[моё] Искусственный интеллект Нейронные сети Программирование Парсинг Парсер Pdf Бесплатно Технологии Чат-бот Digital Полезное Информация Таблица Картинки Картинка с текстом Microsoft Excel Документы Разработка Бизнес Видео Без звука Короткие видео Длиннопост
7
gargosx
gargosx
2 месяца назад

Про PDF - Файлы ...⁠⁠

Про PDF - Файлы ...
Картинка с текстом Блогеры Pdf
3
150
oevph
2 месяца назад
Книжная лига

Артефакт из прошлого - задачник Григория Остера 1992 года⁠⁠

Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост


Прошлой осенью меня переклинила ностальгия когда вдруг вспомнил про задачник который постоянно засматривал до дыр в детстве. Его подарили брату на день рождения, но эти сюрреалистичные иллюстрации со своеобразной сатирой и юмором плотно засели в моей голове. И вот я нашёл один экземпляр на сайте - барахолке, отвалил 600 рублей, и через неделю в руках с упоением разглядывал задачник который не видел 30 лет. Теперь я хочу поделиться им с вами, так как в интернете нет электронной версии, а фотографии очень плохого качества. В пост я загружу первые 15 страниц.

И так! Вашему внимаю представляю Задачник ненаглядное пособие по математике 1992 года выпуска.
Текст - Г.Б. Остер, 1991
Иллюстрации - В.А. Буркин, 1992
Макет - В.В. Хрыжановский, 1992
Тираж - 150.000 экземпляров

Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Артефакт из прошлого - задачник Григория Остера 1992 года Детство 90-х, Детство, Детская литература, Ностальгия, Олдфаги, Воспоминания из детства, Григорий Остер, Задачник, Математика, Иллюстрации, Олдскул, Книги, Сатира, Литература, 90-е, Скан, Pdf, Вредные советы, Длиннопост
Показать полностью 14
[моё] Детство 90-х Детство Детская литература Ностальгия Олдфаги Воспоминания из детства Григорий Остер Задачник Математика Иллюстрации Олдскул Книги Сатира Литература 90-е Скан Pdf Вредные советы Длиннопост
39
Jelizaveta
2 месяца назад

Как конвертировать PDF в Word на C#⁠⁠

Преобразование файлов PDF в документы Word — распространённая задача в бизнес-среде и разработке. Независимо от того, нужно ли вам отредактировать содержимое PDF или извлечь текст для дальнейшей обработки, использование надёжной библиотеки для конвертации крайне важно. В этой статье мы рассмотрим, как преобразовать PDF в Word на C# с помощью Spire.PDF для .NET — мощной библиотеки, поддерживающей как конвертацию с фиксированным, так и с гибким форматированием.

  • Библиотека C# .NET для конвертации PDF в Word

  • Конвертация PDF в Word с фиксированным форматированием

  • Конвертация PDF в Word с гибкой структурой

  • Заключение

Библиотека C# .NET для конвертации PDF в Word

Spire.PDF для .NET — это мощная библиотека для работы с PDF, позволяющая программно создавать, редактировать и конвертировать PDF-документы. Среди её возможностей — удобное преобразование PDF в Word (форматы .doc и .docx) с сохранением форматирования, изображений и структуры текста.

Чтобы начать работу:

  1. Установите Spire.PDF для .NET через NuGet:

    Install-Package Spire.PDF

  2. Добавьте необходимое пространство имён в код C#:

using Spire.Pdf;

Теперь рассмотрим два способа конвертации PDF в Word.

Конвертация PDF в Word с фиксированным форматированием

Фиксированный формат Word-документа сохраняет точное расположение элементов, как в исходном PDF, включая шрифты, изображения и структуру. Это полезно, когда нужно получить файл Word, идентичный оригинальному PDF.

Вот как это реализовать на C#:

using Spire.Pdf;


namespace ConvertPdfToFixedLayoutWord

{

class Program

{

static void Main(string[] args)

{

// Создаём объект PdfDocument

PdfDocument doc = new PdfDocument();


// Загружаем PDF-документ

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf");


// Конвертируем PDF в Doc

doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);


// Конвертируем PDF в Docx

doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);


// Освобождаем ресурсы

doc.Dispose();

}

}

}

Основные моменты:

  • Метод SaveToFile() позволяет сохранять как в .doc (Word 97-2003), так и в .docx (современный формат Word).

  • Выходной файл сохраняет исходную структуру PDF.

Конвертация PDF в Word с гибкой структурой

Если вам нужен редактируемый Word-документ, в котором текст и абзацы можно легко изменять (без жёсткой привязки к позиции), Spire.PDF позволяет преобразовать PDF в файл с гибкой структурой.

Вот реализация на C#:

using Spire.Pdf;


namespace ConvertPdfToFlexibleLayoutWord

{

class Program

{

static void Main(string[] args)

{

// Создаём объект PdfDocument

PdfDocument doc = new PdfDocument();


// Загружаем PDF-документ

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf");


// Указываем параметры конвертации

doc.ConvertOptions.SetPdfToDocOptions(true, true);


// Конвертируем PDF в Doc

doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);


// Конвертируем PDF в Docx

doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);


// Освобождаем ресурсы

doc.Dispose();

}

}

}

Основные моменты:

  • SetPdfToDocOptions(true, true) включает гибкое форматирование текста и автоматическое определение абзацев.

  • Полезно, если нужно изменить структуру документа в Word.

Заключение

С Spire.PDF для .NET конвертация PDF в Word на C# становится простой задачей. Независимо от того, нужен ли вам фиксированный макет (точная копия) или гибкая структура (для редактирования), Spire.PDF предоставляет необходимые инструменты для качественного преобразования.

Попробуйте интегрировать эту библиотеку в свои проекты, чтобы упростить процесс конвертации PDF в Word!

Дополнительные материалы:

  • Документация Spire.PDF

  • Другие примеры конвертации PDF

Удачного программирования! 🚀

Показать полностью
Pdf Csharp Microsoft Word Конвертация Текст Длиннопост
7
4
Pavel.DW
Pavel.DW
2 месяца назад

Нужна помощь - сканы PDF⁠⁠

Нужна помощь - сканы PDF Сканирование, Pdf, Png, Макрос, Рассылка, Офисные будни, Офисные работники, Помогите найти, Помощь, Компьютерная помощь, Python, Программа, Нейронные сети, Сканер, Решение проблемы

Товарищи, помогите.

Знает ли кто-нибудь, использует ли кто-нибудь бесплатную простенькую программу по типу WinScan2PDF, с помощью которой можно отсканированные страницы сохранять не в один огромный файл pdf со всеми отсканированными страницами, или каждую отдельную страницу в отдельные файлы pdf/png/jpeg, что собственно WinScan2PDF и умеет делать, а сохранять из общей кучи страницы группами по две страницы в отдельные файлы pdf, по три страницы в отдельные файлы pdf и так далее.

Задача: есть стопка писем/уведомлений для рассылки клиентам в количестве 250 штук. Все письма имеют по 2 страницы. Для рассылки писем по электронной почте их необходимо отсканировать, затратив на это как можно меньше времени.

На МФУ Kyocera можно конечно сканировать каждое письмо отдельно (сейчас именно так и делаю), но для этого необходимо стоять возле МФУ и тупо механически подкладывать каждое новое письмо и нажимать кнопочки "повтор" и "старт". По времени это занимает примерно один час.
Однако на данном МФУ, с помощью программы WinScan2PDF можно отсканировать всю пачку сразу, получив при этом как вариант 500 файлов png. Для сканирования всей пачки потребуется 20-30 минут времени (потому что в процессе отсутствуют паузы на подкладывание новых писем и нажатие кнопочек), при этом не нужно стоять и тратить время у самого МФУ - можно заняться какой-нибудь параллельной работой, пока МФУ сканирует. Но в таком случае требуется какая-то программа, или макрос в excel (сам писать макросы я пока-что не умею) или какой-то иной метод, с помощью которого можно было бы быстро объединить 500 файлов png группами по два файла по порядку, что бы получились 250 двухстраничных файлов pdf,
Ну или если это 250 писем по 4 страницы, то сохранить из 1000 сканов png 250 файлов pdf по 4 страницы, и тому подобные варианты.

Кто знает готовое решение, подскажите пожалуйста.

Дополнено:
Огромное спасибо @almelion за помощь! Готовое решение находится в комментах по ссылке: #comment_351913358

Показать полностью
[моё] Сканирование Pdf Png Макрос Рассылка Офисные будни Офисные работники Помогите найти Помощь Компьютерная помощь Python Программа Нейронные сети Сканер Решение проблемы
40
422
Kopfit
2 месяца назад
IT-юмор

Ответ на пост «Суровый сис админ»⁠⁠2

Когда вижу подобные посты удивляюсь самомнению подобных личностей. Ах-ха-ха, он не может создать файл в экселе, ах-ха-ха он не может сохранить Пдф. У нас на работе есть определенное количество сотрудников, которые в играют в косынку на компьютере, а в свободное от этого время разбирают рекламации от заводов производящих серьезные оборонные заказы. И он может объяснить, почему двигатель дает 1500 оборотов, а не 1000 как должен и что нужно сделать, что бы показания были в норме. Почему витков провода на двигателе должно быть определенное количество и определенной толщины. Почему станок не работает и что нужно сделать, что бы он заработал. И да он тратит на это 5 минут, а не 8 часов и более. А в остальное время будет играть в косынку.

А при необходимости ему наймут еще пяток таких как ты, кто будет ему открывать Ворд, сохранять пдф и записывать рекорды в сапере, потому что он не умеет записывать результаты в "компутере". И платить будут в два и более раз, потому что сохранять пдф сейчас может каждый второй, а разбираться в технике умею уже,к сожалению, единицы.

[моё] Мемы Картинка с текстом Юмор IT юмор Кот Pdf Зарплата Telegram (ссылка) Ответ на пост Текст
145
35
mmnogabukaff
2 месяца назад
IT-юмор

Ответ на пост «Суровый сис админ»⁠⁠2

Коротко о современном состоянии ойти (по мотивам ситуации в каментах):

в профессиональном сообществе "IT-юмор" менеджеры массово возмущаются отсутствию у себя навыка работы в офисных программах, в которых - по их мнению - должен за них работать сисадмин

Мемы Картинка с текстом Юмор IT юмор Кот Pdf Зарплата Telegram (ссылка) IT Ответ на пост Текст
19
4315
kinosmotr
kinosmotr
2 месяца назад
IT-юмор

Суровый сис админ⁠⁠2

Суровый сис админ Мемы, Картинка с текстом, Юмор, IT юмор, Кот, Pdf, Зарплата, Telegram (ссылка)

Канал Осьминог Пауль

Показать полностью 1
Мемы Картинка с текстом Юмор IT юмор Кот Pdf Зарплата Telegram (ссылка)
383
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии