Базу надо знать!

Если ваши интересы пересекаются с IT, продажами, обработкой данных знание базы Пайтон может быть очень полезно.

Обратились ко мне за помощью, конвертировать .pdf в .docx. Так как папок и файлов было больше единицы, решил, что открывать все это в редакторе и конвертировать мне лениво – обратился к ИИ. Написал промт: конвертировать все файлы .pdf в docx в папке где находится код и подпапках. Все исходные файлы остаются и рядом с тем же именем docx.

# скрипт на Python, который конвертирует все PDF-файлы в указанной папке и её подпапках в файлы формата DOCX, можно использовать библиотеку pdf2docx.

import os

from pdf2docx import Converter

def convert_pdf_to_docx(pdf_file, docx_file):

# Создаем объект конвертера

cv = Converter(pdf_file)

# Конвертируем PDF в DOCX

cv.convert(docx_file, start=0, end=None)

# Закрываем конвертер

cv.close()

def convert_all_pdfs_in_folder(folder_path):

for root, dirs, files in os.walk(folder_path):

for file in files:

if file.lower().endswith('.pdf'):

pdf_file = os.path.join(root, file)

docx_file = os.path.splitext(pdf_file)[0] + '.docx'

print(f'Converting: {pdf_file} to {docx_file}')

convert_pdf_to_docx(pdf_file, docx_file)

if __name__ == "__main__":

folder_path = '.' # Укажите путь к папке, в которой нужно искать PDF-файлы

convert_all_pdfs_in_folder(folder_path)

Хотя ИИ отлично справляется и с более сложными задачами, знание основ необходимо для понимания того, что происходит при исполнении алгоритма. Можно найти немало историй о массовом переименовании или удалении системных файлов по ошибке.

Совет: если в коде требуется указать путь к «цели», используйте абсолютные пути. Опасный вариант - «.», безопасный (linux) - «/home/user/vsCode/pdf_to_docx». Учитывая, что в написании путей существуют различия между операционными системами, это так же уменьшает неопределенность.

Мой сети - https://t.me/apicraft https://www.youtube.com/@jspytop http://apicraft.ru/

Про железо

1.5K постов2.9K подписчик

Правила сообщества

1.Размещать информацию, связанную с тематикой сообщества в развёрнутом и максимально понятном виде. Изображения, схемы, графики, иллюстрации — приветствуются.


2. Пользователь не должен переходить по ссылкам на сторонние ресурсы чтобы дочитать публикацию.


3. Допускаются ссылки на сторонние ресурсы, если эти ресурсы представляют какую-либо ценность (например, это справочные материалы). То есть – ссылки только по делу, если без них не обойтись.


Давайте уважать друг друга. Оскорбления, мат, переход на личное – порицаются. Здоровая критика и обсуждения – приветствуются.