Базу надо знать!
Если ваши интересы пересекаются с IT, продажами, обработкой данных знание базы Пайтон может быть очень полезно.
Обратились ко мне за помощью, конвертировать .pdf в .docx. Так как папок и файлов было больше единицы, решил, что открывать все это в редакторе и конвертировать мне лениво – обратился к ИИ. Написал промт: конвертировать все файлы .pdf в docx в папке где находится код и подпапках. Все исходные файлы остаются и рядом с тем же именем docx.
# скрипт на Python, который конвертирует все PDF-файлы в указанной папке и её подпапках в файлы формата DOCX, можно использовать библиотеку pdf2docx.
import os
from pdf2docx import Converter
def convert_pdf_to_docx(pdf_file, docx_file):
# Создаем объект конвертера
cv = Converter(pdf_file)
# Конвертируем PDF в DOCX
cv.convert(docx_file, start=0, end=None)
# Закрываем конвертер
cv.close()
def convert_all_pdfs_in_folder(folder_path):
for root, dirs, files in os.walk(folder_path):
for file in files:
if file.lower().endswith('.pdf'):
pdf_file = os.path.join(root, file)
docx_file = os.path.splitext(pdf_file)[0] + '.docx'
print(f'Converting: {pdf_file} to {docx_file}')
convert_pdf_to_docx(pdf_file, docx_file)
if __name__ == "__main__":
folder_path = '.' # Укажите путь к папке, в которой нужно искать PDF-файлы
convert_all_pdfs_in_folder(folder_path)
Хотя ИИ отлично справляется и с более сложными задачами, знание основ необходимо для понимания того, что происходит при исполнении алгоритма. Можно найти немало историй о массовом переименовании или удалении системных файлов по ошибке.
Совет: если в коде требуется указать путь к «цели», используйте абсолютные пути. Опасный вариант - «.», безопасный (linux) - «/home/user/vsCode/pdf_to_docx». Учитывая, что в написании путей существуют различия между операционными системами, это так же уменьшает неопределенность.
Про железо
1.5K постов2.9K подписчик
Правила сообщества
1.Размещать информацию, связанную с тематикой сообщества в развёрнутом и максимально понятном виде. Изображения, схемы, графики, иллюстрации — приветствуются.
2. Пользователь не должен переходить по ссылкам на сторонние ресурсы чтобы дочитать публикацию.
3. Допускаются ссылки на сторонние ресурсы, если эти ресурсы представляют какую-либо ценность (например, это справочные материалы). То есть – ссылки только по делу, если без них не обойтись.
Давайте уважать друг друга. Оскорбления, мат, переход на личное – порицаются. Здоровая критика и обсуждения – приветствуются.