чем посчитать страницы в pdf файле?

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (2) 1 [2]   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
Aberrant
3.07.2025 - 22:34
0
Статус: Offline


На фоксе! Всегда!

Регистрация: 3.10.20
Сообщений: 3536
Цитата (m7k @ 3.07.2025 - 15:23)
Качаешь тут https://www.xpdfreader.com/download.html
Xpdf command line tools
разархивируешь в папку где у тебя PDF файл pdfinfo.exe
заходишь в консоли (коммандная строка) в эту папку
предположим что x = нужный диск
Код

x:
cd {нужная папка}

вводишь комманду например:
Код
for %a in (*) do pdfinfo "%a" | findstr "Pages" >> d:\1.txt

получаешь на выходе файл d:\1.txt примерно такого содержания:
Код

Pages:          1
Pages:          2
Pages:          1
Pages:          4
Pages:          2
Pages:          3
Pages:          1
Pages:          2
Pages:          1
Pages:          12
Pages:          2
Pages:          1


копируешь содержимое файла в ексель, делаешь автосумму по столбцу где будут цифры. получаешь общую сумму всех страниц.
можно еще через пайтон сделать чтобы сам поссумировал, но так я думаю проще.

а ты проверил? lol.gif
 
[^]
Moramoon
3.07.2025 - 22:40
0
Статус: Offline


Шутник

Регистрация: 1.08.24
Сообщений: 64
Мне просто интересно, позвольте.. А что там такого на 3500 страниц то?
Хоть намекните... .
 
[^]
Виконт
4.07.2025 - 08:26
0
Статус: Offline


Ищем пуговицу

Регистрация: 27.03.12
Сообщений: 25266
Цитата (Moramoon @ 3.07.2025 - 22:40)
Мне просто интересно, позвольте.. А что там такого на 3500 страниц то?
Хоть намекните... .

ничего необычного, документы по процедуре подтверждения компетентности химлаборатории (сначала идет аккредитация, через год пк-1, через 2 - пк2, у нас пк-2)
 
[^]
Виконт
4.07.2025 - 08:31
1
Статус: Offline


Ищем пуговицу

Регистрация: 27.03.12
Сообщений: 25266
m7k
твою бы энергию да в мирных https://www.yaplakal.com/forum32/topic2954754.html?hl= целях)))
 
[^]
m7k
4.07.2025 - 19:37
0
Статус: Offline


Шутник

Регистрация: 3.07.25
Сообщений: 26
Цитата (Aberrant @ 3.07.2025 - 22:34)
Цитата (m7k @ 3.07.2025 - 15:23)
Качаешь тут https://www.xpdfreader.com/download.html
Xpdf command line tools
разархивируешь в папку где у тебя PDF файл pdfinfo.exe
заходишь в консоли (коммандная строка) в эту папку
предположим что x = нужный диск
Код

x:
cd {нужная папка}

вводишь комманду например:
Код
for %a in (*) do pdfinfo "%a" | findstr "Pages" >> d:\1.txt

получаешь на выходе файл d:\1.txt примерно такого содержания:
Код

Pages:          1
Pages:          2
Pages:          1
Pages:          4
Pages:          2
Pages:          3
Pages:          1
Pages:          2
Pages:          1
Pages:          12
Pages:          2
Pages:          1


копируешь содержимое файла в ексель, делаешь автосумму по столбцу где будут цифры. получаешь общую сумму всех страниц.
можно еще через пайтон сделать чтобы сам поссумировал, но так я думаю проще.

а ты проверил? lol.gif

Да проверил а что? в том посте пример вывода с моего компа, накидал в папку всяких пдэфов выполнил скрипт, то что мне выдало в файл скопировал в пост для примера.
 
[^]
m7k
4.07.2025 - 20:08
1
Статус: Offline


Шутник

Регистрация: 3.07.25
Сообщений: 26
Цитата (Виконт @ 4.07.2025 - 08:31)
m7k
твою бы энергию да в мирных https://www.yaplakal.com/forum32/topic2954754.html?hl= целях)))

отписал в Вашей теме.
 
[^]
Виконт
5.07.2025 - 10:58
1
Статус: Offline


Ищем пуговицу

Регистрация: 27.03.12
Сообщений: 25266
m7k спасибо , но это немного не то)

ps а подсчет дал свои результаты , когда с цифрами в руках показал руководству что только читать эти документы надо три рабочих недели , не говоря о создании , проверке, корректировке, руководство задумалось. надеюсь как одна статс падла документы подпишет, премия упадет
 
[^]
Aberrant
5.07.2025 - 19:51
0
Статус: Offline


На фоксе! Всегда!

Регистрация: 3.10.20
Сообщений: 3536
Цитата (m7k @ 4.07.2025 - 19:37)
Цитата (Aberrant @ 3.07.2025 - 22:34)
Цитата (m7k @ 3.07.2025 - 15:23)
Качаешь тут https://www.xpdfreader.com/download.html
Xpdf command line tools
разархивируешь в папку где у тебя PDF файл pdfinfo.exe
заходишь в консоли (коммандная строка) в эту папку
предположим что x = нужный диск
Код

x:
cd {нужная папка}

вводишь комманду например:
Код
for %a in (*) do pdfinfo "%a" | findstr "Pages" >> d:\1.txt

получаешь на выходе файл d:\1.txt примерно такого содержания:
Код

Pages:          1
Pages:          2
Pages:          1
Pages:          4
Pages:          2
Pages:          3
Pages:          1
Pages:          2
Pages:          1
Pages:          12
Pages:          2
Pages:          1


копируешь содержимое файла в ексель, делаешь автосумму по столбцу где будут цифры. получаешь общую сумму всех страниц.
можно еще через пайтон сделать чтобы сам поссумировал, но так я думаю проще.

а ты проверил? lol.gif

Да проверил а что? в том посте пример вывода с моего компа, накидал в папку всяких пдэфов выполнил скрипт, то что мне выдало в файл скопировал в пост для примера.

я вот не проверял, но сходу обратил внимание на пару критических ошибок.

1. предположу, что тузла pdfinfo.exe матом ругнётся если в папке будет некорректный PDF или вовсе не-PDF,
а значит цикл тут же прервётся руганью в консоль - проверь!

2. использование на столько архаичной тузлы как findstr могу объяснить только подсказкой ИИ, но никак не мыслью вменяемого человека.

ибо нафига использовать это говнище, которое вообще ничерта не умеет,
а потом ещё и считать через эксель,
если можно сразу же переместить всё это действие из CMD в PowerShell, где и регулярки нормально работают, а значит в переменную сразу можно складывать количество страниц, суммируя нахожу, без необходимости создавать текстовый файл с мусором внутри.

Это сообщение отредактировал Aberrant - 5.07.2025 - 19:54
 
[^]
m7k
5.07.2025 - 20:57
1
Статус: Offline


Шутник

Регистрация: 3.07.25
Сообщений: 26
Цитата (Aberrant @ 5.07.2025 - 19:51)
я вот не проверял, но сходу обратил внимание на пару критических ошибок.

1. предположу, что тузла pdfinfo.exe матом ругнётся если в папке будет некорректный PDF или вовсе не-PDF,
а значит цикл тут же прервётся руганью в консоль - проверь!

2. использование на столько архаичной тузлы как findstr могу объяснить только подсказкой ИИ, но никак не мыслью вменяемого человека.

ибо нафига использовать это говнище, которое вообще ничерта не умеет,
а потом ещё и считать через эксель,
если можно сразу же переместить всё это действие из CMD в PowerShell, где и регулярки нормально работают, а значит в переменную сразу можно складывать количество страниц, суммируя нахожу, без необходимости создавать текстовый файл с мусором внутри.

1. нет не ругнется, чекал. вернее ругнется и пропустит, если не указать в параметрах стопнуть выполнение. ругань в результирующий файл не попадает, прочитай внимательно. я спецом у себя левых файлов накидал.
2. в PS pdfinfo у меня не завелся. а в cmd grep нет.
. мусор в файл не попадает.
. нафига выеживаться ради одноразовой операции если и так все работает. можно было бы на пайтоне это все сделать, но нафига ТСу ставить пайтон ради того что он запустит один раз. Можно и в подсистеме linux в винде запустит там конечно можно красивее и я там больше шарю, но ему это надо? findstr я спросил у гугля "аналог grep в винде" и гугль мне ответил: "В Windows эквивалентом команды grep является утилита findstr."

ну и на конец на сколько я знаю у ТС все получилось и задача выполнена.

да и ты сам зашел третьего числа в тему кинуть шпалу и покритиковать, мог бы за два дня предложить своё ахуенное решение. я предложил pdfinfo потомучто это никсовая утила которая я знаю что работает и подходит для этой задачи без лишнего гемора.

Это сообщение отредактировал m7k - 5.07.2025 - 21:04
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 1552
0 Пользователей:
Страницы: (2) 1 [2]  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх