Xpoint
   [напомнить пароль]

парсинг PDF файлов

Метки: [без меток]
2004-09-14 17:31:19 [обр] RainMan[досье]
Здравствуйте!
Расскажите пожалуйста как можно парсить PDF файл? каков алгоритм применяется при этом?
пока не будем привязываться к конкретному языку для реализации... хотелось бы сначала узнать структуру pdf файла и как с ним работать при применении языков программирования.
Спасибо!
спустя 18 минут [обр] Андрей Новиков(16/1242)[досье]
Формат коммерческий, закрытый. Некоторые его изучают и расковыривают, но не думаю, что Вы найдете где-то блюдечко с голубой коемочкой.
спустя 2 минуты [обр] Евгений Бондарев aka Eugene Bond(31/1600)[досье]
спустя 7 минут [обр] RainMan[досье]
ок, поизучаем ссылки для начала...
просто в архиве по PHP нашел что ребята во всю парсят pdf и никаких затруднений это не вызывает... как это они делают не знаю (ссылка в архиве на этом форуме не работала, но автор благодарил за советы :) )
спустя 24 минуты [обр] Алексей В. Иванов(3/2861)[досье]
спустя 13 минут [обр] Андрей Новиков(16/1242)[досье]
Ой, он таки открытый теперь? Круто.
спустя 1 минуту [обр] RainMan[досье]
я не знаю языка PHP поэтому мне сложно из примера, который дал Алексей В. Иванов найти что-то наподобия алгоритма...
нужно что-то более обобщенней... например что приводилось выше... но все равно спасибо!
спустя 10 минут [обр] Алексей В. Иванов(3/2861)[досье]

Андрей Новиков[досье] не знаю насчет закрытости. Вроде он не закрывался (несмело прошепчу). Просто, одно дело электроенные книги в PDF и пр., защищенные документы, другое его публичная часть. Сейчас его сгенировать чем угодно можно - библиотек полно. А вот читать даже Adobe Reader'ом некоторые документы не получается :)

RainMan[досье] Вам на чём pdf разбирать? Вы поищите библиотеки, прежде, чем велосипед изобретать.

спустя 11 минут [обр] Евгений Бондарев aka Eugene Bond(31/1600)[досье]
на http://sourceforge.net есть масса библиотек для всяких разных языков программирования
спустя 18 минут [обр] RainMan[досье]

язык SKILL называется... на нем и планирую написать... там такого нету и быть не может так как язык совсем для другого предназначен и очень специфический... поэтому и требуется алгоритм а потом пойдет реализация, но это другая песня...

я пока ковыряюсь с предоставленными ссылками...

спустя 3 года 6 месяцев [обр] vital[досье]
как создать пдф файл ы добавыть ынфу
Может эстькакойто готов скрипт
спустя 8 дней [обр] Дмитрий Попов(6/509)[досье]
К Ылгоритмав эта иметь какой-нибыл атнешен?
спустя 1 минуту [обр] Дмитрий Попов(6/509)[досье]
М Тьху. Ыто ышо и не афтр тема.
Тут иесть аднин правил: на ыдин вапрс адин тем. сыздайти свой тем в ныжнен рыздел фрма. А то забан!
спустя 22 часа [обр] Валера(0/24)[досье]
Сорри за оффтопик, но Дмитрий Попов - чувства юмора вам не занимать, жжете :)
спустя 2 года 8 месяцев [обр] Yuryi[досье]
сообщение промодерировано
Нашёл в сети PDF парсер и чуть его переписал, сделал классом, если кому надо то вэлкам сюда:
[ссылка удалена]
спустя 1 месяц 28 дней [обр] Евгений Седов aka KPbIC(0/187)[досье]
! Yuryi[досье] Не вижу вашего парсера. Пока получаете предупреждение.
Powered by POEM™ Engine Copyright © 2002-2005