База знаний

Как включить поиск в файлах

ID статьи: 224
Последнее обновление: 1 мар., 2018

Текстовый поиск в файлах/индексирование файлов формата txt, html и др., включен по умолчанию. Для включения поиска в файлах формата PDF или Word, выполните действия, описанные ниже.

Поиск в PDF файлах

Для включения поиска в PDF файлах:

  • Установите программу XPDF.
  • В разделе Настройки укажите папку установки XPDF.
  • Убедитесь, что PHP имеет доступ к папке установки XPDF. Для этого проверьте параметр PHP open_basedir в конфигурационном файле php.ini.
  • Убедитесь, что в PHP функция system вызывается корректно. Для этого проверьте параметры PHP disable_functions, safe_mode_exec_dir в конфигурационном файле php.ini.

Установка XPDF

  • Программа XPDF доступна для скачивания на сайте www.foolabs.com/xpdf/download.html
  • Выберите программу в соответствии со своей операционной системой и разрядностью, скачайте и установите ее на компьютер.

Задание директории XPDF

После установки программы, в Панели администратора укажите директорию XPDF. Для этого:

  • Откройте раздел Настройки.
  • Перейдите на вкладку Администрирование.
  • В разделе Файлы в поле Путь к XPDF введите путь до папки установки XPDF.
  • Проверьте правильность указания строки. Примеры: /usr/local/bin/ или c:/wwwroot/xpdf/
  • Нажмите кнопку Сохранить. В результате происходит анализ/индексация тестового PDF файла. В случае возникновения ошибки откроется соответствующее сообщение. 

Проверка XPDF из командной строки

Проверьте работу XPDF, выполнив следующую команду из командной строки:

$ /path_to_xpdf/pdftotext -raw file_read.pdf file_write.txt;

Проверьте работу XPDF, выполнив команду из командной строки, используя PHP и приложенный тестовый файл:

$ cd /path/to/kbp_directory
$ php -r "system('/path_to_xpdf/pdftotext -raw admin/extra/file_extractors/extract_test.pdf file_write.txt');"

Поиск в файлах Word 2007/2010, Excel 2007/2010 или Open Office

Для включения поиска в файлах с расширением .docx, .xslx и .odt выполните следующее:

  • Если на компьютере отсутствует расширение PHP Zip, то установите его.
  • В Панели администратора можно проверить, установлено ли расширение PHP Zip или нет. Проверка выполняется на вкладке Тесты раздела Главная.

Поиск в файлах Word версии 2003 и ниже

 Для включения поиска в файлах Word:

  • Установите программу Catdoc или Antiword.
  • В разделе Настройки укажите папку установки программы.
  • Убедитесь, что PHP имеет доступ к папке установки Catdoc. Для этого проверьте параметр PHP open_basedir в конфигурационном файле php.ini.
  • Убедитесь, что в PHP функция exec вызывается корректно. Для этого проверьте параметры PHP disable_functions, safe_mode_exec_dir в конфигурационном файле php.ini

Установка Сatdoc

Установка Antiword

  • Программа Antiword доступна для скачивания на сайте http://www.winfield.demon.nl/
  • Скачайте и установите программу на компьютер.

Задание директории Catdoc

После установки Catdoc, в Панели администратора укажите путь к папке установки программы. Для этого:

  • Откройте раздел Настройки.
  • Перейдите на вкладку Администрирование.
  • В разделе Файлы в поле Путь к Catdoc введите путь до папки установки Catdoc.
  • Проверьте правильность указания строки. Примеры: /usr/local/bin/ или c:/wwwroot/catdoc/
  • Нажмите кнопку Сохранить. В результате происходит анализ/индексация тестового PDF файла. В случае возникновения ошибки откроется соответствующее сообщение. 

Проверка Catdoc из командной строки

Проверьте работу Catdoc, выполнив следующую команду из командной строки:

$ /path_to_catdoc/catdoc -w file_read.doc;

Проверьте работу Catdoc, выполнив команду из командной строки, используя PHP и приложенный тестовый файл:

$ cd /path/to/kbp_directory 
$ php -r "system('/path_to_catdoc/catdoc -w admin/extra/file_extractors/extract_test.doc');"


Проверка Antiword из командной строки

Проверьте работу Antiword, выполнив следующую команду из командной строки:

$ /path_to_ antiword/antiword -t file_read.doc;

Проверьте работу Antiword, выполнив команду из командной строки, используя PHP и приложенный тестовый файл:

$ cd /path/to/kbp_directory 
$ php -r "system('/path_to_ antiword/antiword -t admin/extra/file_extractors/extract_test.doc');"

Отключение поиска в файлах PDF или Word

Для отключения функции поиска в файлах формата PDF или Word, в поле Путь к Catdoc или Путь к XPDF установите значение off и сохраните изменение. 

Эта статья была:   Полезна | Не полезна
ID статьи: 224
Последнее обновление: 1 мар., 2018
Ревизия: 10
Доступ: Открытый доступ
Просмотры: 16366
Комментарии: 0
Теги

Также опубликовано в

Внешние ссылки