SQL Server 2012 - полнотекстовый поиск поверх таблицы - PDF не ищется

pdf sql-server-2012 full-text-search full-text-indexing ifilter

661 просмотра

1 ответ

Я не могу справиться с загрузкой документов Office и PDF с помощью функции SQL Server 2012 FILETABLE, а также с помощью полнотекстового поиска .

Я настроил свой SQL Server для поддержки полнотекстового поиска и файлового потока, и я создал FILETABLE, поместил в папку более 800 документов всех видов, и все это прекрасно работает.

Чтобы иметь возможность полнотекстового индексирования документов MS Office, я установил MS Filter Pack 2.0, а для обработки файлов PDF я скачал iFilter для PDF от Adobe и установил их все.

Сейчас я создал полнотекстовый каталог:

CREATE FULLTEXT CATALOG DocumentCatalog
WITH ACCENT_SENSITIVITY = OFF

а затем полнотекстовый индекс в FILETABLEтаблице:

CREATE FULLTEXT INDEX 
ON dbo.Documents(name, file_type, file_stream)
KEY INDEX [PK_Document]
ON DocumentCatalog

и что все, казалось, работало просто отлично. Через некоторое время, заполнив 800+ имеющихся у меня документов, я могу начать поиск:

SELECT 
    stream_id, name, file_type, cached_file_size, 
    file_stream.GetFileNamespacePath(1)
FROM 
    dbo.Documents
WHERE
    CONTAINS(*, 'Silverlight')

и вещи, которые содержатся в документах MS Office ( *.doc, *.docx, *.ppt, *.pptx, *.xls, *.xlsx), найдены довольно красиво - и быстро.

К сожалению, текст в файлах PDF не найден :-(

Есть идеи почему? У меня не было ошибок во время установки, и все кажется нормально - я вижу .pdfтип файла в FiltersSQL Server:

SELECT *
FROM sys.fulltext_document_types

возвращает:

.pdf    E8978DA6-047F-4E3D-9C78-CDBE46041603    
        C:\Program Files\Adobe\Adobe PDF iFilter 11 for 64-bit platforms\bin\PDFFilter.dll    
        11.0.1.36    Adobe Systems, Inc.

но почему-то эти PDF, похоже, не индексируются. Могу ли я кто-нибудь выяснить, какие файлы были на самом деле проиндексированы, и была ли ошибка при заполнении? Где я могу найти эту информацию?

Автор: marc_s Источник Размещён: 20.08.2019 06:40

Ответы (1)


0 плюса

Мне пришлось использовать Adobe iFilter 9, а не 11.

ftp://ftp.adobe.com/pub/adobe/acrobat/win/9.x/PDFiFilter64installer.zip

Автор: Michael Размещён: 20.08.2019 03:32
Вопросы из категории :
32x32