Блог

Как создать эффективный поисковой механизм в корпоративной базе знаний. Разбираемся на примере InKnowledge

Ключевая задача базы знаний — не просто собирать и хранить данные, а делать так, чтобы сотрудники, клиенты, партнеры или виртуальные помощники быстро находили нужную информацию. Это помогает оперативно решать рабочие задачи, упрощает бизнес-процессы и взаимодействие между командами. Наконец, именно от качества поиска зависит, будут сотрудники пользоваться системой или нет.

В статье расскажем, какие особенности структуры базы знаний и механизмы поиска повысят релевантность и скорость поиска, и на примерах InKnowledge продемонстрируем, как они работают.

Как организовать структуру базы знаний, чтобы поиск был релевантным

Релевантность — хорошо известная концепция в поисковых системах, которая применяется и в корпоративных системах управления знаниями (СУЗ). Чтобы результаты поиска в базе знаний были релевантны задачам, её структура должна соответствовать опыту компании и сотрудников в работе с данными.

А для этого важно понять, какой он — этот реальный опыт и как его можно улучшить.

В первую очередь нужно провести аудит информационного пространства, собрать требования от сотрудников, прописать типовые сценарии поиска в системах, которыми уже пользуется компания.
После расписать, как будет систематизирована информация внутри платформы:
  • разбить контент по направлениям, классифицировать;
  • создать иерархию контента;
  • разметить типы и форматы;
  • использовать вспомогательные элементы, которые помогут еще более точно понять, что содержится в документе.
Сама платформа, на которой вы строите базу знаний, должна быть гибкой, иметь возможность адаптироваться к потребностям и особенностям информационной работы в компании, а не диктовать вам свои правила.
Пример иерархической структуры базы знаний
Пример иерархической структуры базы знаний
Пример иерархической структуры базы знаний

Для большего удобства можно сформировать разделы, которые будут объединять документы, связанные с конкретными бизнес-процессами или работой департамента. Например, вопросы по HR-направлению: начисление заработной платы, оформление отпуска, общие регламенты и инструкции. Цель — упростить доступ к информации, чтобы искать ее в конкретном разделе, а не по всей базе знаний.
Пример витрины в Базе знаний
Пример витрины
Следующий шаг — разработать методологию описания контента, который будет помогать поисковому механизму находить релевантные документы, а людям — быстрее разбираться в результатах поиска. Здесь будут полезны следующие функции:
  • аннотации к документам — краткое содержание;
  • альтернативные заголовки, по которым могут искать документ;
  • оценка релевантности поиска пользователями.
Пример описания документа с категориями, тегами, альтернативным заголовком
Пример описания документа с категориями, тегами, альтернативным заголовком
По нашему опыту качественная методология повышает скорость поиска по базе знаний на 20%, а значит, экономит время и силы сотрудников. Структура базы знаний должна быть понятной, чтобы сотрудники минимально пользовались поисковой строкой, находили нужную информацию с помощью фильтров, как в интернет-магазине — выбирая нужный раздел, теги, тип материала и так далее.

Какими качествами должен обладать поиск в базе знаний

  1. Искать не только по заголовкам или названиям документов, но и по их содержанию. Работать с картинками, видео и другими нетекстовыми форматами.
  2. Учитывать ролевую модель — адаптировать поисковые результаты к роли сотрудника, ограничить доступ к информации в соответствии с регламентами и требованиями безопасности.
  3. Обладать функцией фильтрации по категориям, тегам, типам контента и документов, датам публикаций, авторам и так далее. Причем фильтр должен быть настроен таким образом, чтобы пользователю было понятно, к чему приведет клик по той или иной кнопке.
  4. Предоставлять развернутый ответ на вопрос, а не просто ссылки. Например, при запросе «как изменить срок оплаты по кредиту», будет удобно получить конкретный ответ или инструкцию, а не список документов, где эта информация хранится.
  5. Учитывать морфологию языка, возможные опечатки и неправильную раскладку, синонимы.

Классические механизмы поиска в InKnowledge

Полнотекстовый поиск по заголовкам, содержанию документов, картинками, PDF и другим файлам

В нашей платформе реализован полнотекстовый поиск: при обработке запроса система находит совпадения в заголовках документов и в их содержании. При выводе результатов показывает сегмент текста с выделенным поисковым запросом, чтобы пользователь смог оценить релевантность благодаря контексту и не тратить лишнее время на изучение всех ссылок.
Визуализация результатов поиска в InKnowledge
Визуализация результатов поиска в InKnowledge
Поиск работает не только с документами, но и с картинками, PDF-файлами и видео.

В системе есть специальные поля для расширенного описания: заголовок, аннотация и другие. Картинку можно снабдить тегами и привязать к классификатору, так она станет более наполненным информационным объектом, и ее легко будет найти по текстовому описанию.

Поисковый механизм учитывает морфологию русского языка — помимо прямого вхождения слова, понимает и его словоформы, учитывает синонимы. И разумеется, даже есть вы написали запрос с ошибками, опечатками или в неверной раскладке, система это учтет и даст корректный ответ на вопрос.

Фильтрация по категориям, тегам и другим атрибутам

Чтобы сузить результаты поиска и сэкономить время, используем фильтры. Основной фильтр — по категориям.
Поисковый запрос в Базу знаний
Простой запрос в Базу знаний. Найдено 54 статьи
Фильтр по категориям
Тот же запрос с применением фильтра по категориям. Найдено 6 статей

Другой инструмент — фильтрация по тегам.
Тот же запрос, применены теги. Остался 1 вариант
Тот же запрос, применены теги. Остался 1 вариант
Также можно использовать расширенные параметры поиска — атрибуты, которые система присваивает документам при их размещении: авторы, даты, типы контента и т. д.
Атрибуты расширенного поиска
Атрибуты расширенного поиска

Витрины для ограничения поиска по разделам или ролям

Зачастую искать информацию по всей базе знаний, даже с применением фильтров, — не самый эффективный подход. Чтобы люди не путались в информации и не тратили лишнее время, в InKnowledge есть тематические витрины. Это те самые разделы с контентом, в которых собрана информация по тематике. Для каждой витрины можно настроить свои правила отображения результатов поиска таким образом, чтобы показывались только определенные виды контентов или документов.
Поиск по витрине на примере карточек экспертов
Поиск по витрине на примере карточек экспертов
Пример учета естественного языка в запросе. Быстрый ответ отобразился и по запросу, который не был указан при его создании
Тот же запрос, но уже в поиске по всей Базе знаний
Для создания витрины нужно определить тип документов, которые в ней будут представлены, настроить шаблоны, иерархию. Поиск работает в самой витрине так же, как и в общей поисковой строке, только он заведомо ограничен правилами раздела.

Быстрые ответы

Иногда сотрудникам нужно получить развернутый ответ, а не просто список документов со ссылками. Такой функционал особенно полезен сотрудникам колл-центров, отдела продаж или технической поддержки — данные нужно предоставить быстро, чтобы клиент не ждал на линии.

Для этого существуют быстрые ответы — небольшие заметки с информацией по конкретному вопросу. Контент для них создается вручную.
Пример учета естественного языка в запросе. Быстрый ответ отобразился и по запросу, который не был указан при его создании
Создание быстрого ответа в системе
Поисковый механизм учитывает естественный язык запроса и предложит нужный ответ, даже если пользователь задал вопрос не в точном соответствии с тем, как он прописан в самой форме быстрого ответа.
Пример учета естественного языка в запросе. Быстрый ответ отобразился и по запросу, который не был указан при его создании
Пример учета естественного языка в запросе. Быстрый ответ отобразился и по запросу, который не был указан при его создании

Обогащение поиска возможностями ИИ

Чтобы функция поиска работала лучше, в платформе используется искусственный интеллект.

ИИ в помощь редактору

При создании контента подключается суммаризатор, который анализирует документ и генерирует аннотацию с кратким содержанием и объяснением того, что написано в тексте. Еще ИИ может сделать рерайт, изложить контент другим языком, поправить стилистику или сократить документ.

Вторая механика — рекомендации ИИ по категории контента. Искусственный интеллект анализирует текст и описание категорий, заложенных в структуру базы знаний, и формирует предложения — к какому разделу отнести текст. Учитывает не только верхнеуровневые категории, но и вложенные, то есть идет по всей иерархической структуре.

Как работает ИИ поиск

При ИИ-поиске применяется RAG (Retrieval Augmented Generation) — технология, которая объединяет в себе возможности поиска информации и генерации текста.

Для пользователя результат работы ИИ выглядит так же, как и быстрые ответы в классическом поиске: полноценная заметка, а не список со ссылками. Помимо этого, искусственный интеллект можно попросить выдать информацию в виде списка, инструкции, регламента или развернутой статьи.

Массив данных, который ИИ анализирует для генерации ответа, формируется динамически:
  • с учетом прав конкретного пользователя;
  • с учетом контекста, из которого происходит обращение к ИИ — из раздела, категории, содержания конкретного документа.
Пример взаимодействия с ИИ помощником в Базе знаний
Пример взаимодействия с ИИ помощником в Базе знаний
Важно отметить, что ИИ учитывает ролевую модель пользователя и ее ограничения, то есть не станет причиной утечки информации.

Сейчас в InKnowledge поиск ведется по всей базе знаний. В ближайшее время планируем внедрять ограничения, чтобы можно было указать ИИ корпус данных, откуда он будет черпать информацию для ответов.

Для того, чтобы работать с ИИ не обязательно заходить в саму базу знаний. Запрашивать информацию можно и через привычные каналы: сайт, CRM-систему, мобильное приложение, корпоративный мессенджер, интегрированные с ней.

И еще раз про релевантность

Доступные на рынке инструменты часто предлагают один жестко зафиксированный алгоритм расчета соответствия запросу. Например, наибольший вес имеет заголовок документа или количество упоминаний в тексте поискового запроса.

Но потребности бизнеса могут быть шире и разнообразнее. Кто-то хочет выстраивать приоритет по заголовкам, для кого-то важна принадлежность к категориям, а кому-то важно показывать пользователю самый популярный контент — тогда приоритет должен считаться по количеству просмотров. А иногда нужно, чтобы какую-то статью обязательно увидели все сотрудники, которые будут искать документы по запросу. Значит, для такой статьи нужно присвоить вес и приоритет в показе, чтобы она всегда появлялась в верхней строке результатов поиска.
Другими словами, важно, чтобы и в этом аспекте система подстраивалась под процессы и потребности бизнеса.

Резюмируем

Описанные нами требования к структуре и механики поиска действительно приносят пользу бизнесу.

Например, банк AVO из Узбекистана меньше чем за год работы с платформой добился того, что 93% материалов в выдаче соответствуют поисковому запросу. Благодаря этому средний срок консультации с клиентами сократился с 5-7 до 2-3 минут.

Специалисты контактного-центра компании Комус после внедрения базы знаний стали быстрее обрабатывать клиентские заявки, а новички легче адаптироваться — на 30% сократилась текучка за счет того, что нужную информацию находить гораздо проще.

Организация качественного поиска информации — один из ключевых способов повышения эффективности работы сотрудников, поэтому важно, чтобы платформа, на базе которой вы внедряете управление знаниями, предоставляла богатый и гибкий набор инструментов для улучшения этого процесса.