Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

По данным наших экспериментов, точность традиционных методов автоматизации сопоставлений не достигла бы и 25% для номенклатур наших клиентов. Тут нужно не просто анализировать текст, но и понимать его смысл (например, что «укроп» и «зелень» — это очень близкие по значению слова) и исходя из этого делать предположения о схожести номенклатур. С такими задачами отлично справляются языковые модели на основе искусственного интеллекта, а конкретнее — машинного обучения (machine learning, ML).

Что у нас получилось

Теперь DocsInBox будет предлагать вам до трёх вариантов сопоставлений при открытии поля:

Image Modified

Языковая модель анализирует анализирует ваш набор номенклатур, сравнивает их с тем, что прислал поставщик, и на основе этих данных выбирает самые подходящие номенклатуры. DocsInBox подбирает до трёх вариантов самых подходящих по мнению AI номенклатур и выдаём вам в быстрый доступ. Для выбора достаточно просто кликнуть на одну из них. Конечно, возможность найти номенклатуру по-старому, через поиск, никуда не исчезла.

Как это работает

Если не вдаваться в технические и математические особенности, основной смысл заключается в том, чтобы перевести названия номенклатур из букв, понятных человеку, в наборы данных, понятные компьютеру. Компьютер размещает эти данные в векторном пространстве (условно на плоскости координат), где чем ближе расстояние между словами, тем ближе их значение. Далее, обучая нейросеть, мы влияем на эти значения и заставляем языковую модель размещать значения, схожие по смыслу, ближе друг к другу (например, «укроп» и «зелень»). Соответственно, непохожие значения располагаются дальше друг от друга.

...

  • перевести все номенклатуры ресторана в вид, понятный компьютеру;
  • разместить их на графике;
  • сделать то же самое с номенклатурой поставщика;
  • найти в этом пространстве самые близкие понятия.

Image Modified

На качество AI-сопоставлений влияет очень много факторов. Основные — размер справочника номенклатур и количество схожих номенклатур. Если у вас десятки тысяч номенклатур в учётной системе и дублирующиеся позиции, то задача подбора сопоставления значительно усложняется, а вероятность, что AI подберёт нужную номенклатуру, уменьшается.

Это пока только бета-версия наших AI-сопоставлений. Мы анализируем результаты ваших сопоставлений и будем улучшать результаты работы AI, но уже сейчас на большинстве тестовых выборок AI показывает результаты не менее 70% попаданий в топ-3. В планах — использовать языковую модель для категоризации номенклатур, связывания документов и других задач по сравнению разных характеристик документов. Всё, чтобы ваша работа с документами стала ещё удобнее.

Если вам необходимо отключить AI-сопоставления — обратитесь в техподдержку DocsInBox: Как связаться с тех.поддержкой