Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Что это?

Сейчас люди делегируют всё больше задач искусственному интеллекту, или AI (англ. artificial intelligence - искусственный интеллект) - набор технологий, позволяющий реализовывать . AI-технологии позволяют создавать компьютерные программы для решения задач, которые могут выполнять задачи, традиционно считающимися выполнимыми только обычно выполняет человек с помощью своих когнитивных способностей человека. Это позволяет Благодаря AI можно автоматизировать комплексные или творческие задачи, что ранее раньше считалось невозможным. В статье рассказываем, как и для чего внедрили AI в DocsInBox.

...

Проблема сопоставления номенклатур

Одной Одна из повседневных задач в повседневной работе ресторана является сопоставление разного рода номенклатур с справочником ERP ресторана - вам пришло от поставщика "Вино ресторане — сопоставление номенклатур с данными из учётной системы заведения. Например, вам приходит от поставщика «Вино сортовое ординарное сухое красное САПЕРАВИ"САПЕРАВИ», а в вашей учётной системе это просто "Саперави"«Саперави». Чтобы любая учётная система могла понять, что это одно и то же, человек должен ей об этом сообщить.

Автоматизация процесса сопоставления — одна первое равно второму, человеку нужно сообщить ей это. Сопоставления являются одной из ключевых функций DocsInBox - мы . Мы запоминаем ваш выбор по сопоставлению, и таким образом для каждой номенклатуры поставщика в нашей системе нужно это сделать всего 1 раз, далее всё DocsInBox провести его нужно всего один раз — потом сопоставление будет происходить автоматически.

Как автоматизировать сопоставления

...

Мы давно работаем над решением проблемы сопоставления, и есть задачи, которые прорабатываем до сих пор. Например, новые номенклатуры пока нужно сопоставлять вручную, особенно при переходе на нового поставщика. Также иногда нужно сравнивать ряды номенклатур: например,

...

Решая проблему сопоставлений, DocsInBox таки не может сделать это полностью: вам всё ещё придётся сопоставлять новые номенклатуры вручную, особенно если вы переходите на нового поставщика. Более того, в DocsInBox ещё есть множество мест, где необходимо сопоставить один ряд номенклатур с другим, чтобы предоставить более качественный сервис клиенту, не беспокоя его. Например: сопоставить строки УПД с обычной накладной от поставщика, чтобы не требовалось принимать 2 накладных. нужно было принимать два одинаковых документа.

В поисках решений по автоматизации сопоставлений мы испробовали множество способов. Конечно, мы могли бы напрограммировать разработать сложную систему анализа текста ваших номенклатур. Возможно, возможно она даже сработала бы с примером выше, т.к. потому что в обеих номенклатурах фигурирует "саперави"«Саперави». Но как машине понять, что "Укроп «Укроп св." » от поставщика это "Зелень «Зелень в ассортименте" ассортименте» в вашей УСучётной системе? Или что "Контейнер «Контейнер прямоугольный с крышкой" крышкой» поставщика — это ваши «Хозтовары»?

По данным это "Хоз.товары" в вашей учётной системе? По результатам наших экспериментов, точность традиционных методов автоматизации сопоставлений не достигла бы и 25% для номенклатур наших клиентов. Тут нужен другой подход, нужно не просто анализировать текст, но и понимать его смысл : понимать(например, что "укроп" и "зелень" «укроп» и «зелень» — это очень близкие по семантике значению слова) и исходя из этого сделать предположение делать предположения о схожести номенклатур. Именно с С такими задачами сейчас отлично справляются языковые модели на основе искусственного интеллекта (AI), а конкретнее машинного обучения (machine learning, ML).

Что у нас получилось

...

Теперь DocsInBox будет предлагать вам до 3 трёх вариантов сопоставлений при открытии поля:

Эти сопоставления подобраны на основе анализа языковой моделью вашего набора номенклатур и сравнения Языковая модель анализирует анализирует ваш набор номенклатур, сравнивает их с тем, что прислал поставщик. Мы подбираем до 3 вариантов наиболее , и на основе этих данных выбирает самые подходящие номенклатуры. DocsInBox подбирает до трёх вариантов самых подходящих по мнению AI номенклатуры номенклатур и выдаём вам в быстрый доступ, для . Для выбора достаточно просто кликнуть на одну из них. Конечно же, никуда не исчезла и возможность найти номенклатуру по-старому, через поиск.

Это пока только бета-версия наших AI-сопоставлений, мы анализируем результаты ваших сопоставлений и в дальнейшем планируем улучшить результаты выдачи AI вариантов сопоставлений, но уже сейчас на большинстве тестовых выборок AI показывает результаты не менее 70% попаданий в топ-3.

...

, никуда не исчезла.

Как это работает

...

Опуская Если не вдаваться в технические и математические особенности, основной смысл заключается в том, чтобы перевести названия номенклатур из букв, понятных человеку букв , в наборы данных, понятные компьютеру наборы данных. Компьютер размещает эти данные в векторном пространстве (условно на плоскости координат), где чем ближе расстояние между словами, тем ближе их семантическое значение. Далее, обучая нейронную сетьнейросеть, мы влияем на эти значения , заставляя и заставляем языковую модель размещать ближе значения близкие , схожие по смыслу, ближе друг к другу (например, "укроп" и "зелень") и «укроп» и «зелень»). Соответственно, непохожие значения располагаются дальше друг от друга непохожие.Обучив нейронную сеть,

После обучения нейросети мы можем:

  • перевести все номенклатуры ресторана в вид, понятный компьютеру

...

  • ;
  • разместить их на графике

...

  • ;
  • сделать то же самое с номенклатурой поставщика

...

  • ;
  • найти в этом пространстве

...

  • самые близкие понятия.

На качество AI-сопоставлений влияет очень много факторов. Основные — размер справочника номенклатур и количество схожих номенклатур. Если у вас десятки тысяч номенклатур в учётной системе и дублирующиеся позиции, то задача подбора сопоставления значительно усложняется, а вероятность, что AI подберёт нужную номенклатуру, уменьшается.

Это пока только бета-версия наших AI-сопоставлений. Мы анализируем результаты ваших сопоставлений и будем улучшать результаты работы AI, но уже сейчас на большинстве тестовых выборок AI показывает результаты не менее 70% попаданий в топ-3. В планах — использовать языковую модель для категоризации номенклатур, связывания документов и других задач по сравнению разных характеристик документов. Всё, чтобы ваша работа с документами стала ещё удобнее.