Слишком много повторяющихся элементов

  • 17 Views
  • Last Post 8 hours ago
qimby posted this 4 days ago

Нужен совет. В гибком описании есть группа повторяющихся элементов, во всех документах где этих элементов относительно немного (до 300шт. примерно), они обнаруживаются отлично, но если их больше, то дальнейшее обнаружение прекращается. В дереве гипотез видно, что он обнаружил 300 элементов успешно, а дальше ничего, никаких ошибок. В итоге документ не классифицируется и даже те элементы что обнаружились не высвечиваются.

Я так понимаю, что просто снижается chain quality до недопустимого минимум, из-за не обнаруженных необязательных элементов, но если я выставляю им null hypothesis quality равной единице, то вообще ни одного элемента не обнаруживается в этой группе.

Подскажите пожалуйста, может кто с примерным сталкивался.

Спасибо.

Order By: Standard | Newest | Votes
AlexeyEfremov posted this 3 days ago

Добрый день,

Причины может быть две.

1. В повторяющейся группе есть несколько опциональных элементов. И когда много из них не найдено, предположение о том что элемент группы не найден - выигрывает.

2. Общее число гипотез и под-гипотез элемента ограничено 10000. Нужно пройтись по древу гипотез и посмотреть где чаше всего встречаются "вилки" и, например, ограничить области поиска.

Если эти советы не помогут - выложите пожалуйста ваше гибкое, мы посмотрим. Если данные конфиденциальны - лучше всего обратиться в региональный саппорт.

С уважением,

Алексей

 

 

 

  • Liked by
  • qimby
qimby posted this 8 hours ago

Спасибо большое за ответ!

Да, в каждом инстансе этой группы всегда есть несколько опциональных элементов которые не найдены. Так что сразу вопрос, можно ли сделать чтоб не было штрафа за не обнаружение этих элементов? И ещё, когда я делаю повторяющуюся группу опциональным элементом, то обнаружение не осуществляется, хотя когда стоит как обязательный элемент, то всё работает? Ответы на эти вопросы мне бы очень помогли.

Спасибо.

Close