Постановка задачи: существует большое количество понятий в естественных языках (порядка 500 000, которое нужно отразить в пространство понятий размерностью порядка 50000 измерений.
Можно построить ПП « в лоб» - посадив группу лингвистов за оценку координат основных понятий. Необходимые требования
· мажоритарность принятия решения, каждое понятие должно быть оценено через 3-5 суждений, то есть информацию должны ввести не менее 3 человек, лучше 5.
· Проверка на ошибки по конформности. Общеупотребительные понятия, описанные разными людьми не должны сильно отличаться.
· Ротация специалистов ( ни один человек не сможет адекватно выдержать обработку 30 – 40 тыс понятий).
Временные затраты:
понятий |
200 000 |
200 000 |
суждений |
3 |
5 |
время на 1 суждение, мин |
20 |
20 |
затраты времени, мин |
12 000 000 |
20 000 000 |
затраты времени, чел-мес |
1273,79 |
1456,31 |
время работы 40 чел, мес |
20,53 |
34,22 |
То есть, для создания ПП потребуется за 2-3 года работы. Увеличение штата специалистов позволит ускорить это процесс пропорционально. Целесообразно применение удаленных механизмов работы. Стоимость работ по созданию ПП русского языка составит 48 и 80 млн. руб. соответственно. Стоимость работ по созданию ПП английского языка составит 16 и 25 млн. долл. соответственно.
|