Способ и устройство определения коэффициента правильного распознавания - RU2016135372A

Код документа: RU2016135372A

Формула

1. Способ определения коэффициента правильного распознавания, содержащий этапы, на которых:
получают строку символов, получаемую при распознавании голоса, и стандартный результат распознавания, соответствующий строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;
делят строку символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяют в элемент распознавания;
вычисляют кратчайший вариант расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;
получают оптимальный результат совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и
определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.
2. Способ по п. 1, в котором на этапе деления строки символов согласно типу символов в строке символов для генерирования последовательности символов:
для любого символа в строке символов, если тип упомянутого любого символа является китайским иероглифом, определяют упомянутый любой символ в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определяют упомянутый любой символ в качестве элемента распознавания, в противном случае определяют местоположение двух ближайших символов пробела относительно упомянутого любого символа соответственно и определяют все символы между обнаруженными двумя символами пробела в качестве элемента распознавания;
сортируют соответственно определенные элементы распознавания согласно положениям определенных элементов распознавания в строке символов; и
определяют отсортированные элементы распознавания в качестве последовательности символов.
3. Способ по п. 2, в котором на этапе вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания:
создают двумерную сетку, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;
подсчитывают количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующем данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент сетки, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;
добавляют подсчитанное количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;
выбирают элемент сетки в последней строке и последнем столбце двумерной сетки и определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и
определяют количество случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.
4. Способ по п. 3, в котором на этапе получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания:
выполняют для каждого элемента сетки в двумерной сетке операции, на которых:
определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определяют количество случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получают указатель поиска с возвратом, соответствующий определенному типу ошибки;
определяют набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и
определяют определенный набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.
5. Способ по п. 4, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания:
получают тип ошибки, соответствующий каждому отношению совмещения в наборе отношений совмещения, и количество случаев упомянутого типа ошибки; и
определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.
6. Способ по п. 5, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения:
выбирают отношение соответствия китайских иероглифов в наборе отношений совмещения, причем отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисляют долю количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и
выбирают отношения соответствия фонетических символов в наборе отношений совмещения, причем отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисляют долю количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.
7. Устройство определения коэффициента правильного распознавания, содержащее:
блок получения, выполненный с возможностью получения строки символов, получаемой при распознавании голоса, и стандартного результата распознавания, соответствующего строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;
блок генерации последовательности, выполненный с возможностью деления строки символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяются в элемент распознавания;
блок вычисления, выполненный с возможностью вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;
блок определения оптимального результата совмещения, выполненный с возможностью получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и
блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.
8. Устройство по п. 7, в котором блок генерации последовательности выполнен с возможностью:
для любого символа в строке символов, когда тип символа упомянутого любого символа является китайским иероглифом, определения упомянутого любого символа в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определения упомянутого любого символа в качестве элемента распознавания, в противном случае определения местоположения двух ближайших символов пробела относительно упомянутого любого символа соответственно, и определения всех символов между обнаруженными двумя символами пробела в качестве элемента распознавания;
сортировки соответственно определенных элементов распознавания согласно положениям определенных элементов распознавания в строке символов; и
определения отсортированных элементов распознавания в качестве последовательности символов.
9. Устройство по п. 8, в котором блок вычисления выполнен с возможностью:
создания двумерной сетки, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;
подсчета количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующего данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;
добавления подсчитанного количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;
выбора элемента сетки в последней строке и последнем столбце двумерной сетки и определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и
определения количества случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.
10. Устройство по п. 9, в котором блок определения оптимального результата совмещения выполнен с возможностью:
выполнения для каждого элемента двумерной сетки операций:
определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определения количества случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получение указателя поиска с возвратом, соответствующего типу ошибки;
определения набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и
определения определенного набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.
11. Устройство по п. 10, в котором блок определения коэффициента правильного распознавания выполнен с возможностью:
получения типа ошибки, соответствующего каждому отношению совмещения в наборе отношений совмещения, и количества случаев упомянутого типа ошибки; и
определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.
12. Устройство по п. 11, в котором блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения, выполнен с возможностью:
выбора отношения соответствия китайских иероглифов в наборе отношений совмещения, при этом отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисления доли количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и
выбора отношения соответствия фонетических символов в наборе отношений совмещения, при этом отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисления доли количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.

Авторы

Заявители

СПК: G06F40/279 G10L15/005 G10L15/01 G10L15/10 G10L15/28

Публикация: 2018-03-07

Дата подачи заявки: 2016-05-13

0
0
0
0
Невозможно загрузить содержимое всплывающей подсказки.
Поиск по товарам