<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/css" href="http://wiki2.linuxformat.ru/skins/common/feed.css?97"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://wiki2.linuxformat.ru/index.php?action=history&amp;feed=atom&amp;title=LXF117%3A%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82</id>
		<title>LXF117:Компьютер слушает - История изменений</title>
		<link rel="self" type="application/atom+xml" href="http://wiki2.linuxformat.ru/index.php?action=history&amp;feed=atom&amp;title=LXF117%3A%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82"/>
		<link rel="alternate" type="text/html" href="http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;action=history"/>
		<updated>2026-05-13T20:09:50Z</updated>
		<subtitle>История изменений этой страницы в вики</subtitle>
		<generator>MediaWiki 1.11.1</generator>

	<entry>
		<id>http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10196&amp;oldid=prev</id>
		<title>Crazy Rebel: /* Русский сфинкс */</title>
		<link rel="alternate" type="text/html" href="http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10196&amp;oldid=prev"/>
				<updated>2010-05-17T09:07:35Z</updated>
		
		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Русский сфинкс&lt;/span&gt;&lt;/p&gt;

			&lt;table style=&quot;background-color: white; color:black;&quot;&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;tr&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;Версия 09:07, 17 мая 2010&lt;/td&gt;
			&lt;/tr&gt;
		&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 71:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 71:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;качеству распознавания речи английской.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;качеству распознавания речи английской.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt; &lt;/del&gt;Для тестирования распознавания русского языка в ''Sphinx 3'' мы воспользуемся акустическими моделями и словарями с сайта VoxForge ([[LXF116:Компьютер_слушает!|LXF116]]): их можно взять с LXFDVD. В результате распаковки у вас появится директория '''AcousticModels''' с несколькими&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;Для тестирования распознавания русского языка в ''Sphinx 3'' мы воспользуемся акустическими моделями и словарями с сайта VoxForge ([[LXF116:Компьютер_слушает!|LXF116]]): их можно взять с LXFDVD. В результате распаковки у вас появится директория '''AcousticModels''' с несколькими&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;подкаталогами. Соответствующие строки в файле конфигурации ''Sphinx 3'' будут выглядеть так:&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;подкаталогами. Соответствующие строки в файле конфигурации ''Sphinx 3'' будут выглядеть так:&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Crazy Rebel</name></author>	</entry>

	<entry>
		<id>http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10195&amp;oldid=prev</id>
		<title>Crazy Rebel: викификация, оформление, иллюстрация</title>
		<link rel="alternate" type="text/html" href="http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10195&amp;oldid=prev"/>
				<updated>2010-05-17T09:07:16Z</updated>
		
		<summary type="html">&lt;p&gt;викификация, оформление, иллюстрация&lt;/p&gt;

			&lt;table style=&quot;background-color: white; color:black;&quot;&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;tr&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;Версия 09:07, 17 мая 2010&lt;/td&gt;
			&lt;/tr&gt;
		&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 118:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 118:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;===''Simon''===&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;===''Simon''===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;nbsp;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;nbsp;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;{{Врезка|Содержание=[[Изображение:LXF117_45_1.jpg|300px]]''Simon'' готов тренироваться. Вы установили'' HTK''?|Ширина=300px}}&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;Проект ''Simon'', работа над которым началась еще в 2007 году,&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;Проект ''Simon'', работа над которым началась еще в 2007 году,&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;до сих пор находится на стадии альфа-версии. Simon &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;демонстри-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;до сих пор находится на стадии альфа-версии. &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Simon&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' демонстрирует &lt;/ins&gt;нам несколько интересных решений и один серьезный &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;недостаток&lt;/ins&gt;, который является следствием того, что в проекте &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;используется &lt;/ins&gt;движок &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Julius&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;. В своем нынешнем виде &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Simon&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' &lt;/ins&gt;не готов к распознаванию речи без индивидуального построения &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;языковых &lt;/ins&gt;моделей, а для этого приходится использовать &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;инструментарий ''&lt;/ins&gt;HTK&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;, который, в силу лицензионных ограничений, нельзя &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;распространять &lt;/ins&gt;вместе с основным пакетом. После установки &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Simon&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' &lt;/ins&gt;вам еще придется регистрироваться на сайте &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;HTK&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;, загружать и устанавливать соответствующие программы. Возможно, в &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;будущем &lt;/ins&gt;разработчикам &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Simon&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' &lt;/ins&gt;удастся создать систему &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;голосового &lt;/ins&gt;управления, которая будет работать «прямо из коробки», &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;тогда &lt;/ins&gt;без &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;HTK&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' &lt;/ins&gt;можно будет обойтись; однако, как показывает опыт &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;''&lt;/ins&gt;Dragon Naturally Speeking&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;'' &lt;/ins&gt;(а это самое успешное на сегодня &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;средство &lt;/ins&gt;распознавания слитной речи), в системах диктовки &lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;компьютеру не обойтись без перенастройки моделей, а значит, лицензионные ограничения ''HTK'' могут стать фатальными для ''Simon'' и ''Julius''. К достоинствам ''Simon'' следует отнести распределенную&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;рует &lt;/del&gt;нам несколько интересных решений и один серьезный &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;не-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;структуру приложения.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;достаток&lt;/del&gt;, который является следствием того, что в проекте &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;ис-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;пользуется &lt;/del&gt;движок Julius. В своем нынешнем виде Simon не готов&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;Распознаванием речи управляет демон ''ksimond'', который взаимодействует с оболочкой, используя TCP/IP. Таким образом, вычислительно сложные операции распознавания речи могут выполняться на отдельном сервере, клиентская же часть может быть размещена на устройствах небольшой производительности, в том&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;к распознаванию речи без индивидуального построения &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;языко-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;числе на мобильных. Если вы захотите попробовать ''Simon'' в работе, учтите, что в настоящее время программа предлагает тренировочные тексты только на немецком языке.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;вых &lt;/del&gt;моделей, а для этого приходится использовать &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;инструмента-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;рий &lt;/del&gt;HTK, который, в силу лицензионных ограничений, нельзя &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;рас-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;При сегодняшнем состоянии открытых разработок в области распознавания речи появление открытой системы голосового управления рабочим столом (а также другими программами и устройствами) и вообще систем распознавания отдельных слов – дело самого ближайшего будущего (''Gnome Voice Control'' уже сейчас может многое). Что касается распознавания слитной речи, то в этой области все далеко не так радужно, но не безнадежно. Практически приемлемые коммерческие системы распознавания слитной речи существуют уже лет десять. В связи с распространением карманных устройств потребность в них будет&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;пространять &lt;/del&gt;вместе с основным пакетом. После установки Simon&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;возрастать, а значит, будет обостряться и конкуренция.&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;вам еще придется регистрироваться на сайте HTK, загружать&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;и устанавливать соответствующие программы. Возможно, в &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;бу-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;В настоящее время с технологиями распознавания речи для мобильных устройствактивно экспериментирует Google. Правда, речь идет не о самостоятельном мобильном приложении, а о сервисе Google, доступном устройству, имеющему широкополосный доступ к Сети (в конце концов, это же Google). Учитывая благожелательное отношение компании к открытому ПО, можно надеяться, что в будущем разработчики открытых программ тоже получат доступ к API сервиса. В свое время, исследования в области распознавания речи также вели и многие другие компании. Возможно, одна из этих фирм со временем откроет свои&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;дущем &lt;/del&gt;разработчикам Simon удастся создать систему &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;голосово-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;технологии, точно так же как компания Hewlett&lt;/ins&gt;-&lt;ins style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;Packard открыла движок распознавания текста ''tesseract''. В любом случае, я уверен, что в скором времени стиль общения человека с компьютером изменится. '''LXF'''&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;го &lt;/del&gt;управления, которая будет работать «прямо из коробки», &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;тог-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;да &lt;/del&gt;без HTK можно будет обойтись; однако, как показывает опыт&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;Dragon Naturally Speeking (а это самое успешное на сегодня &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;сред-&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;-&lt;/td&gt;&lt;td style=&quot;background: #ffa; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;ство &lt;/del&gt;распознавания слитной речи), в системах диктовки &lt;del style=&quot;color: red; font-weight: bold; text-decoration: none;&quot;&gt;компью&lt;/del&gt;-&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Crazy Rebel</name></author>	</entry>

	<entry>
		<id>http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10193&amp;oldid=prev</id>
		<title>Crazy Rebel: Новая: ==Сфинксов не кормить!==  {{Цикл/СРР}}  : '''Часть 2''': Ситуация с системами распознавания речи в Linux в чем-то ...</title>
		<link rel="alternate" type="text/html" href="http://wiki2.linuxformat.ru/index.php?title=LXF117:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10193&amp;oldid=prev"/>
				<updated>2010-05-17T08:55:27Z</updated>
		
		<summary type="html">&lt;p&gt;Новая: ==Сфинксов не кормить!==  {{Цикл/СРР}}  : '''Часть 2''': Ситуация с системами распознавания речи в Linux в чем-то ...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая статья&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==Сфинксов не кормить!==&lt;br /&gt;
&lt;br /&gt;
{{Цикл/СРР}}&lt;br /&gt;
&lt;br /&gt;
: '''Часть 2''': Ситуация с системами распознавания речи в Linux в чем-то стандартная для Open Source: их много, но не все они работают. '''Андрей Боровский''' разбирается, на что способны лучшие экземпляры.&lt;br /&gt;
&lt;br /&gt;
На первый взгляд может показаться, что программ распознавания речи для Linux не так уж и мало — Википедия упоминает десяток открытых проектов. Однако радоваться рановато. Многие из них, например, ''cvoicecontrol'' и ''Open Mind'', взяли хороший старт несколько лет назад, но затем были заброшены своими основателями, а новые разработчики так и не подхватили инициативу. Сказывается, видимо, высокий порог вхождения.&lt;br /&gt;
&lt;br /&gt;
Другие проекты представляют собой оболочки к открытым движкам распознавания речи, работа над которыми далека от завершения. Фактически, таких движков существует только два, причем у одного из них есть скрытые лицензионные ограничения.&lt;br /&gt;
&lt;br /&gt;
С другой стороны, все не так уж и плохо. Открытые системы уже сейчас готовы к распознаванию голосовых команд на компьютерах конечных пользователей, и есть надежда, что в течение нескольких лет мы увидим также открытые системы распознавания слитной речи. Да и не боги горшки обжигают. Вы, наверное, помните эпическую фразу «Dear Aunt, let’s set so double the killer delete select all», которую будущая Windows Vista выдала на презентации встроенных в ОС средств распознавания речи в 2006 году. Так что если сегодня средства распознавания речи для&lt;br /&gt;
Linux отстают от коммерческих аналогов, это не повод для уныния. На уровне работающей модели такие системы уже существуют. Осталось приложить немного усилий для того, чтобы они смогли работать в реальном мире. В этом обзоре мы не станем останавливаться на многообещающих проектах прошлого (хотя, кто&lt;br /&gt;
знает: может быть, какой-то из них и будет возрожден). Мы рассмотрим только те программы, которые работают уже сейчас, либо должны заработать в ближайшем будущем.&lt;br /&gt;
&lt;br /&gt;
===''CMU Sphinx''===&lt;br /&gt;
&lt;br /&gt;
''Sphinx'' – самый известный и наиболее работоспособный открытый движок распознавания речи на сегодняшний день. Разработка в основном ведется в университете Карнеги-Меллона, хотя в разное время к проекту подключались также Массачусетский&lt;br /&gt;
технологический институт и корпорация Sun Microsystems. Движок ''Sphinx'' (http://cmusphinx.sourceforge.net) распространяется на условиях лицензии BSD и доступен как для коммерческого, так и для некоммерческого использования. Как и все существующие сегодня открытые инструменты распознавания речи, ''Sphinx'' ориентирован скорее на исследователей и разработчиков, чем на конечных&lt;br /&gt;
потребителей, хотя в некоторых областях применения его можно использовать уже сейчас, что и демонстрирует нам проект ''Gnome Voice-Control'', о котором будет сказано ниже. Проект ''Sphinx'' идет к своей конечной цели уверенно, но медленно. Стабильные предварительные выпуски появляются раз в несколько лет (правда, последнее обновление официальных релизов ''Sphinx 3'' и ''Sphinx 4'' произошло совсем недавно – в начале 2009 года).&lt;br /&gt;
&lt;br /&gt;
''CMU Sphinx'' давно разделился на несколько ветвей, что может сбить с толку человека, начинающего знакомиться с проектом. Из четырех существующих сегодня воплощений ''Sphinx'' мы рассмотрим ''Sphinx 3, Sphinx 4'' и ''PocketSphinx''. В первом приближении каждая система ''Sphinx'' состоит из двух компонентов: «тренера» (trainer) и декодера. Тренер необходим для создания акустической модели, адаптированной под конкретные потребности, а декодер выполняет собственно распознавание. Следует подчеркнуть, что под «тренировкой» ''Sphinx'' подразумевается именно построение акустической модели, а не адаптация под конкретные речевые особенности, как, например, это делается в процессе установки ''Dragon Naturally Speaking''. Тренер ''Sphinx'' предназначен для разработчиков, которые хорошо понимают, как устроено распознавание речи; с рядовым же пользователем система должна взаимодействовать без подготовки. Возможность работы в таком режиме очень полезна при создании общедоступных&lt;br /&gt;
сервисов, например, автоматизированных телефонных служб,&lt;br /&gt;
тогда как для систем диктовки текста предпочтительна подстройка под конкретного человека.&lt;br /&gt;
&lt;br /&gt;
Движок ''Sphinx 3'' создавался для оффлайновой обработки речи, т.е. преобразования данных из аудиофайла, и позже был дополнен функцией распознавания «на лету». Демонстрационные программы, входящие в стандартный дистрибутив ''Sphinx 3'', предназначены для работы с файлами, в таком режиме мы и будем их тестировать. Скачайте (или возьмите с LXFDVD) и соберите ''Sphinx 3'' (для этого вам понадобятся библиотеки ''SphinxBase'', чьи исходные тексты также есть на диске).&lt;br /&gt;
&lt;br /&gt;
После выполнения команды ''make install'' в вашей системе появится несколько программ, начинающихся с префикса '''sphinx3_'''. Нас интересуют две из них: ''sphinx3_livedecode'' – распознавание речи в режиме реального времени и ''sphinx3_livepretend'' – работа в пакетном режиме (чтение из файла). Прежде чем запускать эти программы, необходимо создать файл конфигурации. Его простой пример, '''configfile''', который вы найдете на диске,&lt;br /&gt;
выглядит так:&lt;br /&gt;
&lt;br /&gt;
 -samprate 16000&lt;br /&gt;
 -nfft 2048&lt;br /&gt;
 -hmm /usr/local/share/sphinx3/model/hmm/hub4_cd_continuous_8gau_1s_c_d_dd&lt;br /&gt;
 -dict /usr/local/share/sphinx3/model/lm/an4/an4.dict&lt;br /&gt;
 -fdict /usr/local/share/sphinx3/model/lm/an4/filler.dict&lt;br /&gt;
 -lm /usr/local/share/sphinx3/model/lm/an4/an4.ug.lm.DMP&lt;br /&gt;
&lt;br /&gt;
Параметр '''-samprate''' указывает частоту дискретизации входных данных, '''-nfft''' представляет собой количество отсчетов для&lt;br /&gt;
преобразования Фурье: это число должно быть степенью двойки и превышать '''1024'''. Остальные параметры задают местоположение файлов акустической модели и словарей (по умолчанию файлы данных ''Sphinx 3'' устанавливаются в директорию '''/usr/local/share/sphinx3/'''). Для улучшения качества распознавания вы можете попробовать изменить значения и других настроек ''Sphinx 3'' (всего их около трех десятков; информация о настройках&lt;br /&gt;
распечатывается во время выполнения программ). Теперь, когда у нас есть файл конфигурации, мы можем попробовать распознавание речи в режиме реального времени. Скомандуем в окне консоли:&lt;br /&gt;
&lt;br /&gt;
 sphinx3_livedecode configfile&lt;br /&gt;
&lt;br /&gt;
Программа предложит нам нажать '''Enter''' и начать говорить. Во время своей работы приложение будет выводить множество отладочной информации, промежуточные гипотезы, возникающие в процессе распознавания и сам распознанный фрагмент речи (не расстраивайтесь).&lt;br /&gt;
&lt;br /&gt;
Для тестирования распознавания речи в пакетном режиме нам понадобятся, прежде всего, файлы аудиозаписей. Не переживайте, если у вас плохое произношение и нет знакомых англичан – для того, чтобы получить приличную аудиозапись на английском, живой человек не обязателен. Можно воспользоваться&lt;br /&gt;
одной из программ синтеза речи, во множестве доступных для Linux, а можно обратить к онлайн-синтезатору по адресу http://www.research.att.com/~ttsweb/tts/demo.php. ''Sphinx 3'' работает с файлами формата RAW (16-битные отсчеты, моно-сигнал, без заголовка). На диске вы найдете два файла – '''123july27.raw''' и '''recognisethis.raw''', которые уже содержат аудиозапись в нужном формате. Руководства по ''Sphinx 3'' советуют размещать отдельные речевые фрагменты в разных RAW-файлах, но в моих экспериментах более высокое качество распознавания было достигнуто&lt;br /&gt;
при объединении фрагментов в один файл. В дополнение к файлу&lt;br /&gt;
'''configfile''' создадим файл '''ctl''', который должен содержать список имен RAW-файлов с данными (без расширения raw). Например,&lt;br /&gt;
для того, чтобы прочитать аудио из файла '''123july27.raw''', запишем&lt;br /&gt;
в файл '''ctl'''&lt;br /&gt;
&lt;br /&gt;
 123july27&lt;br /&gt;
&lt;br /&gt;
Теперь можем скомандовать&lt;br /&gt;
&lt;br /&gt;
 sphinx3_continuous ctl . configfile&lt;br /&gt;
&lt;br /&gt;
Второй параметр команды (в нашем случае – точка) указывает директорию, в которой находятся RAW-файлы. Если запустить команду для файла '''123july27.raw''', среди многочисленных строк вывода программы мы найдем и такой:&lt;br /&gt;
&lt;br /&gt;
 FWDVIT: ONE TWO K TWO I TWENTY SECOND&lt;br /&gt;
&lt;br /&gt;
Текст, который следует за префиксом «'''FWDVIT''':», и есть распознанная речь (в оригинале было «one two three july twenty seven»). Как видим, программе еще есть чему учиться. Впрочем, не исключаю, что точность распознавания можно повысить с помощью более тонких настроек файла '''configfile'''. Получится – черкните нам письмецо.&lt;br /&gt;
&lt;br /&gt;
===Русский сфинкс===&lt;br /&gt;
&lt;br /&gt;
{{Врезка|Содержание=[[Изображение:LXF117_44_1.jpg|300px]] Графическая утилита ''Sphinx 3''.|Ширина=300px}}&lt;br /&gt;
&lt;br /&gt;
Надо отдать должное соотечественникам, предпринимающим&lt;br /&gt;
энергичные усилия по русификации открытых средств распознавания речи. Поддержка русского языка добавляется (или хотя бы&lt;br /&gt;
упоминается) на сайтах всех крупных проектов в этой области. Однако качество распознавания русской речи существенно уступает&lt;br /&gt;
качеству распознавания речи английской.&lt;br /&gt;
&lt;br /&gt;
 Для тестирования распознавания русского языка в ''Sphinx 3'' мы воспользуемся акустическими моделями и словарями с сайта VoxForge ([[LXF116:Компьютер_слушает!|LXF116]]): их можно взять с LXFDVD. В результате распаковки у вас появится директория '''AcousticModels''' с несколькими&lt;br /&gt;
подкаталогами. Соответствующие строки в файле конфигурации ''Sphinx 3'' будут выглядеть так:&lt;br /&gt;
&lt;br /&gt;
 -samprate 16000&lt;br /&gt;
 -nfft 2048&lt;br /&gt;
 -hmm &amp;lt;PATH&amp;gt;/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000&lt;br /&gt;
 -dict &amp;lt;PATH&amp;gt;/AcousticModels/etc/msu_ru_nsh.dic&lt;br /&gt;
 -fdict &amp;lt;PATH&amp;gt;/AcousticModels/etc/msu_ru_nsh.filler&lt;br /&gt;
 -lm &amp;lt;PATH&amp;gt;/AcousticModels/etc/msu_ru_nsh.lm.dmp&lt;br /&gt;
&lt;br /&gt;
Честно говоря, результаты не впечатляют. Например, тестовый фрагмент «привет один два три» был распознан как «ответ таланты и в эту». Хотя причина, скорее всего, заключается в том, что в речевом корпусе VoxForge все еще мало данных (использование&lt;br /&gt;
англоязычной модели FoxForge тоже не дает хороших результатов). Так что не забудьте оставить свой голос (в смысле, аудиозапись) на сайте VoxForge.&lt;br /&gt;
&lt;br /&gt;
Демонстрационные программы ''Sphinx 3'' являются оболочками, которые вызывают все необходимые им функции из разделяемых библиотек движка. Если вы пишете программу, использующую ''Sphinx 3'', ничто не мешает вам поступить так же. С некоторых&lt;br /&gt;
пор у ''Sphinx 3'' появилось нечто вроде официального API (он,&lt;br /&gt;
правда, уже несколько раз серьезно менялся). В качестве примера использования API ''Sphinx 3'' в собственных приложениях&lt;br /&gt;
можно рассмотреть программу'' SpphinxSimpleRec'', которую написал Кит Вертанен [Keith Vertanen]. Ее исходный текст доступен по адресу http://www.inference.phy.cam.ac.uk/kv227/simplerec/. Если вы не хотите возиться с API ''Sphinx 3'' в своих проектах, можно&lt;br /&gt;
использовать готовые программы ''Sphinx'' и средства межпроцессного взаимодействия.&lt;br /&gt;
&lt;br /&gt;
===''Sphinx 4''===&lt;br /&gt;
&lt;br /&gt;
Движок ''Sphinx 4'' написан целиком на языке ''Java'' (на выбор языка программирования, без сомнения, повлияла компания Sun&lt;br /&gt;
Microsystems, которая участвовала в разработке). ''Sphinx 4'' использует API ''Java Speech'', хотя и не реализует стандартного интерфейса распознавателя речи этой системы. В отличие от ''Sphinx 3'', который предназначен в основном для исследователей, ''Sphinx 4'' стремится стать инструментом конечного пользователя. Для демонстрации возможностей системы разработчики предлагают небольшие словари, предназначенные&lt;br /&gt;
для применения в специальных областях (например, распознавание числительных). Надо отметить, что входящие в состав ''Sphinx 4'' демонстрационные программы справляются с распознаванием числительных гораздо увереннее, нежели программы ''Sphinx 3'' со стандартным словарем. В принципе, ''Sphinx 4'' уже можно использовать на практике для распознавания, например, голосовых команд – при условии, что их общее число будет невелико. Если вы хотите просто&lt;br /&gt;
узнать, как работает ''Sphinx 4'', можете взять уже скомпилированный дистрибутив (для его выполнения вам понадобится стандартная среда ''Java RE'' версии 1.4 или более поздней). В состав двоичного пакета входит набор демонстрационных консольных и графических программ, которые могут получать данные&lt;br /&gt;
с микрофона и из файлов WAV.&lt;br /&gt;
&lt;br /&gt;
Как уже отмечалось, большая часть этих программ не понимает ничего, кроме цифр от 0 до 9, зато эти цифры понимает очень хорошо. Демонстрационная программа ''HlloDigits.jar'' уверенно распознавала числа при вводе с микрофона (2 ошибки на 100 чисел, и это при моем далеком от идеального английском&lt;br /&gt;
произношении). А программа ''Transcriber.java'' ни разу не ошиблась при чтении данных из аудиозаписей, созданных с помощью&lt;br /&gt;
упомянутого выше англоязычного синтезатора речи. Впрочем, отдельными числами возможности демо-программ не ограничиваются. Программа ''HelloNGram.jar'' может распознавать целые фразы, используя словарь большого объема. Если вы хотите углубиться в детали работы ''Sphinx 4'', получить доступ к дополнительным демонстрационным приложениям и задействовать более объемные словари, вам следует собрать приложение из исходных текстов. Для этого, помимо самих кодов, понадобятся ''Java 2 SDK'' и ''Ant''.&lt;br /&gt;
&lt;br /&gt;
Поскольку ''Sphinx 4'' написан на ''Java'', вы сможете использовать его код в своих приложениях только в том случае, если сами пишете на ''Java''. Программирование с использованием ''Sphinx 4'' подробно описано на сайте проекта; кроме того, в вашем распоряжении есть готовые демо-программы. Те, кто пишет не на ''Java'', могут использовать готовые программы из дистрибутива ''Sphinx 4'' как внешние процессы, для чего, однако, все равно потребуется среда времени выполнения ''Java''. Отметим также, что при настройке ввода с микрофона для приложений ''Java'' под Linux вы можете столкнуться с некоторыми сложностями. Однако, когда все препятствия преодолены, программировать для&lt;br /&gt;
''Sphinx 4'' становится легко и приятно – сказывается присущая ''Java'' хорошая организация кода.&lt;br /&gt;
&lt;br /&gt;
 По умолчанию демонстрационные программы ''Sphinx 4'' используют две акустических модели – TIDIGITS и Wall Street Journal. Если вы захотите использовать другие модели, их нужно будет сначала скомпилировать в JAR-архивы. Имя используемой модели указывается в конфигурационном файле программы.&lt;br /&gt;
&lt;br /&gt;
Еще одна версия ''Sphinx 4, PocketSphinx'', предназначена, как следует из названия, для карманных устройств. При работе с гаджетом, у которого отсутствует полноценная клавиатура, даже не очень надежный распознаватель речи может оказаться весьма полезным. Движок ''PocketSphinx'' используется программой ''Gnome Voice Control'' (http://live.gnome.org/GnomeVoiceControl), предназначенной для голосового управления рабочим столом GNOME. Утилита ''Gnome Voice Control'' уже включена в репозитории многих дистрибутивов Linux, так что вы можете либо проверить ее работоспособность самостоятельно, либо посмотреть демонстрационное видео на YouTube.&lt;br /&gt;
&lt;br /&gt;
===''HTK'' и ''Julius''===&lt;br /&gt;
&lt;br /&gt;
''Hidden Markov Model Toolkit'', инструментарий для исследования и разработки средств распознавания речи с использованием скрытых марковских моделей, разрабатывается в Кембриджском университете под патронажем Microsoft (фактически Microsoft когда-то выкупила этот код у коммерческого предприятия Entropic Cambridge Research Laboratory Ltd, а затем вернула его Кембриджу вместе с ограничивающей лицензией). Исходные тексты ''HTK'' доступны всем желающим, и разработчики принимают исправления, внесенные в них третьими лицами, однако использование кода ''HTK'' в продуктах, предназначенных для конечных пользователей, запрещено&lt;br /&gt;
лицензией. Из сказанного следует, что мы не увидим средство распознавания речи для Linux (или другой ОС) на базе ''HTK''. Это, однако, не означает, что ''HTK'' бесполезен для Linux-разработчиков: его можно использовать как вспомогательный инструмент при разработке открытых (и коммерческих)&lt;br /&gt;
средств распознавания речи, что и делают разработчики открытого движка ''Julius'', который разрабатывается в Японии и, что вполне логично, лучше всего работает с японским языком.&lt;br /&gt;
&lt;br /&gt;
Если вы не намерены разговаривать с компьютером на японском, можете загрузить файлы данных для английского языка с сайта проекта VoxForge (для других языков, в том числе русского, готовые файлы пока что отсутствуют). Пакет ''VoxForge Quick Start'' включает ''Julius'' и файлы данных для английского языка. С его помощью вы всегда сможете проверить, на что годятся последние версии ''Julius'' и речевого корпуса VoxForge (входящая в пакет демонстрационная программа предназначена для распознавания изолированных фрагментов речи, вводимых с помощью микрофона). В моих испытаниях ''VoxForge Quick Start'' показал себя довольно бледно, хотя дело тут, возможно, не в ''Julius'', а во все еще недостаточном объеме речевого корпуса VoxForge: ''Sphinx'' тоже показывает с ним невысокие результаты (с собственными моделями он работает гораздо лучше). Недостатком ''Julius'' является отсутствие собственного инструментария для построения языковых моделей. Если у ''Sphinx'' есть личный «тренер», то ''Julius'' использует инструменты ''HTK''. Для приложений, не требующих индивидуальной подстройки под пользователя, это не страшно, а вот при работе с такими программами, как ''Simon'', возникают проблемы. &lt;br /&gt;
&lt;br /&gt;
===''Simon''===&lt;br /&gt;
&lt;br /&gt;
Проект ''Simon'', работа над которым началась еще в 2007 году,&lt;br /&gt;
до сих пор находится на стадии альфа-версии. Simon демонстри-&lt;br /&gt;
рует нам несколько интересных решений и один серьезный не-&lt;br /&gt;
достаток, который является следствием того, что в проекте ис-&lt;br /&gt;
пользуется движок Julius. В своем нынешнем виде Simon не готов&lt;br /&gt;
к распознаванию речи без индивидуального построения языко-&lt;br /&gt;
вых моделей, а для этого приходится использовать инструмента-&lt;br /&gt;
рий HTK, который, в силу лицензионных ограничений, нельзя рас-&lt;br /&gt;
пространять вместе с основным пакетом. После установки Simon&lt;br /&gt;
вам еще придется регистрироваться на сайте HTK, загружать&lt;br /&gt;
и устанавливать соответствующие программы. Возможно, в бу-&lt;br /&gt;
дущем разработчикам Simon удастся создать систему голосово-&lt;br /&gt;
го управления, которая будет работать «прямо из коробки», тог-&lt;br /&gt;
да без HTK можно будет обойтись; однако, как показывает опыт&lt;br /&gt;
Dragon Naturally Speeking (а это самое успешное на сегодня сред-&lt;br /&gt;
ство распознавания слитной речи), в системах диктовки компью-&lt;/div&gt;</summary>
		<author><name>Crazy Rebel</name></author>	</entry>

	</feed>