<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/css" href="http://wiki2.linuxformat.ru/skins/common/feed.css?97"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
	<channel>
		<title>LXF118:Компьютер слушает - История изменений</title>
		<link>http://wiki2.linuxformat.ru/index.php?title=LXF118:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;action=history</link>
		<description>История изменений этой страницы в вики</description>
		<language>ru</language>
		<generator>MediaWiki 1.11.1</generator>
		<lastBuildDate>Wed, 13 May 2026 21:47:01 GMT</lastBuildDate>
		<item>
			<title>Crazy Rebel: /* Читаем с листа */</title>
			<link>http://wiki2.linuxformat.ru/index.php?title=LXF118:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10245&amp;oldid=prev</link>
			<description>&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Читаем с листа&lt;/span&gt;&lt;/p&gt;

			&lt;table style=&quot;background-color: white; color:black;&quot;&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;col class='diff-marker' /&gt;
			&lt;col class='diff-content' /&gt;
			&lt;tr&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black;&quot;&gt;Версия 12:12, 24 мая 2010&lt;/td&gt;
			&lt;/tr&gt;
		&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;==Читаем с листа==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;==Читаем с листа==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;nbsp;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt;&amp;nbsp;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;background: #cfc; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;{{Цикл/СРР}}&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;: Как бы мы ни любили Linux, приходится признать: для автоматического ввода текста с бумаги в компьютер это пока не лучший вариант. '''Андрей Боровский''' смотрит, что можно сделать.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background: #eee; color:black; font-size: smaller;&quot;&gt;&lt;div&gt;: Как бы мы ни любили Linux, приходится признать: для автоматического ввода текста с бумаги в компьютер это пока не лучший вариант. '''Андрей Боровский''' смотрит, что можно сделать.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</description>
			<pubDate>Mon, 24 May 2010 12:12:22 GMT</pubDate>			<dc:creator>Crazy Rebel</dc:creator>			<comments>http://wiki2.linuxformat.ru/index.php/%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:LXF118:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82</comments>		</item>
		<item>
			<title>Crazy Rebel: викификация, оформление, иллюстрация</title>
			<link>http://wiki2.linuxformat.ru/index.php?title=LXF118:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82&amp;diff=10230&amp;oldid=prev</link>
			<description>&lt;p&gt;викификация, оформление, иллюстрация&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая статья&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==Читаем с листа==&lt;br /&gt;
&lt;br /&gt;
: Как бы мы ни любили Linux, приходится признать: для автоматического ввода текста с бумаги в компьютер это пока не лучший вариант. '''Андрей Боровский''' смотрит, что можно сделать.&lt;br /&gt;
&lt;br /&gt;
Распознавание&lt;br /&gt;
текста&lt;br /&gt;
относится&lt;br /&gt;
к числу&lt;br /&gt;
тех интеллектуальноемких&lt;br /&gt;
задач,&lt;br /&gt;
с которыми&lt;br /&gt;
открытые&lt;br /&gt;
системы&lt;br /&gt;
пока&lt;br /&gt;
не научились&lt;br /&gt;
справляться&lt;br /&gt;
хорошо.&lt;br /&gt;
Позитивные&lt;br /&gt;
сдвиги&lt;br /&gt;
в решении&lt;br /&gt;
проблемы&lt;br /&gt;
наметились&lt;br /&gt;
в 2005,&lt;br /&gt;
когда компания&lt;br /&gt;
Hewlett-Packard открыла&lt;br /&gt;
исходные&lt;br /&gt;
тексты&lt;br /&gt;
некогда коммерческой&lt;br /&gt;
программы&lt;br /&gt;
''Tesseract'' на условиях&lt;br /&gt;
лицензии&lt;br /&gt;
Apache License 2.0. Проект&lt;br /&gt;
тут же поддержала&lt;br /&gt;
компания&lt;br /&gt;
Google,&lt;br /&gt;
заинтересованная&lt;br /&gt;
в открытом&lt;br /&gt;
средстве&lt;br /&gt;
распознавания&lt;br /&gt;
текстов&lt;br /&gt;
для создания&lt;br /&gt;
своих&lt;br /&gt;
электронных&lt;br /&gt;
библиотек&lt;br /&gt;
(Google также&lt;br /&gt;
оказала&lt;br /&gt;
поддержку&lt;br /&gt;
некоторым&lt;br /&gt;
смежным&lt;br /&gt;
проектам,&lt;br /&gt;
связанным&lt;br /&gt;
с распознаванием&lt;br /&gt;
текста,&lt;br /&gt;
например,&lt;br /&gt;
''Ocropus''). В 2008 году&lt;br /&gt;
компания&lt;br /&gt;
Congnitive Technologies выложила&lt;br /&gt;
в открытый&lt;br /&gt;
доступ исходные&lt;br /&gt;
коды&lt;br /&gt;
своего&lt;br /&gt;
пакета&lt;br /&gt;
распознавания&lt;br /&gt;
текста&lt;br /&gt;
''Cuneiform''.&lt;br /&gt;
&lt;br /&gt;
Впрочем,&lt;br /&gt;
те, кто на волне всеобщего&lt;br /&gt;
энтузиазма&lt;br /&gt;
предрекал&lt;br /&gt;
конец эры коммерческих&lt;br /&gt;
приложений-конкурентов,&lt;br /&gt;
слегка поторопились.&lt;br /&gt;
Следует&lt;br /&gt;
помнить, что предложенные&lt;br /&gt;
нашему&lt;br /&gt;
вниманию&lt;br /&gt;
программы&lt;br /&gt;
не были&lt;br /&gt;
лидерами&lt;br /&gt;
рынка,&lt;br /&gt;
иначе&lt;br /&gt;
мы вряд ли увидели&lt;br /&gt;
бы их исходные&lt;br /&gt;
коды.&lt;br /&gt;
Используемые&lt;br /&gt;
в них технологии&lt;br /&gt;
давно&lt;br /&gt;
не обновлялись&lt;br /&gt;
(развитие&lt;br /&gt;
''Tesseract'' в недрах HP остановилось&lt;br /&gt;
в 1995 году).&lt;br /&gt;
Если&lt;br /&gt;
бы такие&lt;br /&gt;
программы&lt;br /&gt;
были&lt;br /&gt;
доступны&lt;br /&gt;
в Linux лет&lt;br /&gt;
тринадцать&lt;br /&gt;
назад,&lt;br /&gt;
он был бы сегодня&lt;br /&gt;
самой&lt;br /&gt;
популярной&lt;br /&gt;
офисной&lt;br /&gt;
системой.&lt;br /&gt;
Но сейчас&lt;br /&gt;
эти приложения&lt;br /&gt;
уже не соответствуют&lt;br /&gt;
тем&lt;br /&gt;
стандартам&lt;br /&gt;
функциональности&lt;br /&gt;
и удобства,&lt;br /&gt;
к которым&lt;br /&gt;
привыкли&lt;br /&gt;
пользователи&lt;br /&gt;
конторских&lt;br /&gt;
ПК.&lt;br /&gt;
&lt;br /&gt;
===Немного о грустном===&lt;br /&gt;
&lt;br /&gt;
Признаем&lt;br /&gt;
честно:&lt;br /&gt;
Linux по-прежнему нельзя&lt;br /&gt;
назвать&lt;br /&gt;
наиболее&lt;br /&gt;
подходящей&lt;br /&gt;
средой&lt;br /&gt;
для распознавания&lt;br /&gt;
текстов.&lt;br /&gt;
Проблемы&lt;br /&gt;
возникают&lt;br /&gt;
уже на уровне поддержки&lt;br /&gt;
оборудования.&lt;br /&gt;
Производители&lt;br /&gt;
сканеров игнорируют&lt;br /&gt;
Linux, а добровольцы&lt;br /&gt;
из проекта&lt;br /&gt;
''Sane'' едва&lt;br /&gt;
ли могут&lt;br /&gt;
обеспечить&lt;br /&gt;
работу&lt;br /&gt;
всех моделей.&lt;br /&gt;
Если&lt;br /&gt;
вы собираетесь&lt;br /&gt;
сканировать&lt;br /&gt;
под Linux, перед&lt;br /&gt;
покупкой&lt;br /&gt;
устройства&lt;br /&gt;
следует&lt;br /&gt;
проконсультироваться&lt;br /&gt;
на сайте&lt;br /&gt;
''Sane''. Учтите&lt;br /&gt;
при этом одну&lt;br /&gt;
важную&lt;br /&gt;
особенность:&lt;br /&gt;
обычно&lt;br /&gt;
поддержка&lt;br /&gt;
в Linux некой периферии&lt;br /&gt;
означает,&lt;br /&gt;
что поддерживаются&lt;br /&gt;
(возможно,&lt;br /&gt;
с несколько&lt;br /&gt;
ограниченной&lt;br /&gt;
функциональностью)&lt;br /&gt;
и все устройства&lt;br /&gt;
того&lt;br /&gt;
же модельного&lt;br /&gt;
ряда,&lt;br /&gt;
однако&lt;br /&gt;
со сканерами&lt;br /&gt;
дело&lt;br /&gt;
обстоит&lt;br /&gt;
иначе.&lt;br /&gt;
Например,&lt;br /&gt;
CanoScan LiDE 60&lt;br /&gt;
(производитель&lt;br /&gt;
– компания&lt;br /&gt;
Canon) работает,&lt;br /&gt;
а CanoScan LiDE 70 –&lt;br /&gt;
нет. Так что будьте&lt;br /&gt;
бдительны.&lt;br /&gt;
&lt;br /&gt;
Преимущества&lt;br /&gt;
пользователей&lt;br /&gt;
Windows в деле&lt;br /&gt;
сканирования&lt;br /&gt;
текстов&lt;br /&gt;
не ограничиваются&lt;br /&gt;
наличием&lt;br /&gt;
драйверов&lt;br /&gt;
для любого&lt;br /&gt;
устройства.&lt;br /&gt;
Сегодня&lt;br /&gt;
даже&lt;br /&gt;
самые&lt;br /&gt;
дешевые&lt;br /&gt;
модели&lt;br /&gt;
сканеров поставляются&lt;br /&gt;
с программами&lt;br /&gt;
(обычно&lt;br /&gt;
это «облегченный» вариант&lt;br /&gt;
''FineReader''), которые&lt;br /&gt;
прекрасно&lt;br /&gt;
справляются&lt;br /&gt;
со сканированием&lt;br /&gt;
среднестатистических&lt;br /&gt;
офисных&lt;br /&gt;
текстов.&lt;br /&gt;
Собственно&lt;br /&gt;
говоря,&lt;br /&gt;
даже&lt;br /&gt;
появление&lt;br /&gt;
высококачественных&lt;br /&gt;
открытых&lt;br /&gt;
программ&lt;br /&gt;
распознавания текста&lt;br /&gt;
само&lt;br /&gt;
по себе&lt;br /&gt;
не сделает&lt;br /&gt;
Linux привлекательной&lt;br /&gt;
офисной&lt;br /&gt;
средой:&lt;br /&gt;
здесь мы сталкиваемся&lt;br /&gt;
с известной&lt;br /&gt;
проблемой&lt;br /&gt;
конкуренции&lt;br /&gt;
между&lt;br /&gt;
открытыми&lt;br /&gt;
и закрытыми&lt;br /&gt;
платформами.&lt;br /&gt;
Успешная&lt;br /&gt;
закрытая&lt;br /&gt;
программа,&lt;br /&gt;
предназначенная&lt;br /&gt;
для конкретной&lt;br /&gt;
закрытой&lt;br /&gt;
платформы,&lt;br /&gt;
становится&lt;br /&gt;
дополнительным&lt;br /&gt;
конкурентным&lt;br /&gt;
преимуществом&lt;br /&gt;
этой платформы.&lt;br /&gt;
Успешная&lt;br /&gt;
открытая&lt;br /&gt;
программа&lt;br /&gt;
не добавляет&lt;br /&gt;
конкурентных&lt;br /&gt;
преимуществ&lt;br /&gt;
какой-либо&lt;br /&gt;
конкретной&lt;br /&gt;
платформе,&lt;br /&gt;
так как может&lt;br /&gt;
быть без особых&lt;br /&gt;
усилий&lt;br /&gt;
перенесена&lt;br /&gt;
на любую&lt;br /&gt;
закрытую&lt;br /&gt;
ОС.&lt;br /&gt;
&lt;br /&gt;
Стоит&lt;br /&gt;
ли при таких&lt;br /&gt;
обстоятельствах,&lt;br /&gt;
когда коммерческие&lt;br /&gt;
решения&lt;br /&gt;
для распознавания&lt;br /&gt;
текста&lt;br /&gt;
дешевеют&lt;br /&gt;
и становятся&lt;br /&gt;
«придатком» к оборудованию,&lt;br /&gt;
а успехи&lt;br /&gt;
свободных&lt;br /&gt;
программ&lt;br /&gt;
не способствуют&lt;br /&gt;
продвижению&lt;br /&gt;
открытого&lt;br /&gt;
ПО в целом,&lt;br /&gt;
заниматься&lt;br /&gt;
разработкой&lt;br /&gt;
последних?&lt;br /&gt;
Я думаю,&lt;br /&gt;
что эта работа&lt;br /&gt;
по-прежнему имеет&lt;br /&gt;
смысл. Открытые&lt;br /&gt;
программы&lt;br /&gt;
обладают&lt;br /&gt;
одним важным&lt;br /&gt;
преимуществом:&lt;br /&gt;
возможностью&lt;br /&gt;
быстрой&lt;br /&gt;
адаптации&lt;br /&gt;
к специфическим&lt;br /&gt;
потребностям&lt;br /&gt;
пользователей.&lt;br /&gt;
В идеале&lt;br /&gt;
открытые&lt;br /&gt;
программы&lt;br /&gt;
распознавания&lt;br /&gt;
текста&lt;br /&gt;
должны&lt;br /&gt;
представлять&lt;br /&gt;
собой&lt;br /&gt;
не законченные&lt;br /&gt;
монолитные&lt;br /&gt;
блоки,&lt;br /&gt;
а наборы&lt;br /&gt;
инструментов,&lt;br /&gt;
которые&lt;br /&gt;
могут&lt;br /&gt;
быть легко&lt;br /&gt;
приспособлены&lt;br /&gt;
для решения&lt;br /&gt;
специальных&lt;br /&gt;
задач,&lt;br /&gt;
будь то распознавание&lt;br /&gt;
текста&lt;br /&gt;
в особых&lt;br /&gt;
условиях&lt;br /&gt;
или интеграция&lt;br /&gt;
с каким-либо&lt;br /&gt;
нестандартным&lt;br /&gt;
ПО.&lt;br /&gt;
&lt;br /&gt;
===Герои нашего времени===&lt;br /&gt;
&lt;br /&gt;
В данной статье мы подробно рассмотрим ''Cuneiform'' и бегло – ''Tesseract''. Такое&lt;br /&gt;
неравноправие&lt;br /&gt;
объясняется&lt;br /&gt;
очень просто:&lt;br /&gt;
только&lt;br /&gt;
''Cuneiform'' поддерживает&lt;br /&gt;
распознавание&lt;br /&gt;
документов&lt;br /&gt;
на русском&lt;br /&gt;
языке;&lt;br /&gt;
попытки&lt;br /&gt;
русификации&lt;br /&gt;
''Tesseract'' пока&lt;br /&gt;
что не увенчались&lt;br /&gt;
приемлемыми&lt;br /&gt;
результатами.&lt;br /&gt;
Разумеется,&lt;br /&gt;
список&lt;br /&gt;
открытых&lt;br /&gt;
проектов&lt;br /&gt;
распознавания&lt;br /&gt;
текста&lt;br /&gt;
не исчерпывается&lt;br /&gt;
перечисленными&lt;br /&gt;
программами&lt;br /&gt;
(есть еще, например,&lt;br /&gt;
''GOCR''). Но, поскольку&lt;br /&gt;
распознавание&lt;br /&gt;
текстов&lt;br /&gt;
на русском в перечень&lt;br /&gt;
возможностей&lt;br /&gt;
этих других&lt;br /&gt;
приложений&lt;br /&gt;
не входит,&lt;br /&gt;
а среди&lt;br /&gt;
«нерусских», по результатам&lt;br /&gt;
многочисленных&lt;br /&gt;
обзоров,&lt;br /&gt;
самым&lt;br /&gt;
успешным&lt;br /&gt;
признан&lt;br /&gt;
проект&lt;br /&gt;
''Tesseract'', мы решили&lt;br /&gt;
не останавливаться&lt;br /&gt;
на альтернативах.&lt;br /&gt;
&lt;br /&gt;
В своей&lt;br /&gt;
нынешней реализации&lt;br /&gt;
и ''Cuneifrom'', и ''Tesseract''&lt;br /&gt;
представляют&lt;br /&gt;
собой&lt;br /&gt;
приложения&lt;br /&gt;
командной&lt;br /&gt;
строки,&lt;br /&gt;
что определенным&lt;br /&gt;
образом&lt;br /&gt;
ограничивает&lt;br /&gt;
их функциональность.&lt;br /&gt;
Важную&lt;br /&gt;
роль в пакетах&lt;br /&gt;
распознавания&lt;br /&gt;
текста&lt;br /&gt;
всегда&lt;br /&gt;
играла&lt;br /&gt;
интерактивность&lt;br /&gt;
– например,&lt;br /&gt;
возможность&lt;br /&gt;
наглядно&lt;br /&gt;
сопоставить&lt;br /&gt;
распознанный&lt;br /&gt;
фрагмент&lt;br /&gt;
текста&lt;br /&gt;
и соответствующий&lt;br /&gt;
ему фрагмент&lt;br /&gt;
исходного&lt;br /&gt;
изображения&lt;br /&gt;
(графический&lt;br /&gt;
вариант&lt;br /&gt;
''Cuneiform'' для Windows предоставляет&lt;br /&gt;
такую&lt;br /&gt;
возможность).&lt;br /&gt;
Программа,&lt;br /&gt;
работающая&lt;br /&gt;
по принципу&lt;br /&gt;
фильтра&lt;br /&gt;
(читаем&lt;br /&gt;
исходные&lt;br /&gt;
данные,&lt;br /&gt;
выполняем&lt;br /&gt;
обработку,&lt;br /&gt;
выдаем&lt;br /&gt;
результат)&lt;br /&gt;
не может&lt;br /&gt;
предоставить&lt;br /&gt;
аналогичный&lt;br /&gt;
уровень&lt;br /&gt;
интерактивности&lt;br /&gt;
(хотя&lt;br /&gt;
в ядре&lt;br /&gt;
''Cuneiform'' имеются&lt;br /&gt;
для этого&lt;br /&gt;
все необходимые&lt;br /&gt;
функции).&lt;br /&gt;
&lt;br /&gt;
===Часть 1 ''Cuneiform''===&lt;br /&gt;
&lt;br /&gt;
{{Врезка|Содержание=[[Изображение:LXF118_37_1.jpg|300px]] ''Cuneiform'' для Windows — отправная точка для открытого проекта. |Ширина=300px}}&lt;br /&gt;
&lt;br /&gt;
В отличие от программы ''Tesseract'', за «открытием» которой&lt;br /&gt;
стояли HP и Google, релиз исходных&lt;br /&gt;
текстов&lt;br /&gt;
''Сuneiform'' был обставлен&lt;br /&gt;
гораздо&lt;br /&gt;
скромнее. Помимо&lt;br /&gt;
этого,&lt;br /&gt;
важное&lt;br /&gt;
отличие&lt;br /&gt;
''Cuneiform''&lt;br /&gt;
от ''Tesseract'' – условия&lt;br /&gt;
лицензирования.&lt;br /&gt;
Разработчики&lt;br /&gt;
''Tesseract''&lt;br /&gt;
выбрали&lt;br /&gt;
хорошо&lt;br /&gt;
известную&lt;br /&gt;
в мире&lt;br /&gt;
открытого&lt;br /&gt;
ПО лицензию&lt;br /&gt;
Apache License 2.0 (некоторые&lt;br /&gt;
компоненты,&lt;br /&gt;
добавленные&lt;br /&gt;
сторонними&lt;br /&gt;
разработчиками,&lt;br /&gt;
распространяются&lt;br /&gt;
на условиях&lt;br /&gt;
GPL).&lt;br /&gt;
Разработчики&lt;br /&gt;
же ''Cuneiform'' ограничились&lt;br /&gt;
коротким&lt;br /&gt;
текстом,&lt;br /&gt;
согласно&lt;br /&gt;
которому&lt;br /&gt;
программное&lt;br /&gt;
обеспечение&lt;br /&gt;
может&lt;br /&gt;
свободно&lt;br /&gt;
распространяться&lt;br /&gt;
в виде&lt;br /&gt;
двоичных&lt;br /&gt;
файлов&lt;br /&gt;
и исходных&lt;br /&gt;
текстов,&lt;br /&gt;
в оригинальной&lt;br /&gt;
или модифицированной&lt;br /&gt;
форме,&lt;br /&gt;
при условии&lt;br /&gt;
сохранения&lt;br /&gt;
уведомлений&lt;br /&gt;
об авторских&lt;br /&gt;
правах ['''это похоже на первоначальную лицензию BSD, – прим. ред.''']. Малозаметное,&lt;br /&gt;
но важное отличие заключается&lt;br /&gt;
в том, что обычные&lt;br /&gt;
лицензии Open Source явным&lt;br /&gt;
образом постулируют,&lt;br /&gt;
что открытый однажды&lt;br /&gt;
код не может&lt;br /&gt;
быть впоследствии&lt;br /&gt;
«закрыт». Тот факт, что&lt;br /&gt;
''Cuneiform'' распространяется&lt;br /&gt;
на условиях,&lt;br /&gt;
несколько&lt;br /&gt;
нестандартных&lt;br /&gt;
для открытого&lt;br /&gt;
ПО, может&lt;br /&gt;
привести&lt;br /&gt;
к тому,&lt;br /&gt;
что программа&lt;br /&gt;
не войдет&lt;br /&gt;
в Linux-дистрибутивы,&lt;br /&gt;
составители&lt;br /&gt;
которых&lt;br /&gt;
придерживаются&lt;br /&gt;
строгих&lt;br /&gt;
принципов&lt;br /&gt;
относительно&lt;br /&gt;
лицензий&lt;br /&gt;
на ПО. Помимо&lt;br /&gt;
исходных&lt;br /&gt;
текстов,&lt;br /&gt;
в свободный&lt;br /&gt;
доступ была&lt;br /&gt;
выпущена&lt;br /&gt;
уже собранная&lt;br /&gt;
версия&lt;br /&gt;
''Cuneiform'' для Windows. Дело&lt;br /&gt;
в том, что без серьезной&lt;br /&gt;
«обработки напильником» собрать&lt;br /&gt;
ее из оригинальных&lt;br /&gt;
исходников&lt;br /&gt;
в современных&lt;br /&gt;
версиях&lt;br /&gt;
Microsoft Visual Studio просто&lt;br /&gt;
не получится.&lt;br /&gt;
Разработчики&lt;br /&gt;
''Cuneiform'' до сих пор не предоставили&lt;br /&gt;
описания&lt;br /&gt;
форматов&lt;br /&gt;
файлов&lt;br /&gt;
моделей,&lt;br /&gt;
используемых&lt;br /&gt;
программой&lt;br /&gt;
для распознавания.&lt;br /&gt;
Инструменты&lt;br /&gt;
обучения&lt;br /&gt;
''Cuneiform'' распознаванию&lt;br /&gt;
текстов&lt;br /&gt;
на новых&lt;br /&gt;
языках&lt;br /&gt;
также&lt;br /&gt;
отсутствуют.&lt;br /&gt;
Отчасти&lt;br /&gt;
этот пробел&lt;br /&gt;
компенсируется&lt;br /&gt;
тем, что ''Cuneiform'' уже умеет распознавать&lt;br /&gt;
тексты&lt;br /&gt;
практически&lt;br /&gt;
на всех европейских&lt;br /&gt;
языках,&lt;br /&gt;
основанных&lt;br /&gt;
на кириллице&lt;br /&gt;
и латинице&lt;br /&gt;
(досадным исключением является, соответственно, греческий).&lt;br /&gt;
&lt;br /&gt;
====Найдем и соберем====&lt;br /&gt;
&lt;br /&gt;
''Cuneiform ''для Linux, который&lt;br /&gt;
на момент&lt;br /&gt;
написания&lt;br /&gt;
этой статьи&lt;br /&gt;
достиг версии&lt;br /&gt;
0.6.0, пока&lt;br /&gt;
что не входит&lt;br /&gt;
ни в один стабильный&lt;br /&gt;
дистрибутив&lt;br /&gt;
(в настоящий&lt;br /&gt;
момент&lt;br /&gt;
он включен&lt;br /&gt;
в репозиторий&lt;br /&gt;
ALT Linux Sisyphus), так что собирать&lt;br /&gt;
приложение&lt;br /&gt;
вам придется&lt;br /&gt;
самостоятельно.&lt;br /&gt;
Исходные&lt;br /&gt;
тексты&lt;br /&gt;
последнего&lt;br /&gt;
релиза&lt;br /&gt;
''Cuneiform''&lt;br /&gt;
доступны&lt;br /&gt;
по адресу&lt;br /&gt;
https://code.launchpad.net/cuneiformlinux/+download; вы также&lt;br /&gt;
можете взять их с LXFDVD. Отследить&lt;br /&gt;
последние&lt;br /&gt;
изменения&lt;br /&gt;
можно&lt;br /&gt;
здесь: https://code.launchpad.net/~jpakkane/cuneiform-linux/trunk, для этого&lt;br /&gt;
вам потребуется&lt;br /&gt;
система&lt;br /&gt;
контроля&lt;br /&gt;
версий&lt;br /&gt;
''Bazaar''. Для сборки&lt;br /&gt;
''Cuneiform'' необходима&lt;br /&gt;
система&lt;br /&gt;
''CMake'' (если&lt;br /&gt;
вы пользуетесь&lt;br /&gt;
KDE 4, она наверняка&lt;br /&gt;
у вас уже имеется).&lt;br /&gt;
Кроме&lt;br /&gt;
того,&lt;br /&gt;
перед&lt;br /&gt;
компиляцией&lt;br /&gt;
''Cuneiform'' рекомендуется&lt;br /&gt;
установить&lt;br /&gt;
пакет&lt;br /&gt;
преобразования&lt;br /&gt;
графических&lt;br /&gt;
форматов&lt;br /&gt;
''ImageMagick'' (http://www.imagemagick.org). Если&lt;br /&gt;
этого&lt;br /&gt;
не сделать,&lt;br /&gt;
программа&lt;br /&gt;
сможет&lt;br /&gt;
читать&lt;br /&gt;
исходные&lt;br /&gt;
данные&lt;br /&gt;
только&lt;br /&gt;
из простых&lt;br /&gt;
растровых&lt;br /&gt;
файлов&lt;br /&gt;
(BMP).&lt;br /&gt;
&lt;br /&gt;
Прежде&lt;br /&gt;
чем приступать&lt;br /&gt;
к сборке,&lt;br /&gt;
необходимо&lt;br /&gt;
отредактировать&lt;br /&gt;
файл '''CMakeLists.txt''', расположенный&lt;br /&gt;
в корневой директории&lt;br /&gt;
исходных&lt;br /&gt;
текстов&lt;br /&gt;
''Сuneiform''. После&lt;br /&gt;
строки&lt;br /&gt;
&lt;br /&gt;
  cmake_minimum_required(VERSION 2.6.0)&lt;br /&gt;
&lt;br /&gt;
добавьте&lt;br /&gt;
&lt;br /&gt;
  set(PROJECT_BINARY_DIR builddir)&lt;br /&gt;
&lt;br /&gt;
где '''builddir''' – путь к директории,&lt;br /&gt;
в которой&lt;br /&gt;
следует&lt;br /&gt;
собирать&lt;br /&gt;
двоичные&lt;br /&gt;
файлы&lt;br /&gt;
программы&lt;br /&gt;
(если&lt;br /&gt;
она еще не существует,&lt;br /&gt;
то будет&lt;br /&gt;
создана&lt;br /&gt;
в процессе).&lt;br /&gt;
Теперь&lt;br /&gt;
в этом же каталоге&lt;br /&gt;
скомандуйте&lt;br /&gt;
&lt;br /&gt;
  cmake ./&lt;br /&gt;
&lt;br /&gt;
Если&lt;br /&gt;
все прошло&lt;br /&gt;
успешно,&lt;br /&gt;
можно&lt;br /&gt;
собирать&lt;br /&gt;
саму&lt;br /&gt;
программу:&lt;br /&gt;
&lt;br /&gt;
 sudo make install&lt;br /&gt;
&lt;br /&gt;
''Cuneiform'' для Linux – консольное&lt;br /&gt;
приложение.&lt;br /&gt;
Работать&lt;br /&gt;
с ним&lt;br /&gt;
просто.&lt;br /&gt;
В общем&lt;br /&gt;
виде,&lt;br /&gt;
строка&lt;br /&gt;
вызова&lt;br /&gt;
программы&lt;br /&gt;
выглядит&lt;br /&gt;
так:&lt;br /&gt;
&lt;br /&gt;
 cuneiform -l &amp;lt;language&amp;gt; -o &amp;lt;output_file&amp;gt; [-f &amp;lt;output_format&amp;gt;] &amp;lt;input_file&amp;gt;&lt;br /&gt;
&lt;br /&gt;
где '''&amp;lt;language&amp;gt;''' – язык распознавания,&lt;br /&gt;
например:&lt;br /&gt;
&lt;br /&gt;
 '''rus''' – русский,&lt;br /&gt;
 '''eng''' – английский,&lt;br /&gt;
 '''fra''' – французский,&lt;br /&gt;
 '''ruseng''' – русско-английский.&lt;br /&gt;
&lt;br /&gt;
В моей многоязычной ветке&lt;br /&gt;
''Cuneiform'' можно&lt;br /&gt;
также&lt;br /&gt;
указывать&lt;br /&gt;
языки&lt;br /&gt;
вида&lt;br /&gt;
'''rus_xxx''', где '''xxx''' – обозначение&lt;br /&gt;
второго&lt;br /&gt;
языка&lt;br /&gt;
документа&lt;br /&gt;
(первый&lt;br /&gt;
при этом – русский). Например,&lt;br /&gt;
для распознавания&lt;br /&gt;
текстов,&lt;br /&gt;
содержащих&lt;br /&gt;
русский и французский&lt;br /&gt;
языки,&lt;br /&gt;
надо&lt;br /&gt;
набрать&lt;br /&gt;
'''rus_fra'''. Ключ '''-o''' позволяет&lt;br /&gt;
указать&lt;br /&gt;
имя файла,&lt;br /&gt;
в котором&lt;br /&gt;
будут&lt;br /&gt;
сохранены&lt;br /&gt;
результаты&lt;br /&gt;
распознавания.&lt;br /&gt;
По умолчанию&lt;br /&gt;
данные&lt;br /&gt;
сохраняются&lt;br /&gt;
в простом&lt;br /&gt;
текстовом&lt;br /&gt;
формате&lt;br /&gt;
в кодировке&lt;br /&gt;
UTF-8, но с помощью&lt;br /&gt;
ключа&lt;br /&gt;
'''-f''' можно&lt;br /&gt;
выбрать&lt;br /&gt;
что-то другое,&lt;br /&gt;
например,&lt;br /&gt;
'''HTML, RTF''' или «родной» формат&lt;br /&gt;
''Cuneiform''. Значения&lt;br /&gt;
опции&lt;br /&gt;
'''-f''' для них выглядят&lt;br /&gt;
как '''-f html, -f rtf, -f cf''', соответственно.&lt;br /&gt;
Наконец,&lt;br /&gt;
'''&amp;lt;input_file&amp;gt;''' – имя графического файла,&lt;br /&gt;
из которого&lt;br /&gt;
программа&lt;br /&gt;
читает&lt;br /&gt;
исходные&lt;br /&gt;
данные.&lt;br /&gt;
&lt;br /&gt;
''Cuneiform'' не справляется&lt;br /&gt;
с распознаванием&lt;br /&gt;
таблиц,&lt;br /&gt;
зато&lt;br /&gt;
понимает&lt;br /&gt;
текст, разбитый&lt;br /&gt;
на несколько&lt;br /&gt;
колонок&lt;br /&gt;
(их расположение&lt;br /&gt;
в результирующем&lt;br /&gt;
тексте&lt;br /&gt;
не сохраняется,&lt;br /&gt;
вместо&lt;br /&gt;
этого&lt;br /&gt;
они размещаются&lt;br /&gt;
как абзацы&lt;br /&gt;
– одна&lt;br /&gt;
под другой).&lt;br /&gt;
Впрочем,&lt;br /&gt;
и тут не обошлось&lt;br /&gt;
без затруднений.&lt;br /&gt;
Нередко&lt;br /&gt;
бывает&lt;br /&gt;
так, что программа&lt;br /&gt;
воспринимает&lt;br /&gt;
пробелы,&lt;br /&gt;
расположенные&lt;br /&gt;
друг под другом&lt;br /&gt;
в нескольких&lt;br /&gt;
строках&lt;br /&gt;
подряд,&lt;br /&gt;
как разделитель&lt;br /&gt;
между&lt;br /&gt;
двумя столбцами. В результате ''Сuneiform'' находит колонки там, где их нет, что приводит к непредсказуемому изменению компоновки распознанного текста. Видимо, именно для таких случаев разработчики программы предусмотрели специальную опцию, позволяющую отключить поиск столбцов в распознаваемом тексте, однако в главной ветке ''Cuneiform'' для Linux эта функция почему-то заблокирована. Я разблокировал ее в своем варианте, и теперь вы можете подавить поиск столбцов в тексте с помощью ключа '''-c1'''. ''Cuneiform'' умеет распознавать и отдельно сохранять изображения, однако текст с обилием картинок распознается несколько хуже, чем просто текст. Буквицы также воспринимаются как картинки, и их наличие отрицательно сказывается на результате.&lt;br /&gt;
&lt;br /&gt;
====Проверка боем====&lt;br /&gt;
&lt;br /&gt;
Для тестирования качества распознавания было выбрано пять текстов: два на русском языке, один – на смешанном русско-английском и два – на английском. Все они были отсканированы на сканере Mustek 2448 TA Pro в цветном режиме с разрешением 300 точек на дюйм. Разумеется, всесторонняя оценка качества распознавания требует тестирования с использованием множества различных шрифтов, компоновок текста и параметров сканирования. Приводимые ниже данные позволяют получить лишь самое общее представление о качестве распознавания ''Cuneiform'' для Linux. Тем не менее, поскольку мне приходится постоянно тестировать программу в процессе разработки собственной ветви, я возьму на себя смелость утверждать, что представленные данные отражают общую картину.&lt;br /&gt;
&lt;br /&gt;
По результатам тестирования (см. ниже) можно отметить следующие любопытные факты. Точность распознавания русского языка колеблется в пределах 96–97% и практически не зависит от цвета фона и размера шрифта (видимо, ''Cuneiform'' умеет хорошо нормализовать соответствующие искажения). Наклон строк тоже мало влияет на качество распознавания. Неплохо компенсируются искажения, возникающие при сканировании многостраничных документов в районе линии сшивки страниц. Странно, что качество распознавания английского текста оказалось существенно выше, чем качество распознавания русского. Стоит также отметить, что программа на удивление хорошо справляется с распознаванием слов, которые, скорее всего, отсутствуют во встроенном словаре (редкие имена собственные и географические названия, а также «программистские» конструкции типа AddItem). Возможно, встречая такое незнакомое слово, программа переходит в режим более тщательного «просмотра».&lt;br /&gt;
&lt;br /&gt;
А вот с распознаванием чисел, встречающихся в тексте, ''Сuneiform'' справляется не очень хорошо. Еще одно чисто визуальное наблюдение: большие фрагменты текста программа распознает лучше, чем маленькие, при этом в начале текста концентрация ошибок выше, чем в конце. Это заставляет предположить, что ядро ''Сuneiform'' подстраивается под параметры конкретного текста по ходу распознавания. Непонятно, однако, что мешает программе вернуться к начальному фрагменту текста и попробовать распознать его еще раз, учитывая накопленную статистику (не исключено, что такая возможность в ядре ''Сuneiform'' действительно существует, просто разработчики Linux-версии еще не задействовали ее).&lt;br /&gt;
&lt;br /&gt;
{{Врезка|Содержание=[[Изображение:LXF118_38_1.jpg|300px]] Распознанный текст с картинкой в формате HTML: некоторое сходство с оригиналом присутствует |Ширина=300px}}&lt;br /&gt;
&lt;br /&gt;
Главное разочарование – программа оказалась бессильна распознать текст на изображении, где белая страница была окружена обширными темными полями (такое часто бывает при сканировании, если размер страницы меньше размера рабочего поля сканера). Именно поэтому в таблице и нет результатов для одного из тестовых текстов. Разумеется, черные поля можно удалить в графическом редакторе, но на это расходуется время, которое можно было бы потратить на более полезные вещи.&lt;br /&gt;
&lt;br /&gt;
При использовании «богатых» форматов вывода, таких как HTML и RTF, ''Cuneiform'' старается сохранить элементы форматирования исходного текста (заголовки, выделения слов полужирным шрифтом и курсивом), а также добавить в результирующий текст обнаруженные в оригинале картинки.&lt;br /&gt;
&lt;br /&gt;
====Мои пять копеек====&lt;br /&gt;
&lt;br /&gt;
Стандартная&lt;br /&gt;
версия&lt;br /&gt;
''Cuneiform'' для Linux может&lt;br /&gt;
распознавать&lt;br /&gt;
тексты&lt;br /&gt;
на русском, английском,&lt;br /&gt;
немецком,&lt;br /&gt;
французском,&lt;br /&gt;
испанском,&lt;br /&gt;
итальянском,&lt;br /&gt;
украинском,&lt;br /&gt;
сербском,&lt;br /&gt;
хорватском,&lt;br /&gt;
болгарском,&lt;br /&gt;
чешском,&lt;br /&gt;
словенском,&lt;br /&gt;
польском,&lt;br /&gt;
датском,&lt;br /&gt;
португальском,&lt;br /&gt;
голландском,&lt;br /&gt;
румынском,&lt;br /&gt;
венгерском,&lt;br /&gt;
латвийском,&lt;br /&gt;
литовском,&lt;br /&gt;
эстонском&lt;br /&gt;
и турецком&lt;br /&gt;
языках.&lt;br /&gt;
По&lt;br /&gt;
умолчанию&lt;br /&gt;
русский язык может&lt;br /&gt;
распознаваться&lt;br /&gt;
только&lt;br /&gt;
совместно&lt;br /&gt;
с английским.&lt;br /&gt;
Я поставил&lt;br /&gt;
перед&lt;br /&gt;
собой&lt;br /&gt;
задачу&lt;br /&gt;
добавить&lt;br /&gt;
в ''Cuneiform''&lt;br /&gt;
поддержку&lt;br /&gt;
распознавания&lt;br /&gt;
текстов,&lt;br /&gt;
в которых&lt;br /&gt;
русский язык смешан&lt;br /&gt;
с другими,&lt;br /&gt;
поддерживаемыми&lt;br /&gt;
программой.&lt;br /&gt;
В ходе&lt;br /&gt;
работы&lt;br /&gt;
над своей&lt;br /&gt;
веткой&lt;br /&gt;
''Cuneiform'' я также&lt;br /&gt;
добавил&lt;br /&gt;
некоторые&lt;br /&gt;
возможности,&lt;br /&gt;
которые&lt;br /&gt;
упомянуты&lt;br /&gt;
по ходу&lt;br /&gt;
изложения.&lt;br /&gt;
Получить&lt;br /&gt;
новейшие&lt;br /&gt;
исходные&lt;br /&gt;
тексты&lt;br /&gt;
моей&lt;br /&gt;
ветви&lt;br /&gt;
можно&lt;br /&gt;
по ссылке:&lt;br /&gt;
https://code.launchpad.net/~anb-symmetrica/cuneiform-linux/cuneiform-multilang, а также&lt;br /&gt;
на моем сайте: http://symmetrica.net/cuneiformlinux.&lt;br /&gt;
&lt;br /&gt;
====Результаты тестирования ''Cuneiform 0.6.0''====&lt;br /&gt;
&lt;br /&gt;
{|class=wikitable border=1 cellpadding=5|-&lt;br /&gt;
! Вид текста* &lt;br /&gt;
! Общее число слов &lt;br /&gt;
! Количество ошибок&lt;br /&gt;
|-&lt;br /&gt;
| Простой русский текст (белый фон, одна колонка) &lt;br /&gt;
| 240 &lt;br /&gt;
| 9 (3,5%)&lt;br /&gt;
|-&lt;br /&gt;
| Русский текст, белый фон, 2 колонки, сильный наклон строк&lt;br /&gt;
| 526&lt;br /&gt;
| 16 (3%)&lt;br /&gt;
|-&lt;br /&gt;
| Русско-английский текст, темный фон, мелкий шрифт, 3 колонки&lt;br /&gt;
| 335 &lt;br /&gt;
| 13 (4%)&lt;br /&gt;
|-&lt;br /&gt;
| Английский текст, белый фон, две колонки &lt;br /&gt;
| 260 &lt;br /&gt;
| 3 (1%)&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;lt;nowiki&amp;gt;*&amp;lt;/nowiki&amp;gt;  По причинам, изложенным выше, один из тестовых документов был исключен из сравнительной таблицы.&lt;br /&gt;
&lt;br /&gt;
===Часть 2 ''Tesseract''===&lt;br /&gt;
&lt;br /&gt;
Разработка открытого варианта ''Tesseract'' пользуется поддержкой Google, что не могло не отразиться на внимании разработчиков к этому проекту самым благоприятным образом. Изначально ''Tesseract'' был предназначен исключительно для распознавания текстов на английском языке, однако благодаря общедоступным средствам обучения программы энтузиасты смогли добавить в нее поддержку других языков, основанных на латинице. Были предприняты попытки научить ''Tesseract'' распознаванию и русскоязычных текстов, однако пока что результаты более чем скромные. Отчасти это объясняется тем, что множество эвристик, справедливых только для латинского алфавита, были «зашиты» непосредственно в код программы, из которого их не так-то просто «вычистить». На этом примере мы в который раз убеждаемся в справедливости одного из основополагающих принципов разработки Unix, требующего везде, где только можно, разграничивать движок и интерфейс.&lt;br /&gt;
&lt;br /&gt;
Как и ''Cuneiform'' для Linux, ''Tesseract'' представляет собой консольное приложение, не способное взаимодействовать со сканером напрямую. В Википедии утверждается, что исходными данными для ''Tesseract'' должны быть изображения в TIFF, однако мой опыт показывает, что он понимает и другие форматы, в том числе BMP.&lt;br /&gt;
&lt;br /&gt;
Разработчики ''Tesseract'' заявляют, что их программа является, вероятно, лучшим открытым средством распознавания текста. Думаю, что сегодня мы можем скорректировать это утверждение. Даже при распознавании английского текста, для которого ''Tesseract'' изначально и создавался, приложение показало себя не лучше ''Cuneiform''. Единственное (хотя и важное) преимущество – ''Tesseract'' смог распознать страницу с черными полями по краям. А вот с разделением текста на два столбца (отсканированный книжный разворот) программа не справилась.&lt;br /&gt;
&lt;br /&gt;
При тестировании ''Tesseract'' обнаружился один артефакт: если в начале распознаваемого фрагмента встречается текст на языке, отличном от выбранного, программа сбивается, и качество дальнейшего распознавания оказывается низким. Для сравнения – ''Cuneiform'' более толерантен к текстам на непонятных языках, но встретившаяся в тексте таблица также нарушает процесс распознавания до конца страницы. В отличие от ''Cuneiform, Tesseract'' совершенно не справляется с картинками и формулами в тексте. Соответствующие области заполняются текстовым мусором и крайне негативно влияют на процесс распознавания в целом. Единственный формат вывода данных, поддерживаемый ''Tesseract'' – неформатированный текст.&lt;br /&gt;
&lt;br /&gt;
Почему же, несмотря на все перечисленные особенности, ''Tesseract'' значительно более известен в мире Linux, чем ''Cuneiform''? Причин, на мой взгляд, две, и обе они были упомянуты выше. В отличие от ''Cuneiform, Tesseract'' распространяется на условиях официальной открытой лицензии, что делает его более приемлемым в глазах «пуристов». Второе преимущество – наличие инструмента обучения программы новым языкам (русский пока в их число, к сожалению, не входит). Для упрощения тренировки ''Tesseract'' была даже создана специальная программа с красивым графическим интерфейсом. Основные параметры ''Tesseract'' и ''Cuneiform'' сведены в таблице ниже.&lt;br /&gt;
&lt;br /&gt;
По результатам сравнений ''Cuneiform'' несомненно лидирует, причем, и это приятно отметить, не только за счет поддержки важного для нас русского языка, но и за счет лучшего качества распознавания и вывода результатов. Объясняется это, помимо прочего, тем, что в свое время ''Cuneiform'' был хорошо продаваемым коммерческим продуктом. Будем надеяться, что разработчики открытого ПО не только успешно завершат процесс переноса ''Cuneiform'' на открытые платформы, но и продолжат дальнейшее развитие этой программы. '''LXF'''&lt;br /&gt;
&lt;br /&gt;
===Таблица функций===&lt;br /&gt;
&lt;br /&gt;
{|class=wikitable border=1 cellpadding=5|-&lt;br /&gt;
! &lt;br /&gt;
! ''Tesseract''&lt;br /&gt;
! ''Cuneiform''&lt;br /&gt;
|-&lt;br /&gt;
| Лицензия &lt;br /&gt;
| Apache License 2.0, GPL&lt;br /&gt;
| Своя&lt;br /&gt;
|-&lt;br /&gt;
| Распознавание европейских языков (расширенная латиница)&lt;br /&gt;
| V&lt;br /&gt;
| V&lt;br /&gt;
|-&lt;br /&gt;
| Распознавание русского языка&lt;br /&gt;
| X&lt;br /&gt;
| V&lt;br /&gt;
|-&lt;br /&gt;
| Инструменты обучения&lt;br /&gt;
| V&lt;br /&gt;
| X&lt;br /&gt;
|-&lt;br /&gt;
| Качество распознавания&lt;br /&gt;
| Хуже&lt;br /&gt;
| Лучше&lt;br /&gt;
|-&lt;br /&gt;
| Формат вывода результатов &lt;br /&gt;
| Только текст&lt;br /&gt;
| Текст или форматированный вывод&lt;br /&gt;
|}&lt;/div&gt;</description>
			<pubDate>Mon, 24 May 2010 08:08:46 GMT</pubDate>			<dc:creator>Crazy Rebel</dc:creator>			<comments>http://wiki2.linuxformat.ru/index.php/%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:LXF118:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80_%D1%81%D0%BB%D1%83%D1%88%D0%B0%D0%B5%D1%82</comments>		</item>
	</channel>
</rss>